0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

.NET8为什么要引入Non-GC Heap这种机制呢?

OSC开源社区 来源:江湖评谈 2023-11-28 10:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前言

.NET8里面JIT引入了一个新的机制,叫做Non-GC Heap。JIT可以确保相关对象分配在Non-GC Heap上,该堆像其名称一样,不受GC管理。JIT需要保证这个对象没有被GC引用,并且在这个对象的生命周期内一直是根对象(不会被GC消灭的对象)的状态。

概述

为什么要引入这种机制?先来看一段代码:

public static string GetPrefix() => "https://";
static void Main(string[] args)
{
  GetPrefix ();
}

这里的GetPrefix函数返回的是一个常量字符串值,它的ASM如下:

mov  rax,185CAC02068h
mov  rax,qword ptr [rax]

两个mov指令,第一个是对象指针的指针,第二个是对象的指针。虽然是简单的两个指令,但是背后的逻辑却较为复杂,基本如下:
一个字符串常量值,.NET7里面JIT也会给这个字符串常量值复制到一个堆分配到字符串对象中,返回的是对象的二级指针。因为是堆对象,可能会被GC移动,每次都需要获取新的地址,频繁增加负担。

这里的问题在哪儿呢?一个字符串常量值需要这么多的步骤操作吗?开销是否太大,我们是否可以简化它呢?有一个常规的很容易想到的方法,就是把这个字符串常量值的地址给它固定起来,每次需要用到这个常量值,就直接去这个固定地址读取,这样行不行呢?GC堆很明显不能硬编码固定。

当然可以,做法就是把这个字符串常量值放到POH(固定对象堆)上,不让GC移动。这样是减少了GC回收的时候移动的开销,但是并没有从根本上解决问题,因为固定对象同样受到GC的管控,上面的步骤除了不能移动一样不少,并且POH不会进行根对象的处理,可能会导致它们被回收,地址指向了其它的数据,进而错误。

特点

要彻底的解决这个问题,本篇的主角:Non-GC Heap出场了。它有三个特点:

1.JIT要保证这个对象没有被GC引用

2.这个对象在生命周期内一直是根对象

3.它不能是可卸载上下文的一部分

你可以认为GC堆包括:小对象堆(SOH-小于85000字节的对象),大对象堆(LOH-大于85000字节的对象),固定对象堆(POH)

而No-GC Heap超脱于GC Heap之外的FOH(冻结堆)。

JIT现在可以避免在生成的代码中访问该对象时的间接寻址,而是直接硬编码对象的地址

GetPrefix函数的ASM在.NET8 Non-GC Heap里面如下:

mov  rax,26180000218h
C3   ret

26180000218h为对象地址,一个mov直接返回。看似只简化了一个mov,但是实际上它这种硬编码固定模式地址,简化的是整个字符串常量值的原理,也就是把字符串常量值分配到FOH里面,而不是GC堆里。性能极大的提升自不必多说。以下测量13倍的性能提升。

Method Job Mean Ratio
GetPrefix .NET 7 1.3450 ns
GetPrefix.NET80.0729ns

其它Non-GC Heap的操作

:使用typeof(T)生成的RuntimeType对象

public Type GetTestsType() => typeof(Tests);

二:空数组分配到Non-GC Heap上,使Array.Empty()更加高效

public string[] Test() => Array.Empty();

它俩在.NET8里面都类似于如下ASM,一个mov直接返回:

mov rax,1A0814EAEA8
ret

三:静态值类型字段关联的堆对象,不包含任何GC引用的字段

public partial class Tests
{
    private static readonly ConfigurationData s_config = ConfigurationData.ReadData();
    public TimeSpan GetRefreshInterval() => s_config.RefreshInterval;
    private struct ConfigurationData
    {
        public static ConfigurationData ReadData() => new ConfigurationData
        {
            Index = 0x12345,
            Id = Guid.NewGuid(),
            IsEnabled = true,
            RefreshInterval = TimeSpan.FromSeconds(100)
        };
        public int Index;
        public Guid Id;
        public bool IsEnabled;
        public TimeSpan RefreshInterval;
    }
}

RefreshInterval .NET7如下:

mov       rax,13D84001F78
mov       rax,[rax]
mov       rax,[rax+20]
ret

RefreshInterval .NET8如下:

mov       rax,20D9853AE48
mov       rax,[rax]
ret

四:代之间的GC引用判断

代码:

public class Tests
{
    public void Write()
    {
        string dst = "old";
        Write(ref dst, "new");
    }


    [MethodImpl(MethodImplOptions.NoInlining)]
    private static void Write(ref string dst, string s) => dst = s;
}

Write在.NET7和.NET8上生成如下:

callCORINFO_HELP_CHECKED_ASSIGN_REF
nop
ret

CORINFO_HELP_CHECKED_ASSIGN_REF是一个JIT帮助程序函数,其中包含所谓的“GC write barrier (GC写屏障)”,一个小代码片段,用于让GC跟踪正在写入的引用,因为它可能需要知道,例如,因为正在分配的对象可能是gen0,而目标可能是gen2。

微调下这个代码:

public class Tests
{
    public void Write()
    {
        string dst = "old";
        Write(ref dst);
    }


    [MethodImpl(MethodImplOptions.NoInlining)]
    private static void Write(ref string dst) => dst = "new";
}

实现的功能都是一样的,只不过dst直接赋值了常量字符串,记得上面常量字符串的分配是在Non-GC Heap吗?.NET7里面还是需要帮助函数:

mov       rdx,1FF0E4014A0
movrdx,[rdx]
callCORINFO_HELP_CHECKED_ASSIGN_REF
nop
ret

然.NET8里面则是

mov       rax,1B3814EAEC8
mov       [rcx],rax
ret

因为.NET8意识到常量字符串是在Non-GC Heap,不需要GC跟踪判断在那个代码,类似于card_table那种。所以优化掉了CORINFO_HELP_CHECKED_ASSIGN_REF






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • MOV
    MOV
    +关注

    关注

    0

    文章

    69

    浏览量

    14447
  • ASM
    ASM
    +关注

    关注

    1

    文章

    69

    浏览量

    19985
  • 字符串
    +关注

    关注

    1

    文章

    596

    浏览量

    23258
  • SOH
    SOH
    +关注

    关注

    0

    文章

    19

    浏览量

    3946

原文标题:.NET8极致性能优化Non-GC Heap

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    LabVIEW .net调用GC

    LabVIEW.net调用GC静态类
    发表于 06-08 15:11

    shell原理和问答机制引入推荐

    1.16.ARM裸机第十六部分-shell原理和问答机制引入 互联网课程品牌...
    发表于 12-23 06:12

    为何ARMv8-a架构引入EL3

    ARMv8-a架构是由哪些部分组成的?为何ARMv8-a架构引入EL3
    发表于 03-02 09:12

    RT_USING_HEAP该怎样去理解

    heap management function,换句话说,RTT提供了heap的dynamic管理机制。同时在thread 退出时放置到defunct的list,然后再切出current
    发表于 04-06 18:17

    Oracle数据库网络安全访问机制

    本文主要分析了Oracle 客户端通过Net8 访问数据库服务器过程,阐述了Oracle 数据库的网络访问机制以及Net8 在实现Oracle 数据库的服务器和客户端之间安全的数据通信中的重要作用。
    发表于 08-29 10:20 20次下载

    GC6113_GC6103调试指南

    GC6113&GC6103调试指南 ,常用功能机8万摄像头
    发表于 01-22 14:13 0次下载

    PCIe总线的通信机制

    那么为什么分为Non-Posted和Posted两种类型?对于Memory Writes来说,对效率要求较高,因此采用了Posted的方式。但是这并不意味着Posted类型的操作不需要Completer进行应答,只是此时Co
    的头像 发表于 04-24 09:41 1.3w次阅读
    PCIe总线的通信<b class='flag-5'>机制</b>

    深度解析Asp.Net2.0中的Callback机制

    深度解析Asp.Net2.0中的Callback机制(ups电源技术维修)-该文档为深度解析Asp.Net2.0中的Callback机制讲解文档,是一份还算不错的参考文档,感兴趣的可以
    发表于 09-27 16:28 1次下载
    深度解析Asp.<b class='flag-5'>Net</b>2.0中的Callback<b class='flag-5'>机制</b>

    heap_1内存分配方法

    heap_1 内存分配方法 动 态 内 存 分 配 需 一 个 内 存 堆 , FreeRTOS 中 的 内 存 堆 为 ucHeap[] , 大 小 为
    的头像 发表于 07-30 10:33 1554次阅读

    FreeRTOS heap_3内存分配方法

    提供一个内存堆,编译器库提供 malloc()和 free()函数。比如使用 STM32 的话可以通过修改启动文件中的 Heap_Size 来修改内存堆的大小,如图所示。 2、具有不确定性 3、可能会增加代码量。 注意,在 heap
    的头像 发表于 07-30 10:40 1584次阅读
    FreeRTOS <b class='flag-5'>heap</b>_3内存分配方法

    如何解决引入注册机制问题

    耦合状态,失去了一个.c 一个 .h的意义。 如何解决这种问题     引入注册机制。为了方便说明注册机制,举一个例子:手机在使用相机这个功能时,有一个操作:将拍摄的照片发送出去。以程
    的头像 发表于 08-16 09:17 1518次阅读

    .NET8为原生AOT改进 Linux上原生AOT应用程序大小最多减少50%

    .NET 7 首次引入了以原生 AOT (Native AOT) 发布应用程序的选项。基于此特性,开发者使用原生 AOT 发布应用程序可以创建一个完全独立 (self-contained) 的版本
    的头像 发表于 11-14 11:53 2467次阅读
    .<b class='flag-5'>NET8</b>为原生AOT改进 Linux上原生AOT应用程序大小最多减少50%

    zookeeper引入什么机制

    Zookeeper是一个开源的分布式协调服务,被广泛应用于构建分布式系统和大规模集群的管理。作为一个分布式协调服务,Zookeeper引入了一系列机制来提供可靠的协调和一致性服务。在这篇文章中,我们
    的头像 发表于 12-03 16:38 1545次阅读

    .NET8极致性能优化AOT

    .NET8对于性能的优化是方方面面的,所以AOT预编译机器码也是不例外的。本篇来看下对于AOT的优化。
    的头像 发表于 12-06 10:16 1788次阅读

    OPCUA产品情报:.NET SDK最新版本公布,系列产品稳步更新中!

    近期,Unified Automation公司推出了.NET based OPC UA SDK v4.0.0这一产品。该版本除了例行的Bug修复外,还进行了部分函数API的修改与功能的扩展,新添了对使用MQTT/JSON传输的PubSub模块和.NET8的支持。
    的头像 发表于 03-14 10:00 2149次阅读
    OPCUA产品情报:.<b class='flag-5'>NET</b> SDK最新版本公布,系列产品稳步更新中!