详解Golang的GC三色标记法
作者:wangxiaoangg
一 概念基础
1.1三色标记法将对象分为三类
把图过程中遇到的对象,按“是否访问过”这个条件标记成以下三种颜色:
白色对象(可能死亡):未被回收器访问到的对象。在回收开始阶段,所有对象均为白色,当回收结束后,白色对象均不可达。
灰色对象(波面):已被回收器访问到的对象,但回收器需要对其中的一个或多个指针进行扫描,因为他们可能还指向白色对象。
黑色对象(确定存活):已被回收器访问到的对象,其中所有字段都已被扫描,黑色对象中任何一个指针都不可能直接指向白色对象。
1.2 标记过程
- 起初所有的对象都是白色的;
- 从根对象出发扫描所有可达对象,标记为灰色,放入待处理队列;
- 从待处理队列中取出灰色对象,将其引用的对象标记为灰色并放入待处理队列中,自身标记为黑色;
- 重复步骤3,直到待处理队列为空,此时白色对象即为不可达的“垃圾”,回收白色对象;
- 回收所有的白色对象,也就是回收垃圾
根对象
在垃圾回收的术语中又叫做根集合,它是垃圾回收器在标记过程时最先检查的对象。
- 全局变量:程序在编译期就能确定的那些存在于程序整个生命周期的变量。
- 执行栈:每个 goroutine 都包含自己的执行栈,这些执行栈上包含栈上的变量及指向分配的堆内存区块的指针。
- 寄存器:寄存器的值可能表示一个指针,参与计算的这些指针可能指向某些赋值器分配的堆内存区块。
1.3 STW
STW(Stop The World)机制是指在进行垃圾回收时,会暂停应用程序的运行,以便进行垃圾回收操作。这意味着在进行垃圾回收时,应用程序将无法继续执行。
为什么需要STW
STW(Stop-The-World)机制来确保并发操作的正确性。
如果不设置STW机制,那么在进行GC时,应用程序线程可能会继续执行,从而导致内存管理的不一致性和错误。此外,GC可能会导致内存分配和释放的不连续,从而导致内存碎片化问题。
因此,需要STW机制来确保GC的正确性和内存管理的一致性。虽然STW机制会导致一定的性能损失,但是这是必要的代价,以确保应用程序的正确性和稳定性。
1.4 屏障机制
1.4.1强、弱三色不变式
强三色不变式:强制性的不允许黑色对象引用白色对象,只能引用灰色对象,这样就不会出现白色对象被误删的情况。
弱三色不等式 :
保护灰色对象到白色对象的路径不会断;
黑色对象可以引用白色对象,白色对象存在其他灰色对象对它的引用。
或可达它的链路上游存在灰色对象。这样实则是黑色对象引用白色对象,白色对象处于一个被删除的状态,但是上游灰色对象的引用,可以保护白色对象,使其安全。
为了遵循上述两种方式,GC算法演进到两种屏障方式,“插入屏障”和“删除屏障”。
1.4.2 插入屏障
在A对象引用B对象时,B对象被标记为灰色。(将B挂在A下游,B必须被标记为灰色)
满足强三色不等式。
插入屏障机制在栈空间的对象操作不使用,仅仅使用在堆空间对象的操作中。
1.4.3 删除屏障
被删除的对象,如果本身为灰色或白色,那么标记为灰色。
满足弱三色不等式。
1.4.4 混合屏障
插入写屏障和删除写屏障的缺点:
- 插入写屏障:结束时需要STW来重新扫描栈,标记栈上引用的白色对象存活
- 删除写屏障:回收精度低,GC开始时STW扫描堆栈来记录快照,这个过程会保护开始时刻的所有的存活对象。
Go1.8引入混合写屏障机制,避免了对栈的重复扫描过程,极大减少了STW的时间。
- GC开始将栈上的对象全部扫描并标记为黑色(之后不再进行第二次重复扫描,无需STW)
- GC期间,任何在栈上创建的新对象,都标记为黑色
- 被删除的对象标记为灰色
- 被添加的对象标记为灰色
二 GC过程
2.1 阶段1:Mark Setup 标记准备
为了打开写屏障,必须停止每个goroutine,让垃圾收集器观察并等待每个goroutine进行函数调用,等待函数调用是为了保证goroutine停止时处于安全点。(期间会STW)
2.2 阶段2:Marking 标记
一旦写屏障打开,垃圾收集器就开始标记阶段。
标记阶段需要标记在堆内存中仍然在使用中的值。首先检查所有现goroutine的堆栈,以找到堆内存的根指针。然后收集器必须从那些根指针遍历堆内存图,标记可以回收的内存。
当存在新的内存分配时,会暂停分配内存过快的那些 goroutine,并将其转去执行一些辅助标记(Mark Assist)的工作,从而达到放缓继续分配、辅助 GC 的标记工作的目的。
2.3阶段3:Mark Termination 标记结束
这个阶段会关闭掉阶段1开启的屏障,并计算下一次清理的目标和计划。(本阶段会STW)
2.4 阶段4:Sweeping 清理
清理阶段用于回收标记阶段中标记出来的可回收内存。当应用程序goroutine尝试在堆内存中分配新内存时,会触发该操作,清理导致的延迟和吞吐量降低被分散到每次内存分配时。
本阶段会并发执行,清除前面标记出来需清理的内存。
以上就是详解Golang的GC三色标记法的详细内容,更多关于Golang GC 三色标记法的资料请关注脚本之家其它相关文章!