CMS的initial mark标记了哪些对象
今天看到一个问题:CMS的initial mark阶段,到底处理标记哪些对象呢?泉子给出的建议是:cms gc initmark阶段主要是标记gc roots直接可达的对象 间接可达的通过其他阶段去标记。
我这边最近对源码比较感兴趣,就跟了下源码:
首先在,openjdk-jdk8u-jdk8u/hotspot/src/share/vm/gc_implementation/concurrentMarkSweep/concurrentMarkSweepGeneration.cpp这文件中,搜索initial mark,可以看到
initial mark的入口在VM_CMS_Initial_Mark.doit()方法中实现;
跟进去看到:_collector->do_CMS_operation(CMSCollector::CMS_op_checkpointRootsInitial, gch->gc_cause());这行代码
回到concurrentMarkSweepGeneration.cpp的6644行,这就找到了:checkpointRootsInitial(true),就是这个方法来实现具体的初始标记工作
跟进去看下,在当前文件的3641行,再继续往下跟进,会到3677行:checkpointRootsInitialWork这个方法,经过打日志、重置PLAB等工作后,真正的初始标记就可以开始了,假设是串行版本,会到下面的代码:
// The serial version.
CLDToOopClosure cld_closure(¬Older, true);
//为年轻代的引用遍历做准备
gch->rem_set()->prepare_for_younger_refs_iterate(false); // Not parallel.
//
gch->gen_process_roots(_cmsGen->level(),
true, // younger gens are roots
true, // activate StrongRootsScope
GenCollectedHeap::ScanningOption(roots_scanning_options()),
should_unload_classes(),
¬Older,
NULL,
&cld_closure);
跟着gen_process_roots下去后,可以看到gen_process_roots,用来处理直接从gc root直达的对象。
所以只要搞清楚gc root的定义就OK,就要参考R大在知乎的一个回答,因此在做cms gc时,gc root除了一般定义的那些节点外,还需要加上从年轻代到老年代的引用。