杂记——写时拷贝技术
写时拷贝技术
在linux中,fork()产生一个父进程相似的子进程,但是一般情况下,子进程在此之后会调用exec函数族。如果这个时候把各个段都拷贝到子进程,就会造成很大的效率浪费。
这是不用写时拷贝的图解
可以看到,内核将父进程的信息复制到子进程并为子进程开辟了物理空间
所以linux引入了写时拷贝技术,也就是当各个段的内容要发生变化时,才会将父进程的内容复制一份给子进程。当然,不变化则父子进程共享资源。
再来看一下写时拷贝技术
明显省略了开辟物理空间的花销
子进程如何执行exec系统调用
我们刚刚提到的写时拷贝会导致子进程的物理空间没有代码,那么子进程如何去取指令执行exec系统调用?
在fork之后exec之前两个进程用的是相同的物理空间(内存区),子进程的代码段、数据段、堆栈都是指向父进程的物理空间,也就是说,两者的虚拟空间不同,但其对应的物理空间是同一个。
当父子进程中有更改相应段的行为发生时,再为子进程相应的段分配物理空间,如果不是因为exec,内核会给子进程的数据段、堆栈段分配相应的物理空间(至此两者有各自的进程空间,互不影响),而代码段继续共享父进程的物理空间(两者的代码完全相同)。而如果是因为exec,由于两者执行的代码不同,子进程的代码段也会分配单独的物理空间。
这里还看到一个细节问题:
fork之后内核往往会把子进程的执行顺序放在队列前面,让子进程先执行,以免父进程执行导致写时复制影响效率。
参考文献
[1] as_.linux写时拷贝技术.博客园.2012.07.20