传统的fork()系统调用直接把所有的资源复制给新创建的进程。这种实现过于简单并且效率低下,因为它拷贝的数据或许可以共享(This
approach is significantly naïve and inefficient in that it copies much
data that might otherwise be
shared.)。更糟糕的是,如果新进程打算立即执行一个新的映像,那么所有的拷贝都将前功尽弃。 Linux的fork()使用写时拷贝
(copy-
on-write)页实现。写时拷贝是一种可以推迟甚至避免拷贝数据的技术。内核此时并不复制整个进程的地址空间,而是让父子进程共享同一个地址空间。只
用在需要写入的时候才会复制地址空间,从而使各个进行拥有各自的地址空间。也就是说,资源的复制是在需要写入的时候才会进行,在此之前,只有以只读方式共
享。这种技术使地址空间上的页的拷贝被推迟到实际发生写入的时候。在页根本不会被写入的情况下---例如,fork()后立即执行exec(),地址空间
就无需被复制了。fork()的实际开销就是复制父进程的页表以及给子进程创建一个进程描述符。下列程序可证明写时拷贝: #include #include
int data = 10;
int child_process() { printf("Child process %d, data %d\n",getpid(),data); data = 20; printf("Child process %d, data %d\n",getpid(),data); while(1); }
int main(int argc, char* argv[]) { if(fork()==0) { child_process(); } else{ sleep(1); printf("Parent process %d, data %d\n",getpid(), data); while(1); } } 运行结果 Child process 6427, data 10 Child process 6427, data 20 Parent process 6426, data 10 第
1个Child process 6427, data
10是因为子进程创建时task_struct的mm直接拷贝自parent的mm;第2个Child process 6427, data
20是因为子进程进行了“写时拷贝”,有了自己的dataa;第3个Parent process 6426, data
10输出10是因为子进程的data和父进程的data不是同一份。 如果把上述程序改为: #include #include #include
int data = 10;
int child_process() { printf("Child process %d, data %d\n",getpid(),data); data = 20; printf("Child process %d, data %d\n",getpid(),data); while(1); }
int main(int argc, char* argv[]) { void **child_stack; child_stack = (void **) malloc(16384); clone(child_process, child_stack, CLONE_VM|CLONE_FILES|CLONE_SIGHAND, NULL);
sleep(1); printf("Parent process %d, data %d\n",getpid(), data); while(1); } 运行结果将是 Child process 6443, data 10 Child process 6443, data 20 Parent process 6442, data 20 由于使用了CLONE_VM创建进程,子进程的mm实际直接指向父进程的mm,所以data是同一份。改变父子进程的data都会互相看到。
|