do_fork 函数源代码浅析-thewayma-ChinaUnix博客

thewayma

首页　| 　博文目录　| 　关于我

thewayma

博客访问： 733937
博文数量： 183
博客积分： 2650
博客等级：少校
技术积分： 1428
用户组：普通用户
注册时间： 2008-11-22 17:02

文章分类

全部博文（183）

QEMU（9）
Xen（0）
虚拟化（5）
KVM（32）
系统优化（2）
嵌入式（5）
GPU架构（2）
硬件（4）
I2C总线（2）
构建嵌入式文件系（0）
MIPS架构研究（8）
Linux内核线程（2）
Linux 基础编程（2）
PCI总线（5）
Linux性能（3）
nsfocus产品（0）
Linux TCP/IP协议（6）
Linux内核初始化（5）
Linux文件系统（15）
Linux内核攻击（0）
内核同步（4）
Linux IPC（1）
Linux进程管理（2）
网络攻击（5）

IP分片攻击（3）
Linux rootkit（3）
Linux中断（1）
Linux设备驱动（19）

块设备（14）
Linux 内核重要算（7）

I/O调度分析（2）
GUN C（3）
算法设计（2）
Linux内存管理（24）
未分配的博文（5）

文章存档

2017年（1）

2015年（46）

2014年（4）

2013年（8）

2012年（2）

2011年（27）

2010年（35）

2009年（60）

我的朋友

相关博文

do_fork 函数源代码浅析

分类： LINUX

2010-07-17 17:56:50

在 Linux 内核中,供用户创建进程的系统调用fork()函数的响应函数是 sys_fork()、sys_clone()、sys_vfork()。这三个函数都是通过调用内核函数 do_fork() 来实现的。根据

调用时所使用的 clone_flags 参数不同，do_fork() 函数完成的工作也各异。

这部分内容简单，我不打算就此而展开分析。下面我们重点来讲解以下 do_fork() 函数的工作原理。

我们知道 do_fork() 函数生成一个新的进程，大致分为三个步骤。

1、建立进程控制结构并赋初值，使其成为进程映像。这个过程完成以下内容。

内存

数据

设置

2、必须为新进程的执行设置跟踪进程执行情况的相关内核数据结构。包括任务数组、自由时间列表 tarray_freelist 以及 pidhash[] 数组。
这部分完成如下内容：

3、启动调度程序，使子进程获得运行的机会。
这部分完成以下动作：

下面就具体的 do_fork() 函数程序代码进行分析（该代码位于 kernel/fork.c 文件中）

int do_fork(unsigned long clone_flags,unsigned long stack_start, struct pt_regs *regs,
            unsigned long stack_size)
{
      int                retval;
      struct  task_struct *p;
      struct  completion vfork;

      retval = -EPERM ;

      if ( clone_flags & CLONE_PID )
      {
            if ( current->pid )
                  goto fork_out;
      }

      reval = -ENOMEM ;

      p = alloc_task_struct(); // 分配内存建立新进程的 task_struct 结构
      if ( !p )
            goto fork_out;

      *p = *current ;  //将当前进程的 task_struct 结构的内容复制给新进程的 PCB结构

      retval = -EAGAIN;

      //下面代码对父、子进程 task_struct 结构中不同值的数据成员进行赋值

      if ( atomic_read ( &p->user->processes ) >= p->rlim[RLIMIT_NPROC].rlim_cur
            && !capable( CAP_SYS_ADMIN ) && !capable( CAP_SYS_RESOURCE ))
            goto bad_fork_free;

      atomic_inc ( &p->user->__count); //count 计数器加 1
      atomic_inc ( &p->user->processes); //进程数加 1

      if ( nr_threads >= max_threads )
            goto bad_fork_cleanup_count ;

      get_exec_domain( p->exec_domain );

      if ( p->binfmt && p->binfmt->module )
               __MOD_INC_USE_COUNT( p->binfmt->module ); //可执行文件 binfmt 结构共享计数 + 1
      p->did_exec = 0 ;                                  //进程未执行
      p->swappable = 0 ;                               //进程不可换出
      p->state = TASK_UNINTERRUPTIBLE ;                //置进程状态
      copy_flags( clone_flags,p );                      //拷贝进程标志位
      p->pid = get_pid( clone_flags );                   //为新进程分配进程标志号
      p->run_list.next = NULL ;
      p->run_list.prev = NULL ;
      p->run_list.cptr = NULL ;

      init_waitqueue_head( &p->wait_childexit );       //初始化 wait_childexit 队列

      p->vfork_done  = NULL ;

      if ( clone_flags & CLONE_VFORK ) {
            p->vfork_done = &vfork ;
            init_completion(&vfork) ;
      }

      spin_lock_init( &p->alloc_lock );

      p->sigpending = 0 ;

      init_sigpending( &p->pending );
      p->it_real_value = p->it_virt_value = p->it_prof_value = 0 ; //初始化时间数据成员
      p->it_real_incr = p->it_virt_incr = p->it_prof_incr = 0 ; //初始化定时器结构
      init_timer( &p->real_timer );
      p->real_timer.data = (unsigned long)p;
      p->leader = 0 ;
      p->tty_old_pgrp = 0 ;
      p->times.tms_utime = p->times.tms_stime = 0 ;                //初始化进程的各种运行时间
      p->times.tms_cutime = p->times.tms_cstime = 0 ;
#ifdef CONFIG_SMP                //初始化对称处理器成员
{
      int    i;
      p->cpus_runnable = ~0UL;
      p->processor = current->processor ;
      for( i = 0 ; i < smp_num_cpus ; i++ )
               p->per_cpu_utime[ i ] = p->per_cpu_stime[ i ] = 0;
      spin_lock_init ( &p->sigmask_lock );
}

#endif
      p->lock_depth = -1 ;       // 注意：这里 -1 代表 no ,表示在上下文切换时，内核不上锁
      p->start_time = jiffies ; // 设置进程的起始时间

      INIT_LIST_HEAD ( &p->local_pages );
      retval = -ENOMEM ;

      if ( copy_files ( clone_flags , p ))    //拷贝父进程的 files 指针，共享父进程已打开的文件
            goto bad_fork_cleanup ;

      if ( copy_fs ( clone_flags , p ))       //拷贝父进程的 fs 指针，共享父进程文件系统
            goto bad_fork_cleanup_files ;

      if ( copy_sighand ( clone_flags , p )) //子进程共享父进程的信号处理函数指针
            goto bad_fork_cleanup_fs ;

      if ( copy_mm ( clone_flags , p ))
            goto bad_fork_cleanup_mm ;       //拷贝父进程的 mm 信息，共享存储管理信息

      retval = copy_thread( 0 , clone_flags , stack_start, stack_size , p regs );
                                                //初始化 TSS、LDT以及GDT项

      if ( retval )
            goto bad_fork_cleanup_mm ;

      p->semundo = NULL ;                      //初始化信号量成员

      p->prent_exec_id = p-self_exec_id ;

      p->swappable = 1 ;                      //进程占用的内存页面可换出

      p->exit_signal = clone_flag & CSIGNAL ;

      p->pdeatch_signal = 0 ;                //注意：这里是父进程消亡后发送的信号

      p->counter = (current->counter + 1) >> 1 ;//进程动态优先级，这里设置成父进程的一半,应注意的是，这里是采用位操作来实现的。

      current->counter >> =1;

      if ( !current->counter )
            current->need_resched = 1 ;       //置位重新调度标记，实际上从这个地方开始，分裂成了父子两个进程。

      retval = p->pid ;

      p->tpid = retval ;
      INIT_LIST_HEAD( &p->thread_group );

      write_lock_irq( &tasklist_lock );

      p->p_opptr = current->p_opptr ;
      p->p_pptr = current->p_pptr ;

      if ( !( clone_flags & (CLONE_PARENT | CLONE_THREAD ))) {
               p->opptr = current ;
               if ( !(p->ptrace & PT_PTRACED) )
                     p->p_pptr = current ;
      }

      if ( clone_flags & CLONE_THREAD ){
               p->tpid = current->tpid ;
               list_add ( &p->thread_group,¤t->thread_group );
      }

      SET_LINKS(p);

      hash_pid(p);
      nr_threads++;

      write_unlock_irq( &tasklist_lock );
      if ( p->ptrace & PT_PTRACED )
               send_sig( SIGSTOP , p ,1 );
      wake_up_process(p);       //把新进程加入运行队列，并启动调度程序重新调度，使新进程获得运行机会
      ++total_forks ;
      if ( clone_flags & CLONE_VFRK )
               wait_for_completion(&vfork);

      //以下是出错处理部分
      fork_out:
               return retval;
      bad_fork_cleanup_mm:
               exit_mm(p);
      bad_fork_cleanup_sighand:
               exit_sighand(p);
      bad_fork_cleanup_fs:
               exit_fs(p);
      bad_fork_cleanup_files:
               exit_files(p);

      bad_fork_cleanup:
               put_exec_domain( p->exec_domain );

               if ( p->binfmt && p->binfmt->module )
                              __MOD_DEC_USE_COUNT( p->binfmt->module );
      bad_fork_cleanup_count:
               atomic_dec( &p->user->processes );
               free_uid ( p->user );
      bad_fork_free:
               free_task_struct(p);
               goto fork_out;
}

PS:
代码是分析完了，有两个方面的体会：
一、这个函数重点是理解进程分裂的部分，其中两次返回 pid 的值是理解的重中之重。
二、尽管我一直不主张在程序中大量使用 goto 语句，不得不承认，那些大牛的 goto 语句用在此处是恰到好处啊。^_^

阅读(1479) | 评论(0) | 转发(0) |

上一篇：字符串查找算法BM算法（Boyer-Moore)算法

下一篇：volatile 和 sig_atomic_t

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6