Linux后台服务器编程。
分类: LINUX
2014-07-06 16:49:50
进程控制块(PCB)(系统为了管理进程设置的一个专门的数据结构,用它 来记录进程的外部特征,描述进程的运动变化过程。系统利用PCB来控制 和管理进程,所以PCB是系统感知进程存在的唯一标志。进程与PCB是一 一对应的)
在不同的中对进程的控制和管理机制不同,PCB中的信息多少也
不一样,通常PCB应包含如下一些信息。
1、进程name:
每个进程都必须有一个唯一的,可以是字符串,也可以是一个数
字。
2、进程当前状态 status:
说明进程当前所处的状态。为了管理的方便,系统设计时会将相
同的状态的进程组成一个,如就绪进程队列,等待进程则要根据等
待的事件组成多个,如等待打印机队列、等待磁盘I/O完成队列
等等。
3、进程相应的程序和数据地址,以便把PCB与其程序和数据联系起来。
4、进程资源清单。列出所拥有的除CPU外的,如拥有的I/O设备
,打开的文件列表等。
5、priority:
进程的优先级反映进程的紧迫程度,通常由用户指定和系统设置。
6、CPU现场cpustatus:
当进程因某种原因不能继续占用CPU时(如等待打印机),释放CPU
,这时就要将CPU的各种状态信息保护起来,为将来再次得到恢复
CPU的各种状态,继续运行。
7、与通信机制 用于实现进程间互斥、同步和通信所需的信号
量等。
8、进程所在队列PCB的链接字 根据进程所处的现行状态,进程相应
的PCB参加到不同队列中。PCB链接字指出该进程所在队列中下一个进程
PCB的首地址。
9、与进程有关的其他信息。 如进程记账信息,进程占用CPU的时间等。
在linux 中每一个进程都由task_struct 来定义. task_struct就是我们通常所说的PCB。
struct task_struct { long state; /*任务的运行状态(-1 不可运行,0 可运行(就绪),>0 已停止)*/ long counter;/*运行时间片计数器(递减)*/ long priority;/*优先级*/ long signal;/*信号*/ struct sigaction sigaction[32];/*信号执行属性结构,对应信号将要执行的操作和标志信息*/ long blocked; /* bitmap of masked signals */ /* various fields */ int exit_code;/*任务执行停止的退出码*/ unsigned long start_code,end_code,end_data,brk,start_stack;/*代码段地址 代码长度(字节数) 代码长度 + 数据长度(字节数)总长度 堆栈段地址*/ long pid,father,pgrp,session,leader;/*进程标识号(进程号) 父进程号 父进程组号 会话号 会话首领*/ unsigned short uid,euid,suid;/*用户标识号(用户id) 有效用户id 保存的用户id*/ unsigned short gid,egid,sgid; /*组标识号(组id) 有效组id 保存的组id*/ long alarm;/*报警定时值*/ long utime,stime,cutime,cstime,start_time;/*用户态运行时间 内核态运行时间 子进程用户态运行时间 子进程内核态运行时间 进程开始运行时刻*/ unsigned short used_math;/*标志:是否使用协处理器*/ /* file system info */ int tty; /* -1 if no tty, so it must be signed */ unsigned short umask;/*文件创建属性屏蔽位*/ struct m_inode * pwd;/*当前工作目录i 节点结构*/ struct m_inode * root;/*根目录i节点结构*/ struct m_inode * executable;/*执行文件i节点结构*/ unsigned long close_on_exec;/*执行时关闭文件句柄位图标志*/ struct file * filp[NR_OPEN];/*进程使用的文件表结构*/ /* ldt for this task 0 - zero 1 - cs 2 - ds&ss */ struct desc_struct ldt[3];/*本任务的局部描述符表。0-空,1-代码段cs,2-数据和堆栈段ds&ss*/ /* tss for this task */ struct tss_struct tss;/*本进程的任务状态段信息结构*/ };
1. 进程状态(State)
进程执行时,它会根据具体情况改变状态。进程状态是调度和的依据。Linux中的进程主要有如下状态,如表1.1所示。
表1.1 Linux进程的状态
内核表示 |
含义 |
TASK_RUNNING |
可运行 |
TASK_INTERRUPTIBLE |
可中断的等待状态 |
TASK_UNINTERRUPTIBLE |
不可中断的等待状态 |
TASK_ZOMBIE |
僵死 |
TASK_STOPPED |
暂停 |
TASK_SWAPPING |
换入/换出 |
·可运行状态
处于这种状态的进程,要么正在运行、要么正准备运行。正在运行的进程就是当前进程(由current所指向的进程),而准备运行的进程只要得到CPU就可以立即投入运行,CPU是这些进程唯一等待的。系统中有一个运行队列(run_queue),用来容纳所有处于可运行状态的进程,调度程序执行时,从中选择一个进程投入运行。在后面我们讨论的时候,可以看到运行队列的作用。当前运行进程一直处于该队列中,也就是说,current总是指向运行队列中的某个元素,只是具体指向谁由调度程序决定。
·等待状态
处于该状态的进程正在等待某个事件(event)或某个资源,它肯定位于系统中的某个(wait_queue)中。Linux中处于等待状态的进程分为两种:可中断的等待状态和不可中断的等待状态。处于可中断等待态的进程可以被信号唤醒,如果收到信号,该进程就从等待状态进入可运行状态,并且加入到运行队列中,等待被调度;而处于不可中断等待态的进程是因为硬件环境不能满足而等待,例如等待特定的,它任何情况下都不能被打断,只能用特定的方式来唤醒它,例如唤醒函数wake_up()等。
·暂停状态
此时的进程暂时停止运行来接受某种特殊处理。通常当进程接收到SIGSTOP、SIGTSTP、SIGTTIN或 SIGTTOU信号后就处于这种状态。例如,正接受调试的进程就处于这种状态。
·僵死状态
进程虽然已经终止,但由于某种原因,还没有执行wait(),终止进程的信息也还没有回收。顾名思义,处于该状态的进程就是死进程,这种进程实际上是系统中的垃圾,必须进行相应处理以释放其占用的资源。
2. 信息
调度程序利用这部分信息决定系统中哪个进程最应该运行,并结合进程的状态信息保证系统运转的公平和高效。这一部分信息通常包括进程的类别(普通进程还是实时进程)、进程的优先级等等。如表1.2所示:
表1.2 信息
域名 |
含义 |
need_resched |
调度标志 |
Nice |
静态优先级 |
Counter |
动态优先级 |
Policy |
调度策略 |
rt_priority |
实时优先级 |
在下一章的中我们会看到,当need_resched被设置时,在“下一次的调度机会”就调用调度程序schedule()。 counter代表进程剩余的时间片,是的主要依据,也可以说是进程的动态优先级,因为这个值在不断地减少;nice是进程的静态优先级,同时也代表进程的时间片,用于对counter赋值,可以用nice()系统调用改变这个值;policy是适用于该进程的调度策略,实时进程和普通进程的调度策略是不同的;rt_priority只对实时进程有意义,它是实时进程调度的依据。
进程的调度策略有三种,如表1.3所示。
表1.3 的策略
名称 |
解释 |
适用范围 |
SCHED_OTHER |
其他调度 |
普通进程 |
SCHED_FIFO |
先来先服务调度 |
实时进程 |
SCHED_RR |
时间片轮转调度 |
|
只有root用户能通过()系统调用来改变调度策略。
3 .(Identifiers)
每个进程有进程、、组标识符,如表1.4所示。
不管对还是普通用户来说,怎么用一种简单的方式识别不同的进程呢?这就引入了进程(PID:process identifier),每个进程都有一个唯一的标识符,内核通过这个标识符来识别不同的进程,同时,进程标识符PID也是内核提供给的接口,用户程序通过PID对进程发号施令。PID是32位的无符号整数,它被顺序编号:新创建进程的PID通常是前一个进程的PID加1。然而,为了与16位硬件平台的传统Linux系统保持兼容,在Linux上允许的最大PID号是32767,当在系统中创建第32768个进程时,就必须重新开始使用已闲置的PID号。
表1.4 各种
域名 |
含义 |
Pid |
进程标识符 |
Uid、gid |
用户标识符、组标识符 |
Euid、egid |
有效用户标识符、有效组标识符 |
Suid、sgid |
备份用户标识符、备份组标识符 |
Fsuid、fsgid |
文件系统用户标识符、文件系统组标识符 |
另外,每个进程都属于某个用户组。task_struct结构中定义有和组标识符。它们同样是简单的数字,这两种用于系统的安全控制。系统通过这两种控制进程对系统中文件和设备的访问,其它几个标识符将在文件系统中讨论。
4. 有关信息(IPC:Inter_Process Communication)
为了使进程能在同一项任务上协调工作,进程之间必须能进行通信即交流数据。
Linux支持多种不同形式的通信机制。它支持典型的Unix 通信机制(IPC Mechanisms):信号(Signals)、管道(Pipes),也支持System V 通信机制:(Shared Memory)、和(Message Queues),如表1.5。
表1.5 有关信息
域名 |
含义 |
Spinlock_t sigmask_lock |
信号掩码的自旋锁 |
Long blocked |
信号掩码 |
Struct signal *sig |
信号处理函数 |
Struct sem_undo *semundo |
为避免死锁而在信号量上设置的取消操作 |
Struct sem_queue *semsleeping |
与信号量操作相关的等待队列 |
这些域的具体含义将在一章进行讨论。
5. 进程链接信息(Links)
程序创建的进程具有父/子关系。因为一个进程能创建几个子进程,而子进程之间有兄弟关系,在task_struct结构中有几个域来表示这种关系。
在Linux系统中,除了初始化进程init,其他进程都有一个(parent process)或称为双亲进程。可以通过fork()或clone()系统调用来创建子进程,除了进程(PID)等必要的信息外,子进程的task_struct结构中的绝大部分的信息都是从中拷贝,或说“克隆”过来的。系统有必要记录这种“亲属”关系,使进程之间的协作更加方便,例如给子进程发送杀死(kill)信号、等,就可以用这种关系很方便地实现。
每个进程的task_struct结构有许多,通过这些指针,系统中所有进程的task_struct结构就构成了一棵,这棵进程树的根就是初始化进程init的task_struct结构(是建立起来后人为创建的一个进程,是所有进程的祖先进程)。表1.6是进程所有的链接信息。
表1.6 进程链接信息
名称 |
英文解释 |
中文解释 [指向哪个进程] |
p_opptr |
Original parent |
祖先 |
p_pptr |
Parent |
父进程 |
p_cptr |
Child |
子进程 |
p_ysptr |
Younger sibling |
弟进程 |
p_osptr |
Older sibling |
兄进程 |
Pidhash_next、 Pidhash_pprev |
|
进程在哈希表中的链接 |
Next_task、 prev_task |
|
进程在双向循环链表中的链接 |
Run_list |
|
运行队列的链表 |
6. 时间和信息(Times and Timers)
一个进程从创建到终止叫做该进程的生存期(lifetime)。进程在其生存期内使用CPU的时间,都要进行记录,以便进行统计、计费等有关操作。进程耗费CPU的时间由两部分组成:一是在用户模式(或称为用户态)下耗费的时间、一是在系统模式(或称为系统态)下耗费的时间。每个时钟滴答,也就是每个,都要更新当前进程耗费CPU的时间信息。
“时间”对是极其重要的。读者可能了解计算机时间的有关知识,例如8353/8254这些物理器件,INT 08、INT 1C等等,可能有过编程序时截获时钟中断的成就感,不管怎样,下一章我们将用较大的篇幅尽可能向读者解释清楚怎样建立完整的时间机制、并在这种机制的激励下进行调度等活动。
建立了“时间”的概念,“定时”就是轻而易举的了,无非是判断系统时间是否到达某个时刻,然后执行相关的操作而已。Linux提供了许多种定时方式,用户可以灵活使用这些方式来为自己的程序定时。
表1.7是和时间有关的域,上面所说的counter是指进程剩余的CPU时间片,也和时间有关,所以这里我们再次提及它。表1.8是进程的所有。
表1.7 与时间有关的域
域名 |
含义 |
Start_time |
进程创建时间 |
Per_cpu_utime |
进程在某个CPU上运行时在用户态下耗费的时间 |
Per_cpu_stime |
进程在某个CPU上运行时在系统态下耗费的时间 |
Counter |
进程剩余的时间片 |
表1.8 进程的所有定时器
定时器类型 |
解释 |
什么时候更新 |
用来表示此种定时器的域 |
ITIMER_REAL |
实时定时器 |
实时更新,即不论该进程是否运行 |
it_real_value |
it_real_incr |
|
|
|
real_timer |
|
|
|
ITIMER_VIRTUAL |
虚拟定时器 |
只在进程运行于用户态时更新 |
it_virt_value |
it_virt_incr |
|
|
|
ITIMER_PROF |
概况定时器 |
进程运行于用户态和系统态时更新 |
it_prof_value |
it_prof_incr |
|
|
|
进程有三种类型的:实时定时器、虚拟和概况定时器。这三种的特征共有三个:到期时间、定时间隔、要触发的事件。到期时间就是到什么时候完成定时操作,从而触发相应的事件;定时间隔就是两次定时操作的时间间隔,它决定了定时操作是否继续进行,如果定时间隔大于0,则在定时器到期时,该定时器的到期时间被重新赋值,使定时操作继续进行下去,直到进程结束或停止使用定时器,只不过对不同的定时器,到期时间的重新赋值操作是不同的。在表4.8中,每个都有两个域来表示到期时间和定时间隔:value和incr,二者的单位都是时钟滴答,和jiffies的单位是一致的,Linux所有的时间应用都建立在jiffies之上。虚拟定时器和概况定时器到期时由发送相应的信号,而实时定时器比较特殊,它由内核机制提供支持,我们将在后面讨论这个问题。
每个,当前进程所有和时间有关的信息都要更新:当前进程耗费的CPU时间要更新,以便于最后的计费;时间片计数器counter要更新,如果counter<=0,则要执行调度程序;进程申请的延时要更新,如果延时时间到了,则唤醒该进程;所有的都要更新,Linux内核检测这些定时器是否到期,如果到期,则执行相应的操作。在这里,“更新”的具体操作是不同的:对counter,要对它减值,而对于所有的,就是检测它的值,内核把系统当前时间和其到期时间作一比较,如果到期时间小于系统时间,则表示该定时器到期。但为了方便,我们把这些操作一概称为“更新”,请读者注意。
请特别注意上面三个的更新时间。实时不管其所属的进程是否运行都要更新,所以,来临时,系统中所有进程的实时定时器都被更新,如果有多个进程的实时定时器到期,则要一一处理这些定时器所触发的事件。而虚拟和概况定时器只在进程运行时更新,所以,来临时,只有当前进程的概况定时器得到更新,如果当前进程运行于用户态,则其虚拟定时器也得到更新。
此外,Linux内核对这三种的处理是不同的,虚拟定时器和概况定时器到期时,内核向当前进程发送相应的信号:SIGVTALRM 、SIGPROF ;而实时定时器要执行的操作由real_timer决定,real_time是timer_list类型的(定义:struct timer_list real_timer),其中容纳了实时定时器的到期时间、定时间隔等信息,我们将在下一章详细讨论这些内容。
7. 文件系统信息(File System)
进程可以打开或关闭文件,文件属于,Linux内核要对进程使用文件的情况进行记录。task_struct结构中有两个用于描述进程与文件相关的信息。其中,fs_struct中描述了两个VFS(VFS inode),这两个索引节点叫做root和pwd,分别指向进程的可执行映象所对应的根目录(home directory)和或工作目录。file_struct结构用来记录了进程打开的文件的描述符(descriptor)。如表1.9所示。
表1.9 与文件系统相关的域
定义形式 |
解释 |
Sruct fs_struct *fs |
进程的可执行映象所在的文件系统 |
Struct files_struct *files |
进程打开的文件 |
在文件系统中,每个VFS唯一描述一个文件或目录,同时该节点也是向更低层的文件系统提供的统一的接口。
8. 信息(Virtual Memory)
除了线程(kernel thread),每个进程都拥有自己的(也叫),用mm_struct来描述。另外Linux2.4还引入了另外一个域active_mm,这是为线程而引入。因为没有自己的,为了让内核线程与普通进程具有统一的方式,当内核线程进行上下文切换时,让切换进来的线程的active_mm 指向刚被调度出去的进程的active_mm(如果进程的mm域不为空,则其active_mm域与mm域相同)。内存信息如表1.10所示。
表1.10 描述信息
定义形式 |
解释 |
Struct mm_struct *mm |
描述进程的地址空间 |
Struct mm_struct *active_mm |
内核线程所借用的地址空间 |
9.页面管理信息
当不足时,Linux子系统需要把内存中的部分页面交换到外存,其交换是以页为单位的。有关页面的描述信息如表1.11。
表1.11 页面管理信息
定义形式 |
解释 |
Int swappable |
进程占用的内存页面是否可换出 |
Unsigned long min_flat,maj_flt,nswap |
进程累计的次(minor)缺页次数、主(major)次数及累计换出、换入页面数 |
Unsigned long cmin_flat,cmaj_flt,cnswap |
本进程作为祖先进程,其所有层次子进程的累计的次(minor)缺页次数、主(major)次数及累计换出、换入页面数 |
10.(SMP)信息
Linux2.4对SMP进行了全面的支持,表1.12是与相关的几个域。
表1.12 与相关的域
定义形式 |
解释 |
Int has_cpu |
进程是否当前拥有CPU |
Int processor |
进程当前正在使用的CPU |
Int lock_depth |
上下文切换时内核锁的深度 |
11.和处理器相关的环境(上下文)信息(Processor Specific Context)
这里要特别注意标题:和“处理器”相关的环境信息。进程作为一个执行环境的综合,当系统调度某个进程执行,即为该进程建立完整的环境时,处理器(processor)的寄存器、堆栈等是必不可少的。因为不同的处理器对内部寄存器和堆栈的定义不尽相同,所以叫做“和处理器相关的环境”,也叫做“状态”。当进程暂时停止运行时,状态必须保存在进程的task_struct结构中,当进程被调度重新运行时再从中恢复这些环境,也就是恢复这些寄存器和堆栈的值。处理机信息如表1.13所示。
表1.13 与相关的信息
定义形式 |
解释 |
Struct thread_struct *tss |
任务切换状态 |
12.其它
(1) struct wait_queue *wait_chldexit
在进程结束时,或发出系统调用wait4时,为了等待子进程的结束,而将自己()睡眠在该上,设置状态标志为TASK_INTERRUPTIBLE,并且把控制权转给调度程序。
(2)Struct rlimit rlim[RLIM_NLIMITS];
每一个进程可以通过setlimit和getlimit来限制它资源的使用。
(3)Int exit_code exit_signal;
程序的返回代码以及程序异常终止产生的信号,这些数据由(子进程完成后) 轮流查询。
(4)Char comm[16]
这个域存储进程执行的程序的名字,这个名字用在调试中。
(5)Unsigned long personality;
Linux可以运行X86平台上其它Unix生成的符合iBCS2标准的程序, personality进一步描述进程执行的程序属于何种Unix平台的“个性”信息。通常有PER_Linux,PER_Linux_32BIT,PER_Linux_EM86,PER_SVR4,PER_SVR3,PER_SCOSVR3,PER_WYSEV386,PER_ISCR4,PER_BSD,PER_XENIX和PER_MASK等,参见include/Linux/personality.h>。
(6) int did_exec:1;
按POSIX要求设计的,区分进程正在执行老程序代码,还是用系统调用execve()装入一个新的程序。
(7)struct linux_binfmt *binfmt
指向进程所属的全局执行结构,共有a.out、script、elf、java等四种。