Linux进程控制、调度-lchjczw-ChinaUnix博客

lchjczwlchjczw.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

lchjczw

博客访问： 655684
博文数量： 1008
博客积分： 10
博客等级：民兵
技术积分： 5175
用户组：普通用户
注册时间： 2012-07-31 09:44

文章分类

全部博文（1008）

Linux系统（0）
单片机开发（0）
ARM体系结构（0）
文件系统（6）

sysfs（0）

procfs（6）
应用程序开发（1）

Java（0）

Linux C（1）

C++（0）

C语言（0）
Linux驱动开发（18）

wifi驱动开发（0）

视频驱动开发（0）

音频驱动开发（2）

网络设备驱动开发（1）

驱动调试（0）

驱动基础（4）

sd卡驱动开发（1）

总线驱动（9）

flash驱动开发（0）

USB驱动开发（1）
未分配的博文（983）

文章存档

2012年（1008）

我的朋友

最近访客

推荐博文

Linux进程控制、调度

分类：

2012-08-01 11:07:14

原文地址：Linux进程控制、调度作者：luozhiyong131

进程和程序的区别

程序是存放在磁盘上的一系列代码和数据的可执行映像，是一个静止的实体。

进程是一个执行中的程序。它是动态的实体。

进程四要素

1. 有一段程序供其执行。这段程序不一定是某个进程所专有，可以与其他进程共用。

2. 有进程专用的内核空间堆栈。

3. 在内核中有一个task_struct数据结构，即通常所说的“进程控制块”。有了这个数据结构，进程才能成为内核调度的一个基本单位接受内核的调度。

4. 有独立的用户空间

进程描述

在Linux中，线程、进程都使用structtask_struct来表示，它包含了大量描述进程/线程的信息，其中比较重要的有：

pid_t pid;

进程号，最大值10亿

进程状态

volatile long state /* 进程状态*/

1. TASK_RUNNING

进程正在被CPU执行，或者已经准备就绪，随时可以执行。当一个进程刚被创建时，就处于TASK_RUNNING状态。

2. TASK_INTERRUPTIBLE

处于等待中的进程，待等待条件为真时被唤醒，也可以被信号或者中断唤醒。

3. TASK_UNINTERRUPTIBLE

处于等待中的进程，待资源有效时唤醒，但不可以由其它进程通过信号(signal)或中断唤醒。

4. TASK_STOPPED

进程中止执行。当接收到SIGSTOP和SIGTSTP等信号时，进程进入该状态，接收到SIGCONT信号后，进程重新回到TASK_RUNNING。

5. TASK_KILLABLE

Linux2.6.25新引入的进程睡眠状态，原理类似于TASK_UNINTERRUPTIBLE,但是可以被致命信号(SIGKILL)唤醒。

6. TASK_TRACED

正处于被调试状态的进程

7. TASK_DEAD

进程退出时(调用do_exit)，state字段被设置为该状态。

int exit_state /*进程退出时的状态*/

EXIT_ZOMBIE(僵死进程)

表示进程的执行被终止，但是父进程还没有发布waitpid()系统调用来收集有关死亡的进程的信息。

EXIT_DEAD(僵死撤销状态)

表示进程的最终状态。父进程已经使用wait4()或waitpid()系统调用来收集了信息，因此进程将由系统删除。

进程描述

struct mm_struct *mm

进程用户空间描述指针,内核线程该指针为空。

unsigned int policy

该进程的调度策略。

int prio

优先级，相当于2.4 中goodness() 的计算结果，在0--(MAX_PRIO-1) 之间取值（MAX_PRIO 定义为140），其中0—(MAX_RT_PRIO-1) （MAX_RT_PRIO 定义为100）属于实时进程范围，MAX_RT_PRIO-MX_PRIO-1 属于非实时进程。数值越大，表示进程优先级越小

int static_prio

静态优先级，与2.4 的nice 值意义相同。nice 值仍沿用Linux 的传统，在-20 到19 之间变动，数值越大，进程的优先级越小。nice 是用户可维护的，但仅影响非实时进程的优先级。进程初始时间片的大小仅决定于进程的静态优先级，这一点不论是实时进程还是非实时进程都一样，不过实时进程的static_prio 不参与优先级计算。nice 与static_prio 的关系如下：

static_prio = MAX_RT_PRIO + nice + 20

内核定义了两个宏用来完成这一转换：PRIO_TO_NICE()、NICE_TO_PRIO

struct sched_rt_entity rt

rt->time_slice

时间片,进程的缺省时间片与进程的静态优先级（在2.4中是nice 值）相关，使用如下公式得出：

MIN_TIMESLICE + ((MAX_TIMESLICE - MIN_TIMESLICE) *(MAX_PRIO-1 - (p)->static_prio) / (MAX_USER_PRIO-1))

内核将100-139 的优先级映射到200ms-10ms 的时间片上去，优先级数值越大，则分配的时间片越小。

在Linux中用current指针指向当前正在运行的进程的task_struct。

调度：从就绪的进程中选出最适合的一个来执行。

1、调度策略

2、调度时机

3、调度步骤

调度策略

SCHED_NORMAL(SCHED_OTHER):普通的分时进程

SCHED_FIFO :先入先出的实时进程

SCHED_RR：时间片轮转的实时进程

SCHED_BATCH:批处理进程

SCHED_IDLE: 只在系统空闲时才能够被调度执行的进程

调度类

调度类的引入增强了内核调度程序的可扩展性，这些类（调度程序模块）封装了调度策略，并将调度策略模块化。

l CFS 调度类（在kernel/sched_fair.c 中实现）用于以下调度策略：SCHED_NORMAL、

SCHED_BATCH 和SCHED_IDLE。

l 实时调度类（在kernel/sched_rt.c 中实现）用于SCHED_RR 和SCHED_FIFO 策略。

调度时机

调度的发生有两种方式：

1、主动式

在内核中直接调用schedule()。当进程需要等待资源等而暂时停止运行时，会把状态置于挂起（睡眠），并主动请求调度，让出CPU。主动放弃cpu例:

1. current->state = TASK_INTERRUPTIBLE;

2. schedule();

2、被动式（抢占）

用户抢占（Linux2.4、Linux2.6）内核抢占(Linux2.6)

l 用户抢占发生在：

n 从系统调用返回用户空间。

n 从中断处理程序返回用户空间。

内核即将返回用户空间的时候，如果need_resched标志被设置，会导致schedule()被调用，此时就会发生用户抢占。

l 内核抢占

在不支持内核抢占的系统中，进程/线程一旦运行于内核空间，就可以一直执行，直到它主动放弃或时间片耗尽为止。这样一些非常紧急的进程或线程将长时间得不到运行。在支持内核抢占的系统中，更高优先级的进程/线程可以抢占正在内核空间运行的低优先级进程/线程。

在支持内核抢占的系统中，某些特例下是不允许内核抢占的：

v 内核正进行中断处理。进程调度函数schedule()会对此作出判断，如果是在中断中调用，会打印出错信息。

v 内核正在进行中断上下文的Bottom Half(中断的底半部)处理。硬件中断返回前会执行软中断，此时仍然处于中断上下文中。

v 进程正持有spinlock自旋锁、writelock/readlock读写锁等，当持有这些锁时，不应该被抢占，否则由于抢占将导致其他CPU长期不能获得锁而死等。

v 内核正在执行调度程序Scheduler。抢占的原因就是为了进行新的调度，没有理由将调度程序抢占掉再运行调度程序。

为保证Linux内核在以上情况下不会被抢占，抢占式内核使用了一个变量preempt_count，称为内核抢占计数。这一变量被设置在进程的thread_info结构中。每当内核要进入以上几种状态时，变量preempt_count就加1，指示内核不允许抢占。每当内核从以上几种状态退出时，变量preempt_count就减1，同时进行可抢占的判断与调度。