转载好文：《专题研究一进程的深入理解与分析》（早期2.4内核）-chumojing-ChinaUnix博客

chumojing的ChinaUnix博客

首页　| 　博文目录　| 　关于我

chumojing

博客访问： 2200462
博文数量： 374
博客积分： 7276
博客等级：少将
技术积分： 5669
用户组：普通用户
注册时间： 2011-10-06 16:35

文章分类

全部博文（374）

手机（3）
硬件相关（2）
版本控制（3）
android（1）
MCU（4）
杂文随笔（1）
内存管理（2）
示波器（1）
bootloader（6）

UBOOT（4）
linux相关（38）

awk（2）

vim（7）

gdb（1）

shell（9）
设计模式（3）
过程记录（2）
内核知识（14）

内核函数（2）

内核移植（7）
ubuntu（19）
Makefile（3）
学习资源（1）
busybox（8）
应用编程（85）

定时器（4）

进程线程（14）

eclipse（3）

Qt（13）

网络（17）

C\C++（8）
设备驱动（151）

时钟体系（1）

延时操作（1）

CACHE DMA（1）

内存屏障（0）

设备驱动-GPIO（4）

电源管理（15）

设备驱动-PCI（1）

设备驱动-LCD（0）

设备驱动-tty（8）

网络驱动（3）

设备模型（10）

设备驱动-USB（21）

内核同步机制（7）
未分配的博文（27）

文章存档

2013年（23）

2012年（153）

2011年（198）

我的朋友

最近访客

推荐博文

转载好文：《专题研究一进程的深入理解与分析》（早期2.4内核）

分类：

2011-11-19 14:15:34

原文地址：转载好文：《专题研究一进程的深入理解与分析》（早期2.4内核）作者：tekkamanninja

在学习Linux进程内核栈的时候，看到这篇好文，在这里转载下：

（注意：数据结构针对的是早期的2.4内核，2.6以后的内核数据结构和处理方法稍有不同，但是基本原理相同）

作者：曹国辉

南京凌嵌教育嵌入式Linux金牌讲师

专题研究一进程的深入理解与分析

进程是程序的一次执行过程。用剧本和演出来类比，程序相当于剧本，而进程则相当于剧本的一次演出，舞台、灯光则相当于进程的运行环境。

进程的堆栈

每个进程都有自己的堆栈，内核在创建一个新的进程时，在创建进程控制块task_struct的同时，也为进程创建自己堆栈。一个进程有2个堆栈：用户堆栈和系统堆栈；用户堆栈的空间指向用户地址空间，内核堆栈的空间指向内核地址空间。当进程在用户态运行时，CPU堆栈指针寄存器指向用户堆栈地址，使用用户堆栈；当进程运行在内核态时，CPU堆栈指针寄存器指向的是内核栈空间地址，使用的是内核栈。

进程用户栈和内核栈之间的切换

当进程由于中断或系统调用从用户态转换到内核态时，进程所使用的栈也要从用户栈切换到内核栈。系统调用实质就是通过指令产生中断，称为软中断。进程因为中断（软中断或硬件产生中断），使得CPU切换到特权工作模式，此时进程陷入内核态，进程进入内核态后，首先把用户态的堆栈地址保存在内核堆栈中，然后设置堆栈指针寄存器的地址为内核栈地址，这样就完成了用户栈向内核栈的切换。

当进程从内核态切换到用户态时，最后把保存在内核栈中的用户栈地址恢复到CPU栈指针寄存器即可，这样就完成了内核栈向用户栈的切换。

这里要理解一下内核堆栈。前面我们讲到，进程从用户态进入内核态时，需要在内核栈中保存用户栈的地址。那么进入内核态时，从哪里获得内核栈的栈指针呢？

要解决这个问题，先要理解从用户态刚切换到内核态以后，进程的内核栈总是空的。这点很好理解，当进程在用户空间运行时，使用的是用户栈；当进程在内核态运行时，内核栈中保存进程在内核态运行的相关信息，但是当进程完成了内核态的运行，重新回到用户态时，此时内核栈中保存的信息全部恢复，也就是说，进程在内核态中的代码执行完成回到用户态时，内核栈是空的。

理解了从用户态刚切换到内核态以后，进程的内核栈总是空的，那刚才这个问题就很好理解了，因为内核栈是空的，那当进程从用户态切换到内核态后，把内核栈的栈顶地址设置给CPU的栈指针寄存器就可以了。

X86 Linux内核栈定义如下（可能现在的版本有所改变，但不妨碍我们对内核栈的理解），在/include/linux/sched.h中定义了如下一个联合结构：

union task_union {
struct task_struct task;
unsigned long stack[2408];
};

从这个结构可以看出，内核栈占8KB的内存区。实际上，进程的task_struct结构所占的内存是由内核动态分配的，更确切地说，内核根本不给task_struct分配内存，而仅仅给内核栈分配8K的内存，并把其中的一部分给task_struct使用。

这样内核栈的起始地址就是union task_union变量的地址+8K 字节的长度。例如：我们动态分配一个union task_union类型的变量如下：

unsigned char *gtaskkernelstack;
gtaskkernelstack = kmalloc(sizeof(union task_union));

那么该进程每次进入内核态时，内核栈的起始地址均为：（unsigned char *）gtaskkernelstack + 8096

进程上下文

进程切换现场称为进程上下文(context)，包含了一个进程所具有的全部信息，一般包括：进程控制块（Process Control Block，PCB）、有关程序段和相应的数据集。

进程控制块PCB（任务控制块）

进程控制块是进程在内存中的静态存在方式，Linux内核中用task_struct表示一个进程（相当于进程的人事档案）。进程的静态描述必须保证一个进程在获得CPU并重新进入运行态时，能够精确的接着上次运行的位置继续进行，相关的程序段，数据以及CPU现场信息必须保存。处理机现场信息主要包括处理机内部寄存器和堆栈等基本数据。

进程控制块一般可以分为进程描述信息、进程控制信息，进程相关的资源信息和CPU现场保护机构。

进程的切换

当一个进程的时间片到时，进程需要让出CPU给其他进程运行，内核需要进行进程切换。

Linux 的进程切换是通过调用函数进程切换函数schedule来实现的。进程切换主要分为2个步骤：

1. 调用switch_mm()函数进行进程页表的切换；

2. 调用 switch_to() 函数进行 CPU寄存器切换；

__switch_to定义在\arch\arm\kernel目录下的entry-armv.S 文件中，源码如下：

ENTRY(__switch_to)
UNWIND(.fnstart )
UNWIND(.cantunwind )
add ip, r1, #TI_CPU_SAVE
ldr r3, [r2, #TI_TP_VALUE]
stmia ip!, {r4 - sl, fp, sp, lr} @ Store most regs on stack
#ifdef CONFIG_MMU
ldr r6, [r2, #TI_CPU_DOMAIN]
#endif
#if __LINUX_ARM_ARCH__ >= 6
#ifdef CONFIG_CPU_32v6K
clrex
#else
strex r5, r4, [ip] @ Clear exclusive monitor
#endif
#endif
#if defined(CONFIG_HAS_TLS_REG)
mcr p15, 0, r3, c13, c0, 3 @ set TLS register
#elif !defined(CONFIG_TLS_REG_EMUL)
mov r4, #0xffff0fff
str r3, [r4, #-15] @ TLS val at 0xffff0ff0
#endif
#ifdef CONFIG_MMU
mcr p15, 0, r6, c3, c0, 0 @ Set domain register
#endif
mov r5, r0
add r4, r2, #TI_CPU_SAVE
ldr r0, =thread_notify_head
mov r1, #THREAD_NOTIFY_SWITCH
bl atomic_notifier_call_chain
mov r0, r5
ldmia r4, {r4 - sl, fp, sp, pc} @ Load all regs saved previously
UNWIND(.fnend )
ENDPROC(__switch_to)

Switch_to的处理流程如下：

1. 保存本进程的CPU寄存器（PC、R0 ~ R13）到本进程的栈中；

2. 保存SP(本进程的栈基地址)到task->thread.save 中；

3. 从新进程的task->thread.save恢复SP为新进程的栈基地址；

4. 从新进程的栈中恢复新进程的CPU相关寄存器值，

5. 新进程开始运行，完成任务切换。

这里读者可能会问，在进行任务切换的时候，到底是在运行进程1还是运行进程2呢？进程切换的时候，已经进行页表切换，那页表切换之后，切换进程使用的是进程1还是进程2的页表呢？

要回答这个问题，首先我们要明白由谁来完成进程切换？

通过对操作系统的理解，毫无疑问，进程切换是由内核来完成的，也就是说，在进行进程切换时，CPU运行在内核模式，使用的是内核空间的内核代码，它既不属于进程1，也不属于进程2，当进程的时间片到时，内核提供服务来完成进程的切换。既不使用进程1的页表，也不使用进程2的页表，使用的内核映射页表。这样我们就很好理解上面的问题了。

希望这篇文的对大家深入理解进程有所帮助。

阅读(741) | 评论(0) | 转发(0) |

上一篇：对Linux的进程内核栈的认识

下一篇：Linux设备驱动学习15-设备模型(热插拔,mdev,firmware)

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6