Linux 线程分析-yandongxiao-ChinaUnix博客

昂首前行

首页　| 　博文目录　| 　关于我

yandongxiao

博客访问： 547438
博文数量： 140
博客积分： 10
博客等级：民兵
技术积分： 650
用户组：普通用户
注册时间： 2012-12-11 19:00

文章分类

全部博文（140）

libevent（1）
cmake（2）
Linux内核之TCP/I（2）
杂项（6）
网络编程（0）
Linux内核学习笔（6）
Python学习笔记（31）
Linux内核之基础（1）
Linux内核源代码（28）

iptables（4）

sk_buff结构（2）

IP层数据包处理过（5）

nf_queue运行原理（7）
C/C++函数之网络（27）
Linux基础之文件（7）
Linux内核之网络（13）
Linux基础之命令（16）
未分配的博文（0）

文章存档

2015年（5）

2014年（135）

我的朋友

相关博文

Linux 线程分析

分类： LINUX

2014-02-23 20:01:02

原文地址：Linux 线程分析作者：datao0907

用户态线程

用户空间利用系统调用clone来创建线程，在glibc中文件夹nptl/sysdeps/pthreadcreatethread.c中的函数create_thread中指明了flags:

...
int clone_flags = (CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SIGNAL |CLONE_SETTLS | CLONE_PARENT_SETTID | CLONE_CHILD_CLEARTID | CLONE_SYSVEM)
...

调用创建线程的函数:

ARCH_CLONE(fct,STACK_VARIABLES_ARGS,clone_flags,pd,&pd->tid,TLS_VALUE,&pd->tid);

而ARCH_CLONE定义为:

ifndef ARCH_CLONE
#define ARCH_CLONE __clone //调用clone函数
#endif

而clone函数的参数:

[glibc/include/sched.h]
extern int __clone(int (*__fn) (void *__arg),void *__child_stack,int __flags,void *__arg,...)

就是这些参数去调用do_fork函数来创建了一个线程

CLONE_VM:共享虚拟内存

CLONE_FS:共享文件命名空间,文件系统信息，以及pwd

CLONE_FILES:共享文件描述符表

CLONE_SIGNAL:POSIX信号量，具体不详，内核中没有该设置,()

CLONE_SETTLS:设置线程局部存储区域(类似pthread_setspecific,pthread_getspecific函数调用,不过该函数在用户层封装之后实现,而set/get_thread_area才是真正的系统调用)

CLONE_PARENT_SETTID:在clone 系统调用中从用户空间复制创建线程的pid:

if(clone_flags & CLONE_PARENT_SETTID)
put_user(nr,parent_tidptr);//从用户空间将parent_tidptr复制到内核态变量nr中

在nptl库中等价于调用CLONE_CHILD_SETTID，因为调用的实参都相同，从nptl注释中看出它的开销很大，因此通过CLONE_PARENT_SETTID来实现。

CLONE_CHILD_SETTID:将内核态的p->set_child_tid指向用户态的child_tidptr:

p->set_child_tid = (clone_flags &CLONE_CHILD_SETTID) ?child_tidptr:NULL;

当新进程执行前，又将当前进程的pid复制到该域中.

[kernel/schedule.c]
asmlinkage void schedule_tail(struct task_struct *prev)
{
...
if(current->set_child_tid)
put_user(task_pid_vnr(current),current->set_child_tid);
...
}

CLONE_CHILD_CLEARTID:在copy_process函数中，有同样的效果，指向child_tidptr:

p->clear_child_tid = (clone_flags & CLONE_CHILD_CLEARTID) ? child_tidptr:NULL;

但是该作用域用在当进程终止时，回收传递给用户空间的tid:

[kernel/fork.c]
void mm_release(struct task_struct *tsk,struct mm_struct *mm)
{
//线程引用计数大于1,线程共享内存模式
if(tsk->clear_child_tid && !(tsk->flags & PF_SIGNALED) && atomic_read(&mm->users)>1)
{
u32 __user *tidptr = tsk->clear_child_tid;
tsk->clear_child_tid = NULL;
put_user(0,tidptr);
//唤醒等待线程退出事件的线程
sys_futex(tidptr,FUTEX_WAKE,1,NULL,NULL,0);
}
}

上面的标志就是创建线程的所有标志了，CLONE_CHILD_SETTID,CLONE_PARENT_SETTID在线程创建时使用，而CLONE_CHLID_CLEARTID在线程退出时采用。

内核态线程

内核态线程通常指的是内核级守护线程，主要执行下面的任务:

1.周期性与块驱动同步修改的内存页，如将脏数据回写至磁盘。

2.将内存页写至交换分区

3.实现日志文件系统的事务机制

主要分为两种类型的执行方法：

1.线程一旦启动，就进行等待直到内核要求其执行特定的任务

2.一旦创建就周期性检查各种资源，监视系统资源使用情况，超过限制时就需要采取行动，如pdflush.

创建内核线程函数如下：

[arch/x86/kernel/process_32.c]
int kernel_thread(int (*fn)(void *),void *arg,unsigned long flags)
{
struct pt_regs regs;
memset(&regs,0,sizeof(struct pt_regs));
/*构造一个符合do_fork系统调用的参数**/
regs.ebx = (unsigned long)fn;
regs.edx = (unsigned long)arg;
regs.xds = __USER_DS;
regs.xes = __USER_DS;
regs.xfs = __KERNEL_PERCPU;
regs.orig_eax = -1;
regs.eip = (unsigned long) kernel_thread_helper;
regs.xcs = __KERNEL_CS|get_kernel_rpl();
regs.flags = X86_EFLAGS_IF |X86_EFLAGS_SF|X86_EFLAGS_PF|0x2;
return do_fork(flags,CLONE_VM|CLONE_UNTRACED,0,&regs,0,NULL,NULL);
}

由于内核线程运行在内核态中，所有没有用户栈，而且也只能访问内核的部分虚拟内存。

在定义进程时有两个域:

struct task_struct {
...
struct mm_struct *mm,*active_mm;
...
}

Linux系统中虚拟内存分为两部分:低端内存为用户程序，而高端则留给内核，当用户程序进入内核态时，用户态的内存区域指针保存在mm中，内核态程序没有用户级程序，所有mm则为空，但是由于执行系统调用之后进入内核态，或者执行内核态进程时，为了清楚知道当前用户态的进程，active_mm就指向了当前的用户空间进程,为了防止被内核态访问时，用户空间被释放，系统增加一个计数器:mm_users,而僵尸进程也只有在计数为0时才会被释放。处于进程上下文时两个指针是一样的。

内核线程能够使用两种方式来实现，通过传递一个函数指针给kernel_thread，然后调用daemonize进入守护模式:

1.如果有用户态资源，则释放用户态的所有资源，如内存上下区域，文件描述符等。

2.damonize阻塞接收所有的信号

3.将父进程设置为init

还可以通过下面的函数来创建内核线程:

[kernel/kthread.c]
struct task_struct *kthread_create(int (*threadfn)(void *data),
void *data,
const char namefmt[],
....)

该函数创建一个名称为namefmt的内核级线程，通过调用wake_up_process来启动它，运行函数threadfn(data),如果没有调用函数kthread_stop或kthread_should_stop,则调用do_exit来退出。

类似地，还可以调用kthread_run,kthread_create_on_cpu来创建线程。

可以通过调用ps -fax来查看内核线程:

2 ? S 0:00 [kthreadd]
3 ? S 0:00 \_ [migration/0]
4 ? S 0:00 \_ [ksoftirqd/0]
5 ? S 0:00 \_ [watchdog/0]
6 ? S 0:00 \_ [migration/1]
7 ? S 0:00 \_ [ksoftirqd/1]
8 ? S 0:00 \_ [watchdog/1]
9 ? S 0:09 \_ [events/0]
10 ? S 0:10 \_ [events/1]

[]表示内核线程/0表明该内核线程限制运行在0号cpu之上。

参考资料

professional linux kernel architecture

linux-kernel-v.2.26.4源码

glibc2.9源码

阅读(1709) | 评论(1) | 转发(0) |

上一篇：Linux内核学习笔记——进程

下一篇：TLS---线程局部存储 (for MS windows)

给主人留下些什么吧！~~

yandongxiao2014-02-23 20:08:31

CLONE_VM:共享虚拟内存
CLONE_FS:共享文件命名空间,文件系统信息，以及pwd
CLONE_FILES:共享文件描述符表
CLONE_SIGNAL:POSIX信号量，具体不详，内核中没有该设置,(CLONE_SIGHAND|CLONE_THREAD)
CLONE_SETTLS:设置线程局部存储区域(类似pthread_setspecific,pthread_getspecific函数调用,不过该函数在用户层封装之后实现,而set/get_thread_area才是真正的系统调用)
CLONE_PARENT_SETTID:在clone 系统调用中从用户空间复制创建线程的pid

这就是线程创建时，所要共享的全部内容。共享虚拟内存，共享文件描述符标，共享文件命名空间，文件系统信息，POSIX信号量都还能理解，设置线程局部存储区域即线程内部的全局变量，详细分析，看http://blog.chinaunix.net/uid-27024249-id-3937907.html

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6