linux 进程管理-----pid哈希链表-zhanglin496-ChinaUnix博客

mxl&nbsp;ChinaUnix博客zhanglin.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

zhanglin496

博客访问： 1029309
博文数量： 442
博客积分： 1146
博客等级：少尉
技术积分： 1604
用户组：普通用户
注册时间： 2010-11-04 12:52

个人简介

123

文章分类

全部博文（442）

RCU机制（2）
tc流量控制（2）
ipv6（1）
内核启动流程（5）
openwrt（7）
bootloader（3）
http（1）
C++（3）
网络概念（0）
多线程编程（2）
常用算法（14）
linux操作（9）
内核同步（26）

内存屏障（5）
linux内核（191）

RCU机制（3）

netfilter-nat分（3）

skb解析（5）

定时器实现（1）

poll分析（4）

proc系统（5）

linux-IPC（13）

netfilter（84）

linux数据结构（17）

linux驱动（11）
git（3）
linux配置（7）
个人经验总结（6）
调试（7）
Unix C（40）
TCP/IP（26）
未分配的博文（87）

文章存档

2017年（3）

2016年（15）

2015年（132）

2014年（52）

2013年（101）

2012年（110）

2011年（29）

我的朋友

最近访客

推荐博文

linux 进程管理-----pid哈希链表

分类：

2012-05-03 13:28:12

原文地址：linux 进程管理-----pid哈希链表作者：zhangliangfnst

为了较快的从给定的pid值得到相应的宿主结构（进程描述符）指针，内核采用了pid哈希链表结构。

首先，以下的问题要理解：

1）为什么pid哈希链表只定义2048或者4096项（根据你的内存大小确定）？直接定义为pid最大值不是最好吗？

我们都知道，查找的最快方式就是数组了，可以在常数的时间内完成查找。假如我们的pid最大值为32768，那么我们完全可以定义一个struct task_struct* name[32768];进而可以最快速的从给定的pid值中找到其相应的宿主结构。也就是指向该pid进程的进程描述符指针。

然而，这确实一种不理智的方法。虽然进程PID的最大值为32768，但是，我们在实际应用中所能用的pid值要平均值要远远低于这个值。这样的话，会造成大量的物理空间浪费。假如我们用到了2768个pid，那么还有30000*4bytes的空间浪费。

2）特殊情况的需求

设想这样一种情况：假设内核必须回收一个给定pid值的线程组内的所有线程，（线程组内的所有线程的pid值都是相同的）在上述数组形式的定义中，是无法完成的。

而我们要做的是必须为这种形式的线程组（pid值相同）组织成一个链表。这个链表的节点，就是这个线程组内的全部线程。

而pid哈希链表能很好的完成上述的1）2）两点。

下面我们看一下内核对pid哈希链表的定义和初始化过程以及相关的操作。

static struct hlist_head *pid_hash[PIDTYPE_MAX];
系统在初始化期间手动的创建了一个含有PIDTYPE_MAX个元素的指针数组。
用于存放指向hash桶的指针。
并且在start_kernel期间调用pidhash_init函数对hash桶进行初始化。
303 void __init pidhash_init(void)
     /* */
304 {
305         int i, j, pidhash_size;
306         unsigned long megabytes = nr_kernel_pages >> (20 - PAGE_SHIFT);
307
308         pidhash_shift = max(10, fls(megabytes * 4));
309         pidhash_shift = min(12, pidhash_shift);
310         pidhash_size = 1 << pidhash_shift;
311
312         printk("PID hash table entries: %d (order: %d, %Zd bytes)\n",
313                 pidhash_size, pidhash_shift,
314                 PIDTYPE_MAX * pidhash_size * sizeof(struct hlist_head));
315        #######以上为桶的大小设置和桶中含有的entry个数设置
     #######dmesg结果显示：PID hash table entries: 4096 (order: 12, 16384 bytes)
     #######pidhash_size(桶大小）：4096*4bytes entries:4096
     #######也就是说桶中存有4096个指针，指针指向struct hlist_node结构
316         for (i = 0; i < PIDTYPE_MAX; i++) {
317                 pid_hash[i] = alloc_bootmem(pidhash_size *
318                                         sizeof(*(pid_hash[i])));
     #######在系统启动期间slab和alloc分配器都还没有建立好
     #######采用allocbootmem内存分配器对系统初始化期间的内存进行分配
319                 if (!pid_hash[i])
320                         panic("Could not alloc pidhash!\n");
321                 for (j = 0; j < pidhash_size; j++)
322                         INIT_HLIST_HEAD(&pid_hash[i][j]);
     #######将桶中指向struct hlist_node 结构的指针first初始化为NULL
323         }
经过这个函数 pid哈希链表被初始化完成。

与此同时，start_kernel期间也对pid位图进行了相应的初始化。利用pid位图对进程pid号进行管理是一种简单并且高效的形式。（bit：0代表这个pid可以使用bit：1代表这个pid已经被占用）

系统在初始化期间手动的为表示进程pid号的位图分配空间并且初始化。

50 typedef struct pidmap {
51 atomic_t nr_free;
52 void *page;
53 } pidmap_t;

55 static pidmap_t pidmap_array[PIDMAP_ENTRIES] =
56 { [ 0 ... PIDMAP_ENTRIES-1 ] = { ATOMIC_INIT(BITS_PER_PAGE), NULL } };

位图初始化期间：利用get_zeroed_page函数为位图提供一个物理上的页框，并且此页框被实现初始化为0.

这样，一个大小为4K的物理页框，可以表示的进程号个数为：4*1024*8=32768；

但是有一点我们要主要：由于进程号0的特殊性，我们事先将其设置为不可用，也就是将位图的0号位设置为1，并把相应表示目前可用的pid号的个数减1.

326 void __init pidmap_init(void)
/* */
327 {
328 int i;
329
330 pidmap_array->page = (void *)get_zeroed_page(GFP_KERNEL);
331 set_bit(0, pidmap_array->page);
332 atomic_dec(&pidmap_array->nr_free);
333
334 /*
335 * Allocate PID 0, and hash it via all PID types:
336 */
337
338 for (i = 0; i < PIDTYPE_MAX; i++)
339 attach_pid(current, i, 0);
340 }

上述代码通过attach_pid函数将0号进程进行hash，将其hash到上面已经初始化好的hash链表桶中。

我们知道每个进程中都有：struct pid pids[PIDTYPE_MAX]；而hash链表正是通过这个结构进行链接。

上述函数中，首先通过find_pid函数在指定类型和nr号的哈希链表中查找pid结构。如果找到则返回指向struct pid的指针否则返回NULL。

接下来的代码根据find_pid的返回值，做出相应的动作。

1）pid为NULL，说明新attach的包含struct pid的进程描述符是哈希链表的第一个元素，将其插入头结点之后，并将struct pid的pid_list字段设置为NULL。struct list_head pid_list是由于连接具有相同nr号的进程描述符的连接件。

2）pid不为NULL,说明相应的哈希链表中已经存在了nr号为“nr”的进程描述符，我们只需将我们的进程描述符attach到相应的哈希链表的进程链表中。

通过上面的两个函数我们还可以得知：所有桶中（一般为4个）0号索引对应的哈希链表的第一个进程描述符元素都为0号进程的进程描述符。

而与attach_pid函数对应的操作为dettach_pid：将pid所在的进程描述符从对应的pid哈希链表中删除，这个函数的定义如下：

192 void fastcall detach_pid(task_t *task, enum pid_type type)
/* */
193 {
194 int tmp, nr;
195
196 nr = __detach_pid(task, type);
197 if (!nr)
198 return;
199
200 for (tmp = PIDTYPE_MAX; --tmp >= 0; )
201 if (tmp != type && find_pid(tmp, nr))
202 return;
203
204 free_pidmap(nr);
205 }

核心函数为__detach_pid(task,type)

166 static fastcall int __detach_pid(task_t *task, enum pid_type type)
/* */
167 {
168 struct pid *pid, *pid_next;
169 int nr = 0;
170
171 pid = &task->pids[type];
172 if (!hlist_unhashed(&pid->pid_chain)) {
173
174 if (list_empty(&pid->pid_list)) {
175 nr = pid->nr;
176 hlist_del_rcu(&pid->pid_chain);
177 } else {
178 pid_next = list_entry(pid->pid_list.next,
179 struct pid, pid_list);
180 /* insert next pid from pid_list to hash */
181 hlist_replace_rcu(&pid->pid_chain,
182 &pid_next->pid_chain);
183 }
184 }
185
186 list_del_rcu(&pid->pid_list);
187 pid->nr = 0;
188
189 return nr;
190 }

函数首先判断task指向的进程是否已经被hash进pid哈希链表，注意有可能是哈希链表中的进程链表。

如果不是哈希链表的节点，直接将其从所在的进程链表中删除。此时返回nr=0，我们后面可以看到，detach_pid函数根据nr值来判断是否需要将pid位图中相应的pid位清0，以此来使继续可以被使用。

如果是hash链表中的节点，还要判断

1）是否此哈希链表节点所在的进程链表只有这个节点。如果是将nr设置为pid->nr 并将这个节点删除

2）如果哈希链表节点所在的进程链表还有别的节点。那么用下一个节点replace这个节点。注意此时并未设置nr的值。也就是说返回的nr=0

当从__datach_pid返回后，接下来的任务就是判断是否需要将pid对应的pid位图中相应的位清0

1）如果nr=0，不需要清0 函数直接返回。通过上面我们知道，函数在两种情况下会返回nr=0 ：

一，进程链表非空（此时暗指的含义就是这个pid还被其余的进程/线程使用着，不能在位图中将其释放；

二，删除的就是nr=0的进程描述符。这是也不需要在位图中将其释放；因为0号pid比较特殊是不允许其他进程使用的。

2）如果nr不等于0，还要判断在其他类型的哈希链表中是否存在这样的进程描述符，如果存在也表明其正在使用不能释放。

如果上述两步都没有return那么的确是需要将pid位图中想的pid表示位清0，以供系统使用。

上述的代码中有一处理解容易出现问题：

200 for (tmp = PIDTYPE_MAX; --tmp >= 0; )
201 if (tmp != type && find_pid(tmp, nr))
202 return;

为什么只搜索其他类型的hash链表而不处理我们刚刚将其删pid的类型的hash链表呢？因为对于刚刚删除的进程描述符的类型的hash链表我们应经用nr的值来表明是否需要清位图位了。

如果nr=0那么删除的进程描述符所在的进程链表是非空的---不必删除

如果进程链表是空的那么nr=pid-->nr我们不考虑0号pid那么这个nr一定为非0就说明我这个类型的hash链表不用这个进程号了你查查其他类型的hash链表是否还使用吧。

如果其他有一个在使用，OK 不删返回。如果都不用，那么我就清理门户pidbitmap 相应位设置为0了。

阅读(1916) | 评论(0) | 转发(0) |

上一篇：Linux Netlink通信机制详解（下）

下一篇：分析Linux idle

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6