Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1732222
  • 博文数量: 782
  • 博客积分: 2455
  • 博客等级: 大尉
  • 技术积分: 4140
  • 用 户 组: 普通用户
  • 注册时间: 2011-04-06 21:37
个人简介

Linux ,c/c++, web,前端,php,js

文章分类

全部博文(782)

文章存档

2015年(8)

2014年(28)

2013年(110)

2012年(307)

2011年(329)

分类:

2011-09-25 14:16:18

原文地址:list.h头文件分析 作者:曹朋Code

structlist_head {

       struct list_head *next, *prev; };

这个就是那个链表的头!是不觉得很奇怪?怎么只有两个指针域,没有数据域呢?其实我现在也纠结这这个问题着呢!没事,咱们先往下看。说不定什么时候,咱就明白了这是怎么一回事情呢。

#define LIST_HEAD_INIT(name

#defineLIST_HEAD(name) \

       struct list_head name = LIST_HEAD_INIT(name)

这俩是宏没错吧!来看看这个俩到底是个什么意思。

先来看看这个LIST_HEAD_INIT(name),当程序当中出现了这个东西的时候,他立马就会替换成后面的东西,例如出现了:

LIST_HEAD_INIT(headnode)

他立马就会替换成{&(headnode),&(headnode)},有人会问这个到底是什么意思;呵呵不要着急!下面详细的说明:

假设有这么一段C代码

……….

 struct list_head headnode ;//定义了一个headnode节点

 headnode = LIST_HEAD_INIT(headnode);

……….

那么他是不应该再编译阶段就立马的被替换成这样呢?

……….

 struct list_head headnode ;//定义了一个headnode节点

 headnode = { &(headnode), &(headnode) };

……….

注意:这里面对标准的C进行了拓展叫:GNU C,这个意思呢就是说,对headnode的两个成员赋值。这赋值之后成了什么样子了呢?看下图:


是不是自己指向了自己?至于为什么可以这么赋值,不是本文讨论的重点,详细的可以或者

 

其实这里的LIST_HEAD_INIT(name)宏是用来初始化的;

LIST_HEAD(name)宏则是用来定义+初始化。你看LIST_HEAD(name)宏是不比LIST_HEAD_INIT(name)宏多了这句 struct list_head name 

记住:LIST_HEAD_INIT(name)宏是用来初始化的;LIST_HEAD(name)宏则是用来定义+初始化。

 

 

OK,我们接着往下看:

static inline void INIT_LIST_HEAD(struct list_head *list)

{

       list->next = list;

       list->prev = list;

}

奇怪这里怎么好像又是在初始化,而且还和上面的功能一样。我觉得,他们这样做有如下考虑:1、有些人习惯于调用函数进行初始化,而有的人喜欢代码简洁而直接使用宏来进行初始化,但是不论是那种方式,都达到了一样的功能-----初始化。

 

 

在往下看,有关链表添加的

#ifndef CONFIG_DEBUG_LIST

static inline void __list_add(struct list_head *new,

                           struct list_head *prev,

                           struct list_head *next)

{

       next->prev = new;

       new->next = next;

       new->prev = prev;

       prev->next = new;

}

#else

extern void __list_add(struct list_head *new,

                           struct list_head *prev,

                           struct list_head *next);

#endif

注意__list_add前面可是两个下划线”_”;这个就是说,这个函数是linux内核的东西,你再使用的时候,你就得注意了。一看名字就知道是增加链表节点;其实我们再学习双向链表的时候,那么多的指针操作,能把人绕死,而且到最后也搞得不清楚,你看看人家linux源代码是咋实现的:是不觉得有差距??大致格局如下图:自己用纸画画,我这里弄个图片很不容易的。


红色的是节点名字,黑色的是指针域。

 

 

在往下看:

static inline void list_add(struct list_head *new, struct list_head *head)

{

       __list_add(newheadhead->next);

}

刚才不说了么,前头哟俩下划线的让你谨慎的使用么,这不?人家有给你弄了一个函数,可以调用这个函数来进行链表的添加。实际上,还是调用的是刚才的那个有两个下划线的函数。这里体现了像个思想:1、封装,其实这个概念是C++等一类程序设计语言的OOP思想,用在了这里。2、重用,很多时候,代码其实都是可以不用自己写的,有一些现成的东西你可以去调用,这样可以很好的提高生产效率,而且linux源代码使用的是GPL许可证,没有什么版权啊乱七八糟的东西,有这么好的东西干嘛不用呢?其实下来的这个你会体会的更深:

static inline void list_add_tail(struct list_head *new, struct list_head*head)

{

       __list_add(new, head->prev, head);

}

看名字,看看list_add_tail这个名字。是不是“尾插法”?还是调用了前头的那个有两个下划线的函数吧?而且,人家仅仅只是调换了一下参数的次序。高明吧!

 

 

好!再接着往下看:

static inline void __list_del(struct list_head * prev, struct list_head * next)

{

       next->prev = prev;

       prev->next = next;

}

 

 

#ifndef CONFIG_DEBUG_LIST

static inline void list_del(struct list_head *entry)

{

       __list_del(entry->prev, entry->next);

       entry->next = LIST_POISON1;

       entry->prev = LIST_POISON2;

}

#else

extern void list_del(struct list_head *entry);

#endif

这里是删除一节点,这里再一次的体现了封装和重用的思想。不过这里注意:

在讲entry这个节点删除之后你得将它指向一个正确的错误区域!什么意思呢,就是说,你的将它放在一个大家公认的错误的地方,因为所有的人都不会去碰那个错误的地方,所以:你这个entry就不会引起各种不必要的麻烦。其实这里有一个问题:放你free了某个节点之后,其实,我们还是可以使用这个节点的,这个在我同学的一篇博文里讲述的很清楚:

http://blog.sina.com.cn/s/blog_6e9342530100yaef.html  其实这里,LIST_POISON1= 0x00100100. LIST_POISON2=0x00200200。为什么,我不知道。

下来接着看这个替换函数。将链表当中某个节点用新的节点替换掉。

 

static inline void list_replace(struct list_head *old,

                            struct list_head *new)

{

       new->next = old->next;

       new->next->prev = new;

       new->prev = old->prev;

       new->prev->next = new;

}

下面在给出图例:

list.h头文件分析

大家可以根据图例来理解。

 

 

下来这个函数就是将某个链表里头的节点删除,然后添加到另外一个链表当中。你会发现代码很简单

 

static inline void list_move(struct list_head *list, struct list_head *head)

{

       __list_del(list->prev, list->next);

       list_add(list, head);

}

呵呵,是不是出乎你的意料了??确实,这里在一次的体现了代码的重用思想。不愧是linux内核源代码,就是这样简洁高效!!

 

下面这两个函数,一个用来判断是否为链表的最后一个节点,一个用来判断该链表是否为空。

 

static inline int list_is_last(const struct list_head *list,

                            const struct list_head *head)

{

       return list->next == head;

}

 

 

static inline int list_empty(const struct list_head *head)

{

       return head->next == head;

}

详细情况如下图:

然而实际上,我们用这种方式来判断链表是否为空是不太精确的。它同时判断头指针的nextprev,仅当两者都指向自己时才返回真。这主要是为了应付另一个cpu正在处理同一个链表而造成nextprev不一致的情况。但代码注释也承认,这一安全保障能力有限:除非其他cpu的链表操作只有list_del_init(),否则仍然不能保证安全,也就是说,还是需要加锁保护。

两个链表合并:

static inline void __list_splice(const struct list_head *list,

                             struct list_head *prev,

                             struct list_head *next)

{

       struct list_head *first = list->next;

       struct list_head *last = list->prev;

 

       first->prev = prev;

       prev->next = first;

 

       last->next = next;

       next->prev = last;

}

 

 

static inline void list_splice(const struct list_head *list,

                            struct list_head *head)

{

       if (!list_empty(list))

              __list_splice(list, head, head->next);

}

假设当前有两个链表,表头分别是list1list2(都是struct list_head变量),当调用list_splice(&list1,&list2)时,只要list1非空,list1链表的内容将被挂接在list2链表上,位于list2list2.next(原list2表的第一个节点)之间。新list2链表将以原list1表的第一个节点为首节点,而尾节点不变。如图(虚箭头为next指针):如下图所示:

list.h头文件分析


目前函数分析就到这里;由于篇幅限制,下篇博文,将详细介绍list.h当中的一些重要的宏!!

目前函数分析就到这里;由于篇幅限制,当中其实,还有一些很有用的函数:比如切割啊,判断是否为单链表啊等等,其实当你再了解了这些函数之后,后面的都是大同小异。可以自己在做研究,下面将重点放在list.h当中的几个很重要的宏当中。

还是顺着list.h往下看,你会看到第一宏:

 

#define list_entry(ptr, type, member) \

   container_of(ptr, type, member)

看到上面的那英文注释:获得结构体入口!!

ptr:这个参数是指向list_head 类型的指针(注意这里,很容易再代码当中用错)。

type看到那英文解释了么?这个type可不是list_head!他是list_head嵌入的那个结构体类型。详细会给出一断源代码,帮助大家理解。

Member:这个看到名字就知道这个是结构体的一个成员。

list_entry(ptr,type,member)这个宏到底是干嘛的,是不应该看container_of这个宏是干嘛的呢?用Sorce Insight 查看,会发现他在很多文件里头都存在,他们都是一样的,这里选取**/include/linux/kernel.h当中的container_of宏来说明。

 

#define container_of(ptr, type, member) ({        \

   const typeof( ((type *)0)->member ) *__mptr = (ptr); \

   })

这个宏的作用是:计算结构体成员member再结构体当中的相对位置(相对地址)。

现在想想,开头的时候,是不是看到了这个链表的结构体定义只有指针域而没有数据域?现在就是要计算出嵌入了list_head结构的结构体的数据域的地址。

Struct stu{

   int id

   struct list_head *next*prev

}

就是要根据list_head类型的结构体计算出struct stu结构体当中成员id的地址。

现在假设有如下定义:

struct stu *p

struct list_head *r;

r = p->next;

现在我们肯定是可以直接通过p来访问struct  stu结构体当中的id的。但是这样做旧失去了其通用性,要知道再内核当中链表的组织形式可是list_head

现在要如何才能够通过r访问的id呢?

我们将宏container_of分开成两部分来看。

a、    const   ) *__mptr = (ptr);

这里的typeof也是GNU C所拓展的。Typeof(x) 就是返回x的数据类型。我们先从最里面的括号开始看起吧,(type *)0 、先将0转化成type 类型的指针,此时地址为0x0。然后再引用member成员,即就是:    ((type *)0)->member  然后再加上typeof() 不就是返回member的数据类型么。再加上前面的const 后面的 * __mptr 。这是个什么意思??我们来个一个假设。假设member返回的数据类型是int。那么是不是就成了const int * __mptr = (ptr)?现在是不是明白了?typeof( ((type *)0)->member ) 这个东西,就是为了要得到member的数据类型。

总结一下:这个就是为了定义一个member类型的指针,并且指向ptr(list_head类型)

b、     (type *)( (char *)__mptr - offsetof(type,member) );

char *__mptr 将__mptr强制转化成char *类型,为什么转化成char* ,就是要获得__mptr指针的地址。而不是其他的类型呢?先来看offsetof这个宏吧。他被定义在/include/linux/stddef.h当中。

#define offsetof(TYPE, MEMBER) (() &()

不着急,还是先从最里面的括号开始看起。(TYPE *)0)->MEMBER 这不是为了获取member么。在加个& 获得他的地址、在加上(size_t) 强制转化成size_t 类型(其实也就是 unsigned int)。现在该注意了。刚才是不是说得到了type类型的指针的地址是0x0 ? 你这里又得到了type类型指针成员member的地址。这个就是member的偏移地址吧!!

在将这两个合并起来看。将获得的__mptr指针的地址 ,减去member成员在其中的偏移量。我看就是member的地址了吧!!O(_)O~

还有一个重要的问题?就是为什么要转化成char*,而不是其他的*char类型的数据不论在什么类型的机器上,存储方式应该只是占了一个字节?因为他的实质是ascii码。这样的话,就好理解了,对char*减一 那就是实实在在的减一个字节;但是你要是对int*减一会实实在在的减多少?是不是4?(32位机器下)。这样一来,你怎么知道他的真实地址??

可以根据下图来理解!!

list.h头文件分析(续)

 

下面再来看看和这个宏很类似的宏

 

#define list_first_entry(ptr, type, member) \

   list_entry((ptr)->next, type, member)

和刚才唯一的区别就是ptr所代表的意思不同了,list_entry这个宏是用来获得链表的入口的。但是这里却是为了得到链表的第一个元素。详细的不再赘述。

 

下来看看这个遍历宏:

#define list_for_each(pos, head) \

   for (pos = (head)->next; prefetch(pos->next), pos != (head); \

          pos = pos->next)

这里prefetch其实还是一个宏,其作用是预取。作用是使得的便利更加快速、高效、安全,我们这里基本上可以不用考虑这些问题,故,再使用的时候可以将该宏去掉。

 

再来看看向前遍历的宏:

 

#define list_for_each_prev(pos, head) \

   for (pos = (head)->prev; prefetch(pos->prev), pos != (head); \

          pos = pos->prev)

跟上面遍历宏一样,其本质还是for循环,结束条件是遍历到了头!!

 

 

具体的双向循环链表就分析到这里,后面的还有一大堆的遍历宏,只不过也就是上面这几种宏的组合使用罢了;更有甚者,考虑了很多的安全性问题;比如:多线程、并发访问一链表等等,这些应该说在用户级别的程序不大会出现这类问题,我们大可不必注意;但是考虑到在OS当中,有很多是用到了链表;比如:在进程调度的时候,就绪队列、等等。在这个时候就不仅仅需要考虑链表的实现问题了,而且还得考虑安全问题!!

 

 

 

 

                               Write by 

阅读(455) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~