分类: LINUX
2009-07-12 14:11:46
程序在使用一个函数之前,应该首先声明该函数。为了便于使用,通常的做法是把同一类函数或数据结构以及常数的声明放在一个头文件(header file)中。头文件中也可以包括任何相关的类型定义和宏(macros)。在程序源代码文件中则使用预处理指令“#include”来引用相关的头文件。
程序中如下形式的一条控制行语句将会使得该行被文件filename的内容替换掉:
# include
当然,文件名filename中不能包含 > 和换行字符以及 "、'、\、或 /* 字符。编译系统会在定义的一系列地方搜索这个文件。类似地,下面形式的控制行会让编译器首先在源程序所在目录中搜索filename文件:
# include "filename"
如果没有找到,编译器再执行同上面一样的搜索过程。在这种形式中,文件名filename中不能包含换行字符和 "、'、\、或 /* 字符,但允许使用 > 字符。
在一般应用程序源代码中,头文件与开发环境中的库文件有着不可分割的紧密联系,库中的每个函数都需要在头文件中加以声明。应用程序开发环境中的头文件(通常放置在系统/usr/include/目录中)可以看作是其所提供函数库(例如libc.a)中函数的一个组成部分,是库函数的使用说明或接口声明。在编译器把源代码程序转换成目标模块后,链接程序(linker)会把程序所有的目标模块组合在一起,包括用到的任何库文件中的模块。从而构成一个可执行的程序。
对于标准C函数库来讲,其最基本的头文件有15个。每个头文件都表示出一类特定函数的功能说明或结构定义,例如I/O操作函数、字符处理函数等。有关标准函数库的详细说明及其实现可参照Plauger编著的《The Standard C Library》一书。
而对于本书所描述的内核源代码,其中涉及的头文件则可以看作是对内核及其函数库所提供服务的一个概要说明,是内核及其相关程序专用的头文件。在这些头文件中主要描述了内核所用到的所有数据结构、初始化数据、常数和宏定义,也包括少量的程序代码。除了几个专用的头文件以外(例如块设备头文件blk.h),Linux 0.12内核中所用到的头文件都放在内核代码树的include/目录中。因此编译Linux 0.12内核无需使用开发环境提供的位于/usr/include/目录下的任何头文件。当然,tools/build.c程序除外。因为这个程序虽然被包含在内核源代码树中,但它只是一个用于组合创建内核映像文件的工具程序或应用程序,不会被链接到内核代码中。
从0.95版开始,内核代码树中的头文件需要复制到/usr/include/linux目录下才能顺利地编译内核。即从该版内核开始头文件已经与开发环境使用的头文件合二为一。
14.1 include/目录下的文件
内核所用到的头文件都保存在include/目录下。该目录下的文件如表11-1所示。这里需要说明一点:为了方便使用和兼容性,Linus在编制内核程序头文件时所使用的命名方式与标准C库头文件的命名方式相似,许多头文件的名称甚至其中的一些内容都与标准C库的头文件基本相同,但这些内核头文件仍然是内核源代码或与内核有紧密联系的程序专用的。在一个Linux系统中,它们与标准库的头文件并存。通常的做法是将这些头文件放置在标准库头文件目录中的子目录下,以让需要用到内核数据结构或常数的程序使用。
另外,也由于版权问题,Linus试图重新编制一些头文件以取代具有版权限制的标准C库的头文件。因此这些内核源代码中的头文件与开发环境中的头文件有一些重叠的地方。在Linux系统中,列表14-1中的asm/、linux/和sys/三个子目录下的内核头文件通常需要复制到标准C库头文件所在的目录(/usr/include)中,而其他一些文件若与标准库的头文件没有冲突则可以直接放到标准库头文件目录下,或者改放到这里的三个子目录中。
asm/目录下主要用于存放与计算机体系结构密切相关的函数声明或数据结构的头文件。例如Intel CPU 端口IO汇编宏文件io.h、中断描述符设置汇编宏头文件system.h等。linux/目录下是Linux内核程序使用的一些头文件。其中包括调度程序使用的头文件sched.h、内存管理头文件mm.h和终端管理数据结构文件tty.h等。而sys/目录下存放着几个与内核资源相关头文件。不过从0.98版开始,内核目录树下sys/目录中的头文件被全部移到了linux/目录下。
Linux 0.12版内核中共有32个头文件(*.h),其中asm/子目录中含有4个,linux/子目录中含有10个,sys/子目录中含有5个。从下一节开始我们首先描述include/目录下的13个头文件,然后依次说明每个子目录中的文件。说明顺序按照文件名称排序进行。
14.2 a.out.h文件
14.2.1 功能描述
在Linux 内核中,a.out.h文件用于定义被加载的可执行文件结构。主要用于加载程序fs/exec.c中。该文件不属于标准C库,它是内核专用的头文件。但由于与标准库的头文件名没有冲突,因此在Linux系统中一般可以放/usr/include/目录下,以供涉及相关内容的程序使用。该头文件中定义了目标文件的一种a.out(Assembly out)格式。Linux 0.12系统中使用的.o文件和可执行文件就采用了这种目标文件格式。
a.out.h文件包括三个数据结构定义和一些相关的宏定义,因此文件可被相应地分成三个部分:
◆第1~108行给出并描述了目标文件执行头结构和相关的宏定义。
◆第109~185行对符号表项结构的定义和说明。
◆第186~217行对重定位表项结构进行定义和说明。
由于该文件内容比较多,因此对其中三个数据结构以及相关宏定义的详细说明放在程序列表后。
从0.96版内核开始,Linux系统直接采用了GNU的同名头文件a.out.h。因此造成在Linux 0.9x下编译的程序不能在Linux 0.1x系统上运行。下面对两个a.out头文件的不同之处进行分析,并说明如何让0.9x下编译的一些不是用动态链接库的执行文件也能在0.1x下运行。
Linux 0.12使用的a.out.h文件与GNU同名文件的主要区别在于exec结构的第一个字段a_magic。GNU的该文件字段名称是a_info,并且把该字段又分成3个子域:标志域(Flags)、机器类型域(Machine Type)和魔数域(Magic Number)。同时为机器类型域定义了相应的宏N_MACHTYPE和N_FLAGS,如图14-1所示。
在Linux 0.9x系统中,对于采用静态库连接的执行文件,图中各域注释中括号内的值是该字段的默认值。这种二进制执行文件开始处的4个字节是:
0x0b, 0x01, 0x64, 0x00
而这里的头文件仅定义了魔数域。因此,在Linux 0.1x系统中一个a.out格式的二进制执行文件开始的4个字节是:
0x0b, 0x01, 0x00, 0x00
可以看出,采用GNU的a.out格式的执行文件与Linux 0.1x系统上编译出的执行文件的区别仅在机器类型域。因此我们可以把Linux 0.9x上的a.out格式执行文件的机器类型域(第3个字节)清零,让其运行在0.1x系统中。只要被移植的执行文件所调用的系统调用都已经在0.1x系统中实现即可。在开始重新组建Linux 0.1x根文件系统中的很多命令时,作者就采用了这种方法。
在其他方面,GNU的a.out.h头文件与这里的a.out.h没有什么区别。