Linux内核对per-cpu变量的实现-embededgood-ChinaUnix博客

嵌入式

首页　| 　博文目录　| 　关于我

embededgood

博客访问： 3074759
博文数量： 523
博客积分： 11908
博客等级：上将
技术积分： 5475
用户组：普通用户
注册时间： 2009-04-03 15:50

文章分类

全部博文（523）

RFID & NFC（2）
设备（2）
WIFI（2）
iPhone（25）

iPhone开发环境（10）

iPhone开发入门（15）
产品解决方案（3）

网络电话（3）
windowsCE（1）
windows（1）

大数据处理（0）
android（42）

Android文件系统（2）

Android boot.img（3）

Android系统移植（1）

Android启动流程（4）

SCons（0）

基础知识（1）

Android的底层库（1）

Android系统开发（24）

Android的linux内（5）

Android系统概述（1）
Linux（220）

linux守护进程（1）

Linux服务器开发（1）

仿真软件QEMU（0）

module_init和mod（4）

linux驱动层和应（4）

web server（1）

ELF格式（0）

断点续传（0）

Linux源代码管理（0）

NAND FLASH（2）

NOR FLASH（1）

MTD设备（1）

spin_lock（3）

linux进程调度（3）

构建文件系统（2）

linux系统移植（1）

linux C库函数（5）

I2C驱动开发（5）

linux-2.6.26内核（3）

IO端口和IO内存（4）

网卡驱动（5）

嵌入式linux应用（4）

linux启动综述（7）

linux下的多线程（3）

Linux下的多进程（4）

linux系统调用函（8）

用户空间和内核空（4）

linux MMU技术（5）

虚拟地址和物理地（5）

linux网络学习笔（0）

linux网络编程（7）

linux驱动分析（1）

Linux内核完全剖（1）

第七篇 Linux的高（5）

第三篇 Linux系统（0）

嵌入式系统程序可（4）

第五篇 Linux内核（15）

第二篇 ARM+Linux（2）

第一篇 Linux主机（1）

嵌入式Linux学习（1）

LCD设备驱动（4）

linux文件系统（7）

udev（4）

串口驱动（8）

Linux内核同步介（2）

中断和下半部（4）

块设备驱动（4）

字符设备驱动（7）

网络基本感念（9）

Linux驱动程序开（0）

Linux内核设计与（5）

linux网络编程（4）

linux内核（10）

linux其它（16）

linux应用程序开（3）

linux设备驱动（10）
电源管理及功耗（3）
总线技术（7）

CAN总线（2）

RS232，485，422（5）
工作生活（23）

大客户销售（2）
软件架构设计（3）
嵌入式图形界面（7）

minigui（2）

QT（4）
嵌入式操作系统（9）

线程（2）
嵌入式软件（85）

malloc和free（6）

this指针（0）

多态（1）

动态链接库（1）

参数传递（1）

XML（5）

基于对象的程序设（5）

表达式（2）

C++primer（2）

结构体与共用体（2）

指针（2）

C语言各种修饰符（13）

C++（7）

C语言（10）

高质量C，C++编程（7）

BSP板级支持包（1）

uboot（2）

bootloader（2）

vivi（4）

数据结构（2）

经典C程序100例（1）

Linux面试题（2）

C语言面试题（5）
vxworks（2）
英语（1）
其它（30）

打工还是创业？（3）

work（14）
嵌入式硬件（48）

PLC（0）

QUALCOMM（1）

Analog Circuit（1）

FPGA/CPLD（2）

MIPS（2）

ARM Cortex-M3（1）

powerpc（1）

xscale（1）

ARM Cortex A8（3）

单片机（13）

PCB布线设计（6）

PC104（1）

ARM（15）
ucos-ii（7）
未分配的博文（0）

文章存档

2019年（3）

2013年（4）

2012年（71）

2011年（78）

2010年（57）

2009年（310）

我的朋友

相关博文

Linux内核对per-cpu变量的实现

分类： LINUX

2019-03-04 23:12:14

原文地址：Linux内核对per-cpu变量的实现作者：MagicBoy2010

在Linux中，per-cpu变量用在多处理器系统中，用来为系统中的每个cpu都生成一个变量的副本，以避开多处理器互斥中的加锁问题，另一个是cpu本地的变量可以充分利用cpu的硬件缓存，提高性能。本贴讨论一下Linux内核对per-cpu变量的代码实现。

1.静态per-cpu变量
静态per-cpu变量通过DEFINE_PER_CPU和DECLARE_PER_CPU宏在内核源码中定义和声明一个per-cpu变量。这些变量与普通变量的主要区别是放在一个特殊的section里。
静态percpu变量比较好理解，内核的代码也比较简洁明快。

相对静态per-cpu变量，还有动态分配的per-cpu变量。普通变量动态分配很简单，用kmalloc或者kzalloc都可以的，其实per- cpu变量的动态分配也是需要利用Linux内核底层的分配函数，页面分配器。从这个角度而言，percpu memory allocator与slab memory allocator是一个层面的东西，都建立在page memory allocator基础之上。不过对于大部分驱动程序员而言，使用kmalloc与kzalloc的机会要远远大于percpu memory allocator。

为了描述，这里做个定义，CPU0与CPU1变量副本的空间大小完全一样，本贴统称这两个副本空间为副本空间，每个CPU变量副本所在空间为单元空间。
在内核初始化期间调用的setup_percpu_areas函数中，reserve和dynamic空间大约定义的大小是8KB和12KB，static空间由系统中定义的静态per-cpu变量的多少来决定。

Linux内核对percpu memory allocator使用了所谓chunk的实现方式，它实现了统一的静态per-cpu和动态per-cpu变量的实现（其实静态per-cpu变量的实现不需要chunk，但是为了统一，也把它放到chunk的管理体系，就算是大一统吧）.

chunk干什么事呢？chunk是一个管理数据结构，就称之为容器吧。看看具体的数据结构还是很有必要：

点击(此处)折叠或打开

struct pcpu_chunk {
struct list_head list; /* linked to pcpu_slot lists */
int free_size; /* free bytes in the chunk */
int contig_hint; /* max contiguous size hint */
void *base_addr; /* base address of this chunk */
int map_used; /* # of map entries used */
int map_alloc; /* # of map entries allocated */
int *map; /* allocation map */
void *data; /* chunk data */
bool immutable; /* no [de]population allowed */
unsigned long populated[]; /* populated bitmap */
};

list:用来把chunk链接起来形成链表。每一个链表又都放到pcpu_slot数组中，根据chunk中空闲空间的大小决定放到数组的哪个元素中。
contig_hint:该chunk所管理的副本空间中空闲空间大小。
base_addr:简单地说，副本空间首地址。副本空间也是由一个chunk来管，称之为first chunk中，副本空间中的dynamic空间用来给动态per-cpu变量使用
map_used：为了对chunk所管理的副本空间分配情况的跟踪，用来表示可以管理的个数
map_alloc:已经分配的小块个数，因为每个分配的小块都是给动态per-cpu使用的，所以其实是已经分配的变量的个数
map:整数数组，用来表示副本空间分配情况。正数表示该空间空闲，负数就已经分配给一个变量了
data:指向分配的页数据
大体上就这些。

动态分配一个per-cpu变量时，在pcpu_slot空间查找空闲空间可以满足需要的chunk，如果找不到这样的chunk，那么重新分配一个chunk，用kzalloc函数。
对一个新的chunk都会调用pcpu_get_vm_areas分配VM空间地址：

点击(此处)折叠或打开

static struct pcpu_chunk *pcpu_create_chunk(void)
{
struct pcpu_chunk *chunk;
struct vm_struct **vms;
chunk = pcpu_alloc_chunk();
if (!chunk)
return NULL;
vms = pcpu_get_vm_areas(pcpu_group_offsets, pcpu_group_sizes,
pcpu_nr_groups, pcpu_atom_size, GFP_KERNEL);
if (!vms) {
pcpu_free_chunk(chunk);
return NULL;
}
chunk->data = vms;
chunk->base_addr = vms[0]->addr - pcpu_group_offsets[0];
return chunk;
} static struct pcpu_chunk *pcpu_create_chunk(void)
{
struct pcpu_chunk *chunk;
struct vm_struct **vms;
chunk = pcpu_alloc_chunk();
if (!chunk)
return NULL;
vms = pcpu_get_vm_areas(pcpu_group_offsets, pcpu_group_sizes,
pcpu_nr_groups, pcpu_atom_size, GFP_KERNEL);
if (!vms) {
pcpu_free_chunk(chunk);
return NULL;
}
chunk->data = vms;
chunk->base_addr = vms[0]->addr - pcpu_group_offsets[0];
return chunk;
}

pcpu_group_offsets[0]对于非变态的系统都是0.

所以，动态分配per-cpu变量时，先在chunk所管理的副本空间(在VM区中)，然后用到哪个页面就往那个对应的vm上提交物理页面。
副本空间上实行小额分配，实际上就是有新变量分配，就在副本空间里头找，找到以后看这个vm处的地址有没有被映射到物理地址，没有就提交页面，否则不提（都提了干吗还提交呢？！），判断vm处是否提交了物理页面用bit map跟踪，chunk的数据结构中的后两个成员用来干这事。

OK，分配一个新变量之后，返回给你的是一个vm区中的地址，要让每个cpu访问到自己的vm区，得用内核自己定义的宏，其实核心思想就是用smp_get_processorid等来获得对应cpu变量在变量副本中的偏移地址，然后返回来了。

要想验证上面说的对不对，可以在内核中打印出alloc_percpu返回的地址，是否在VM区。

FQA

访问per-cpu变量为什么要禁止内核抢占？
这个和进程迁移相关。如果访问per-cpu变量的进程被抢占（如发生中断而重新调度），该进程已经得到自己per-cpu变量副本的偏移地址，当它被恢复执行并有可能迁移到别的CPU上，这时候该偏移地址对新的CPU是无效的。
per-cpu变量还需要保护吗？
per-cpu 变量虽然能保护变量被多个core 访问，但是它并不能保护同一核心上异步事件的访问，如ISR，deferred functions。在这样的情况下，同步原语还是需要的。

----------------------------------------------------
struct module 中有个percpu变量，不知道如何用！
如在load_module 函数实现中：
......
if (pcpuindex) {
/* We have a special allocation for this section. */
percpu = percpu_modalloc(sechdrs[pcpuindex].sh_size,
   sechdrs[pcpuindex].sh_addralign,
   mod->name);
if (!percpu) {
err = -ENOMEM;
goto free_mod;
}
sechdrs[pcpuindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
  mod->percpu = percpu;
......
}
-------------------------------------------------------------------

模块的per-cpu  section是ELF文件中一个特殊的section，属于data区，模块加载时，会根据系统中CPU个数，将这个 section中的数据复制相应的份数，存放在CORE section区域。这个主要在SMP系统中，不同CPU可以访问模块per-cpu section中的数据而无需使用CPU间的互斥机制。
也谈不上什么高级的用法，跟内核中定义的per-cpu变量没有任何区别，只不过平时很少使用到。在模块里面加上
DEFINE_PER_CPU(int, hea);

再readelf -S xxx.ko就可以看到这个per-cpu section了。内核因为自己在初始化时对这些静态定义的per-cpu变量进行了复制，模块因为没有这个阶段，所有由内核模块加载器来完成。此处讨论仅限于静态定义的per-cpu变量，因为动态分配的话，本身就会产生多个副本空间，这个无论对于内核还是模块都完全一样的机制，所以不会有这个问题。

阅读(9365) | 评论(1) | 转发(0) |

上一篇：值得一读的文章

下一篇：我创办优米网犯的几个错误

给主人留下些什么吧！~~

embededgood2019-03-04 23:12:59

好文章

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6