SMP系统下的跨cpu函数调用-wangjianchangdx-ChinaUnix博客

wjcdxwjcdx.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

wangjianchangdx

博客访问： 247336
博文数量： 32
博客积分： 557
博客等级：中士
技术积分： 431
用户组：普通用户
注册时间： 2011-04-20 23:05

文章分类

全部博文（32）

Linux.System（3）
LANG.C（1）
GCC.ASM（1）
Linux.Apps（2）
Linux.Kernel（22）
嵌入式（3）
未分配的博文（0）

文章存档

2015年（4）

2014年（2）

2012年（4）

2011年（22）

我的朋友

相关博文

SMP系统下的跨cpu函数调用

分类： LINUX

2015-04-25 00:13:12

原文地址：SMP系统下的跨cpu函数调用作者：MagicBoy2010

最近看Linux kernel中的perf event的实现部分，看到下面的代码，觉得很有意思，记录整理一下(内核版本3.7.2)：

kernel/events/core.c:
L2674-- static u64 perf_event_read(struct perf_event *event)
{

/*
* If event is enabled and currently active on a CPU, update the
* value in the event structure:
*/
if (event->state == PERF_EVENT_STATE_ACTIVE) {

smp_call_function_single(event->oncpu,

__perf_event_read, event, 1);

}
...

}

perf_event_read用于读取一个event的pmu hw counter的值，event subsystem在Linux kernel中的实现还比较复杂，并不单纯如pmu的读写那样简单。函数中的第一个if语句是说如果该event处于active状态，那么读取其在pmu中对应hw counter 寄存器的值。因为event的实现分为task context和cpu context两大类，简言之是在一个task运行的life cycle还是一个cpu lifecycle中对相关的pmu hw counter计数。回到perf_event_read函数，如果我们发现该event目前在某一cpu上属于active状态，那么就进入if语句块中。有意思的是，当我们正在看的这段代码正在运行时，要读的该event并不一定是在当前的cpu上，那怎么办呢？所以要实现一个所谓的cross cpu function call,也即上述代码片段中smp_call_function_single函数的实现，在UP系统中，可以肯定当前代码运行的CPU就是event所在的cpu，所以可以直接调用__perf_event_read函数，这也是UP系统下smp_call_function_single函数的实现原理。
有意思的是SMP系统下smp_call_function_single函数的实现：首先我们要知道当前代码正在上面运行的该CPU的ID（由smp_processor_id()获得），假设4-cpu系统，当前代码正在cpu1上运行，那么调用smp_processor_id返回1，这背后的原理是APIC和per-cpu实现机制的合成。要读取的event有一个成员变量event->oncpu用来指明该event是绑定在哪个cpu上，如果event->oncpu=1，表明执行当前代码的cpu就是event所在的cpu，那么很简单了，直接调用__perf_event_read就可以了。如果event->oncpu!=1，那么要读取的event不在当前的cpu上，如何操控别的cpu来读取pmu中寄存器的值（每个cpu都有自己对应的pmu)，原理其实很简单：IPI (Inter Processor Interrupt)，就是通过local APIC给别的处理器发一个中断消息。但是具体的实现要考虑的东西可能比较多并且全面一点，表现在实际的代码上就不是太直白（直白的实现就是send_ipi这样的函数了）。在Linux内核中，每个cpu都有一个对应的csd_data的变量（很明显是一个per-cpu类型的）：
kernel/smp.c:
static DEFINE_PER_CPU_SHARED_ALIGNED(struct call_single_data, csd_data); // csd means call single data

同时，系统中每个cpu都还拥有各自的一个类型为struct call_single_queue的队列dst（list)，smp_call_function_single（）会根据目标cpu来获得该队列，把前述的csd作为跨cpu参数传递的方法（我怎么觉得获得csd指针最好是用类似__get_cpu_var(csd_data, cpu)这样的方式呢，但是代码中在!wait处使用__get_cpu_var(csd_data)。。。）。不管怎么说吧，跨cpu调用的参数传递方法是用了，然后如果队列dst为空，就调用arch_send_call_function_single_ipi(cpu)给参数所指定的cpu发ipi消息，目标cpu收到该消息进入中断处理函数，那么就调用csd_data->func函数了(其实应该是ipi的中断处理函数处理dst队列中的每个结点，调用每个结点上的func函数指针，所以队列不为空时就没必要再发ipi消息了。

阅读(3969) | 评论(0) | 转发(0) |

上一篇：人机分离

下一篇：Linux kernel IP层报文处理流程

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6