大多数时候, linux 内核会把一个变量与一个外部值比较来看某一条件是否已满足,这种比较的结果很大程度上是可以预测的。这样的例子很常见,例如,检查合法性的代码。内核使用 likely 和 unlikely 两个宏分别表示返回的结果是 true(1) 或 false(0) 。这两个宏使用 gcc 可根据它的返回值来优化编译结果的特性来提升代码的性能。
这里有个例子,我们假设调用 do_something() 函数,在出错的情况下,我们调用 handle_error 来处理错误: err = do_something( x, y, z) ;
if ( err)
handle_error( err) ;
如果 do_something 很少出错,我们可以将代码重写为:
err = do_something( x, y, z) ;
if ( unlikely( err) )
handle_error( err) ;
下面具体分析 likely 和 unlikely
if(likely(value)) 等价于 if(value)
也等价于 if(value)
也就是说 likely() 和 unlikely() 从阅读和理解代码的角度来看,是一样的! 这两个宏在内核中定义如下: # define likely( x) __builtin_expect( ( x) , 1)
# define unlikely( x) __builtin_expect( ( x) , 0)
是 GCC (version
>= 2.96 )提供给程序员使用的,目的是将 “ 分支转移 ” 的信息提供给编译器,这样编译器可以对代码进行优化,以减少指令跳转带来的性能下降。
表示 x 的值为真的可能性更大;
__builtin_expect((x),0) 表示 x 的值为假的可能性更大。
也就是说,使用 likely() ,执行 if 后面的语句 的机会更大,使用 unlikely() ,执行 else 后面的语句的机会更大。
第一个例子: example1.c int testfun( int x)
if ( __builtin_expect( x, 0) ) {
/* We instruct the compiler, "else" block is more probable */
x = 5;
x = x * x;
} else {
x = 6;
return x;
在这个例子中,我们认为 x 为 0 的可能性更大。
编译以后,通过 objdump 来观察汇编指令, 结果如下: # gcc - O2 - c example1. c
# objdump - d example1. o
Disassembly of section . text:
00000000 < testfun> :
0: 55 push %ebp
1: 89 e5 mov %esp, % ebp
3: 8b 45 08 mov 0x8( % ebp ) , % eax
6: 85 c0 test %eax , % eax
8: 75 07 jne 11 < testfun+ 0x11>
a: b8 06 00 00 00 mov $0x6, % eax
f: c9 leave 10: c3 ret
11: b8 19 00 00 00 mov $0x19, % eax
16: eb f7 jmp f < testfun+ 0xf>
可以看到,编译器使用的是 jne (不相等跳转)指令,并且 else block 中的代码紧跟在后面。 8: 75 07 jne 11 < testfun+ 0x11>
a: b8 06 00 00 00 mov $0x6, % eax
int testfun( int x)
if ( __builtin_expect( x, 1) ) {
/* We instruct the compiler, "else" block is more probable */
x = 5;
x = x * x;
} else {
x = 6;
return x;
在这个例子中,我们认为 x 不为 0 的可能性更大 。
objdump 来观察汇编指令,结果如下:
# gcc - O2 - c example2. c
# objdump - d example2. o
Disassembly of section . text:
00000000 < testfun> :
0: 55 push %ebp
1: 89 e5 mov %esp, % ebp
3: 8b 45 08 mov 0x8( % ebp ) , % eax
6: 85 c0 test %eax , % eax
8: 74 07 je 11 < testfun+ 0x11>
a: b8 19 00 00 00 mov $0x19, % eax
f: c9 leave
10: c3 ret
11: b8 06 00 00 00 mov $0x6, % eax
16: eb f7 jmp f < testfun+ 0xf>
这次编译器使用的是 je (相等跳转)指令,并且 if block 中的代码紧跟在后面。 8: 74 07 je 11 < testfun+ 0x11> a: b8 19 00 00 00 mov $0x19, % eax
阅读(2280) | 评论(0) | 转发(0) |