浅谈时间函数gettimeofday的成本-zhbnx-ChinaUnix博客

绝地苍狼

首页　| 　博文目录　| 　关于我

zhbnx

博客访问： 837451
博文数量： 132
博客积分： 10
博客等级：民兵
技术积分： 2276
用户组：普通用户
注册时间： 2010-12-03 10:50

个人简介

while(!dead) learning++;

文章分类

全部博文（132）

OpneStack（1）
C++（4）
Python（3）
Debug（5）
编程人生（6）
linux App&n（33）
linux C（39）

进程管理（23）
linux OS（29）

linux kerne（23）
linux shell（1）
DataBase--mysql,（0）
Linux天下（11）
未分配的博文（0）

文章存档

2019年（3）

2018年（11）

2017年（12）

2016年（8）

2015年（8）

2014年（4）

2013年（86）

我的朋友

相关博文

浅谈时间函数gettimeofday的成本

分类： LINUX

2016-03-18 14:49:37

原文链接： http://blog.csdn.net/russell_tao/article/details/7185588

我们在程序中会频繁地取当前时间，例如处理一个http请求时，两次调用gettimeofday取差值计算出处理该请求消耗了多少秒。这样的调用无处不在，所以我们有必要详细了解下，gettimeofday这个函数做了些什么？内核1ms一次的时钟中断处理真的可以支持tv_usec字段达到微秒精度吗？它的调用成本在i386/x86_64体系架构上代价一样吗？如果在系统繁忙时，频繁的调用它有问题吗？

gettimeofday是C库提供的函数（不是系统调用），它封装了内核里的sys_gettimeofday系统调用，就是说，归根到底是系统调用。

但是，内核对于x86_64体系结构下，除了普通的系统调用外，还提供了sysenter和vsyscall方式来获取内核态的数据。目前我们使用的操作系统大都是x86_64体系的，如果我们用strace命令跟踪，就会发现gettimeofday命令实际上没有执行系统调用（i386体系会有），这是因为：x86_64体系上，使用vsyscall实现了gettimeofday这个系统调用。具体就是，创建了一个共享的内存页面，它是在内核态的，它的数据由内核来维护，但是，用户态也有权限访问这个内核页面，由此，不通过中断gettimeofday也就拿到了系统时间。

接下来，我来详细回答以上4个问题。

一、gettimeofday做了些什么？

它把内核保存的墙上时间和jiffies综合处理后返回给用户。解释下墙上时间和jiffies是什么：1、墙上时间就是实际时间（1970/1/1号以来的时间），它是由我们主板电池供电的（装过PC机的同学都了解）RTC单元存储的，这样即使机器断电了时间也不用重设。当操作系统启动时，会用这个RTC来初始化墙上时间，接着，内核会在一定精度内根据jiffies维护这个墙上时间。2、jiffies就是操作系统启动后经过的时间，它的单位是节拍数。有些体系架构，1个节拍数是10ms，但我们常用的x86体系下，1个节拍数是1ms。也就是说，jiffies这个全局变量存储了操作系统启动以来共经历了多少毫秒。我们来看看gettimeofday是如何做的。首先它调用了sys_gettimeofday系统调用。

			[cpp] view plaincopy
			
			asmlinkage long sys_gettimeofday(struct timeval __user *tv, struct timezone __user *tz)  
		
			{  
		
			    if (likely(tv != NULL)) {  
		
			        struct timeval ktv;  
		
			        do_gettimeofday(&ktv);  
		
			        if (copy_to_user(tv, &ktv, sizeof(ktv)))  
		
			            return -EFAULT;  
		
			    }  
		
			    if (unlikely(tz != NULL)) {  
		
			        if (copy_to_user(tz, &sys_tz, sizeof(sys_tz)))  
		
			            return -EFAULT;  
		
			    }  
		
			    return 0;  
		
			}

大家看到，它调用do_gettimeofday函数取到当前时间存储到局部变量ktv上，然后调用copy_to_user把结果复制到用户空间。每个体系都有自己的实现，我这里就简单列下x86_64体系下do_gettimeofday的实现：

			[cpp] view plaincopy
			
			void do_gettimeofday(struct timeval *tv)  
		
			{  
		
			    unsigned long seq, t;  
		
			    unsigned int sec, usec;  
		
			    do {  
		
			        seq = read_seqbegin(&xtime_lock);  
		
			        sec = xtime.tv_sec;  
		
			        usec = xtime.tv_nsec / 1000;  
		
			        /* i386 does some correction here to keep the clock  
		
			           monotonous even when ntpd is fixing drift. 
		
			           But they didn't work for me, there is a non monotonic 
		
			           clock anyways with ntp. 
		
			           I dropped all corrections now until a real solution can 
		
			           be found. Note when you fix it here you need to do the same 
		
			           in arch/x86_64/kernel/vsyscall.c and export all needed 
		
			           variables in vmlinux.lds. -AK */   
		
			        t = (jiffies - wall_jiffies) * (1000000L / HZ) +  
		
			            do_gettimeoffset();  
		
			        usec += t;  
		
			    } while (read_seqretry(&xtime_lock, seq));  
		
			    tv->tv_sec = sec + usec / 1000000;  
		
			    tv->tv_usec = usec % 1000000;  
		
			}

大家看到，只是把xtime加以jiffies修正后返回给用户而已。而xtime变量和jiffies的维护更新频率，就决定了时间精度，上面说了，每10或者1ms才处理一次时钟中断，难道精度只到1ms吗？继续往下。

二、内核1ms一次的时钟中断真的可以支持tv_usec字段达到微秒精度吗？
可以，因为这个时间还会由High Precision Event Timer来维护，这个模块会处理微秒级的中断，并更新xtime和jiffies变量。我们看下x86_64体系结构下的维护代码：

			[cpp] view plaincopy
			
			static struct irqaction irq0 = {  
		
			    timer_interrupt, SA_INTERRUPT, CPU_MASK_NONE, "timer", NULL, NULL  
		
			};

这个timer_interrupt函数会处理HPET时间中断，来更新xtime变量。

三、它的调用成本在所有的操作系统上代价一样吗？如果在系统繁忙时，1毫秒内调用多次有问题吗？

最上面已经说了，对于x86_64系统来说，这是个虚拟系统调用vsyscall！所以，这里它不用发送中断！速度很快，成本低，调用一次的成本大概不到一微秒！

对于i386体系来说，这就是系统调用了！最简单的系统调用都有无法避免的成本：陷入内核态。当我们调用gettimeofday时，将会向内核发送软中断，然后将陷入内核态，这时内核至少要做下列事：处理软中断、保存所有寄存器值、从用户态复制函数参数到内核态、执行、将结果复制到用户态。这些成本至少在1微秒以上！

四、关于jiffies值得一提的两点

先看看它的定义：

			[cpp] view plaincopy
			
			volatile unsigned long __jiffies;

只谈两点。

1、它用了一个C语言里比较罕见的关键字volatile，这个关键字用于解决并发问题。C语言编译器很喜欢做优化的，它不清楚某个变量可能会被并发的修改，例如上面的jiffies变量首先是0，如果首先一个CPU修改了它的值为1，紧接着另一个CPU在读它的值，例如 __jiffies = 0; while (__jiffies == 1)，那么在内核的C代码中，如果不加volatile字段，那么第二个CPU里的循环体可能不会被执行到，因为C编译器在对代码做优化时，生成的汇编代码不一定每次都会去读内存！它会根据代码把变量__jiffies设为0，并一直使用下去！而加了volatile字段后，就会要求编译器，每次使用到__jiffies时，都要到内存里真实的读取这个值。

2、它的类型是unsigned long，在32位系统中，最大值也只有43亿不到，从系统启动后49天就到达最大值了，之后就会清0重新开始。那么jiffies达到最大值时的回转问题是怎么解决的呢？或者换句话说，我们需要保证当jiffies回转为一个小的正数时，例如1，要比几十秒毫秒前的大正数大，例如4294967290，要达到jiffies(1)>jiffies(4294967290)这种效果。

内核是通过定义了两个宏来解决的：

			[cpp] view plaincopy
			
			#define time_after(a,b)     \  
		
			    (typecheck(unsigned long, a) && \  
		
			     typecheck(unsigned long, b) && \  
		
			     ((long)(b) - (long)(a) < 0))  
		
			#define time_before(a,b)    time_after(b,a)

很巧妙的设计！仅仅把unsigned long转为long类型后相减比较，就达到了jiffies(1)>jiffies(4294967290)效果，简单的解决了jiffies的回转问题，赞一个。

阅读(1684) | 评论(0) | 转发(0) |

上一篇：linux下epoll如何实现高效处理百万句柄的

下一篇：linux下ping的C语言实现

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6