默默的一块石头
分类: LINUX
2022-03-02 16:53:59
最近在使用 time 命令时,无意间发现了一些隐藏的小秘密和强大功能,今天分享给大家。
time 在 Linux 下是比较常用的命令,可以帮助我们方便的计算程序的运行时间,对比采用不同方案时程序的运行性能。看似简单的命令,其实蕴藏着很多细节和技巧,来跟着肖邦一起学习吧。
先来看下最基础的用法,也可能是大家最常见的用法了
root@chopin:~$ time find . -name "chopin.txt"
...... real 0m0.174s user 0m0.084s
sys 0m0.084s
可以很清楚看到,find 命令执行的时间为 0.174s,是不是很简单,很方便呢
不过,time 命令输出了三个参数,我们只用到了第一个参数,其它两个参数代表什么含义呢?
这里我来解释一下:
细心的读者会发现,上述案例中的 user + sys 不等于 real,这是怎么回事呢?
其实上边解释的 user 和 sys,是 cpu 执行指令所消耗的时间,并不包含:进程阻塞 IO、调度排队,这些非 cpu 运行时间。
案例中 find 执行查找文件过程中,会有磁盘 IO 读取,这时 cpu 会被释放出来干别的事情,这些 IO 消耗的时间,是不包含在 user 和 sys 统计数据中,所以就出现了 real 时间大于 user + sys 了。
再通过一个示例来验证并加强我们的理解
root@chopin:~$ time sleep 2 real 0m2.001s user 0m0.000s
sys 0m0.000s
可以清楚地看到,sleep 命令基本上没有消耗 cpu,程序真实的运行时间就是 2 秒
那我们是不是可以得出如下结论了呢:
real >= user + sys
其实这个结论在单个 cpu 情况下,是正确的。
如果服务器是多个 cpu,你的程序正好可以将多个 cpu 充分利用起来,程序运行期间是多核心并行的,那么 user + sys 统计的 cpu 时间可能就会大于 real 时间啦
所以这 3 个时间之间的关系并不是恒定的,你需要清楚的了解服务器是否为多个核心。
其实,通过统计到的 cpu 消耗时间,我们也可以大概知道,程序运行期间 cpu 利用情况。对于单核,计算密集型的程序,real 会很接近 user 和 sys 时间之和的。
Tips:有些同学可能对操作系统可能不太熟悉,这里简单科普下内核态和用户态的基本概念
Linux 为使系统更稳定,采取了隔离保护的措施,运行状态分为内核态和用户态:
time 还有其它功能吗?看一下帮助文档吧
root@chopin:~$ time --help --help: command not found real 0m0.129s user 0m0.084s
sys 0m0.036s
竟然报错,将 --help 当成了命令来执行了,难道 time 就这么点能耐吗?
好吧,我也不卖关子了,直接说答案:你运行的可能是假time。你可能有点懵逼,怎么就假的了。
其实在 Linux 系统上,使用 time 时,你可能会遇到三种版本:
# 1. Bash time is a shell keyword
# 2. Zsh time is a reserved word
# 3. GNU time time is /usr/bin/time
我们当前 Shell 是 Bash,可以通过 type 命令
root@chopin:~$ type time time is a shell keyword
可以看到,我们刚才执行的 time 是 Shell 的内置命令,如果你用的是 zsh,默认使用的 time 也是对应内置命令。
GNU time 命令路径是 /usr/bin/time,一般的 Linux 发行版都带有这个命令,它才是我们今天的猪脚。
GNU time 命令提供了更强大的功能:
下边我们来学习写 GNU time 的使用
1. 最简单的用法
root@chopin:~$ /usr/bin/time sleep 2 0.00user 0.00system 0:02.00elapsed 0%CPU (0avgtext+0avgdata 1784maxresident)k
0inputs+0outputs (0major+72minor)pagefaults 0swaps
使用 GNU time 命令,直接使用绝对路径即可,我们可以看到输出信息更多了,不过格式有点丑,后边会讲如何自定义格式。
2. 保持内置 time 的输出样式
有同学会问,能输出内置 Shell 那种的格式么?可以的,使用 -p 选项即可
root@chopin:~$ /usr/bin/time -p sleep 2 real 2.00 user 0.00 sys 0.00
3. 输出更详细的信息
还可以输出更加详细的信息,让你对程序运行信息一目了然。请使用 -v 选项
root@chopin:~$ /usr/bin/time -v sleep 2 Command being timed: "sleep 2" User time (seconds): 0.00 System time (seconds): 0.00 Percent of CPU this job got: 0% Elapsed (wall clock) time (h:mm:ss or m:ss): 0:02.00 Average shared text size (kbytes): 0 Average unshared data size (kbytes): 0 Average stack size (kbytes): 0 Average total size (kbytes): 0 Maximum resident set size (kbytes): 1804 Average resident set size (kbytes): 0 Major (requiring I/O) page faults: 0 Minor (reclaiming a frame) page faults: 71 Voluntary context switches: 1 Involuntary context switches: 1 Swaps: 0 File system inputs: 0 File system outputs: 0 Socket messages sent: 0 Socket messages received: 0 Signals delivered: 0 Page size (bytes): 4096 Exit status: 0
这里详细介绍下 time 命令输出各项指标
(一)时间相关
(二)内存相关
(三)IO 相关
4. 统计信息输出到文件
如果你希望将 time 统计的信息输出到文件,可以使用 -o 选项
root@chopin:~$ /usr/bin/time -v -o a.txt sleep 2
统计信息直接保存到了 a.txt,如果你希望统计信息能够追加到文件,可以额外加 -a 选项
5. 自定义格式输出
如果命令中内置的输出格式,不符合你的需求,GNU time 可以支持自定义输出格式,通过选项 -f 可以各种指标参数
/usr/bin/time -f "real %e\nuser %U\nsys %S\n" sleep 1 real 1.00 user 0.00 sys 0.00
具体支持的格式,贴心的肖邦已经帮你整理好了
这些格式参数太多了,平时大部分情况用不到,可以收藏起来,以便后期使用时可以快速参考。
看到这么多系统参数指标,难免会有同学会感到疑惑,这些参数能干什么呀?
其实这些指标,对应到操作系统 cpu、内存、IO 这几方面。深刻的理解了这些指标参数,可以帮助你从本质上把握程序的运行情况,甚至可以协助你分析程序的性能瓶颈。
下边我简单解释几个概念,希望能起到抛砖引玉的作用。
(一)CPU 时间
cpu 时间包括:real、user、sys,当 user + sys >= real 时,说明该程序是计算密集型;当 user + sys 远小于 real 时,说明存在较多的 IO 等待。
(二)上下文切换
平时所说的上下文,是指进程的运行环境,包括当时的寄存器值、内存堆栈等信息,内核根据上下文完全恢复一个被打断的进程任务。
当执行系统调用、进程切换时,都会产生上下文切换。切换上下文时,操作系统需要为进程保存和恢复上下文信息。
上下文切换分为主动和被动两种,主动上下文切换多,说明存在较多的阻塞调用;被动上下文切换说明 cpu 使用率高。
当上下文切换过多时,意味着较多的 cpu 时间花费在上下文切换上,导致 cpu 处理进程任务的有效时间大大减少。
(三)缺页异常
次缺页异常较多,说明程序的内存布局相对合理,命中率高;当主缺页异常较多时,说明程序对内存的访问跳跃性大,命中率低。
处理缺页异常和切换上下文的时间,不包含在 user 和 sys 中,当发现 user + sys 远小于 real 时,则很可能大部分时间都消耗在这些地方,需要重点分析这两点。