Linux AS3.0 top命令的Load average 含义及性能参考基值-liyongfeng410799624-ChinaUnix博客

Chinaunix首页 | 论坛 | 博客

首页　| 　博文目录　| 　关于我

liyongfeng410799624

博客访问： 1019993
博文数量： 195
博客积分： 4890
博客等级：上校
技术积分： 2221
用户组：普通用户
注册时间： 2009-06-09 15:34

文章分类

全部博文（195）

虚拟化（3）
视频知识（9）
个人站点（8）
EPON（1）
PHP（6）
投资理财（2）
数据库（18）
AIX（2）
实用软件（4）
服务器硬件（8）
存储问题（3）
linux shell（24）
windows技巧（3）
心情日记（7）
其他知识（9）
土人日志（0）
linux系统管理（69）
网络（18）
未分配的博文（1）

文章存档

2014年（1）

2013年（8）

2012年（22）

2011年（9）

2010年（54）

2009年（101）

我的朋友

wang2kk

最近访客

推荐博文

相关博文

Linux AS3.0 top命令的Load average 含义及性能参考基值

分类： LINUX

2010-03-03 16:24:22

$ uptime
11:12:26 up 3:44, 4 users, load average: 0.38, 0.31, 0.19

系统平均负载被定义为在特定时间间隔内运行队列中的平均进程树。如果一个进程满足以下条件则其就会位于运行队列中：

它没有在等待I/O操作的结果
它没有主动进入等待状态(也就是没有调用'wait')
没有被停止(例如：等待终止)

上面的输出，load average后面分别是1分钟、5分钟、15分钟的负载情况。数据是每隔5秒钟检查一次活跃的进程数，然后根据这个数值算出来的。如果这个数除以CPU的数目，结果高于5的时候就表明系统在超负荷运转了。其算法(摘自Linux 2.4的内核代码)如下：

文件: include/linux/sched.h:

#define FSHIFT 11 /* nr of bits of precision */
#define FIXED_1 (1<>= FSHIFT;

文件: kernel/timer.c:

unsigned long avenrun[3];

static inline void calc_load(unsigned long ticks)
{
  unsigned long active_tasks; /* fixed-point */
  static int count = LOAD_FREQ;

  count -= ticks;
  if (count < 0) {
    count += LOAD_FREQ;
    active_tasks = count_active_tasks();
    CALC_LOAD(avenrun[0], EXP_1, active_tasks);
    CALC_LOAD(avenrun[1], EXP_5, active_tasks);
    CALC_LOAD(avenrun[2], EXP_15, active_tasks);
  }
}

文件: fs/proc/proc_misc.c:

#define LOAD_INT(x) ((x) >> FSHIFT)
#define LOAD_FRAC(x) LOAD_INT(((x) & (FIXED_1-1)) * 100)

static int loadavg_read_proc(char *page, char **start, off_t off,
int count, int *eof, void *data)
{
  int a, b, c;
  int len;

  a = avenrun[0] + (FIXED_1/200);
  b = avenrun[1] + (FIXED_1/200);
  c = avenrun[2] + (FIXED_1/200);
  len = sprintf(page,"%d.%02d %d.%02d %d.%02d %ld/%d %d\n",
  LOAD_INT(a), LOAD_FRAC(a),
  LOAD_INT(b), LOAD_FRAC(b),
  LOAD_INT(c), LOAD_FRAC(c),
  nr_running(), nr_threads, last_pid);
  return proc_calc_metrics(page, start, off, count, eof, len);
}

Linux系统Load average负载详细解释　我们知道判断一个系统的负载可以使用top，uptime等命令去查看，它分别记录了一分钟、五分钟、以及十五分钟的系统平均负载

　　例如我的某台服务器：

　　$ uptime

　　09:50:21 up 200 days, 15:07, 1 user, load average: 0.27, 0.33, 0.37

　　大部分的人都认为这个数字越小越好，其实有很多关联的提示信息，今天看到这个好文，应该可以给大家说清楚很多问题，转一下：

　　原文链接： http://blog.scoutapp.com/articles/2009/07/31/understanding-load-averages

　　你可能对于 Linux 的负载均值（load averages）已有了充分的了解。负载均值在 uptime 或者 top 命令中可以看到，它们可能会显示成这个样子：

　　load average: 0.09, 0.05, 0.01

　　很多人会这样理解负载均值：三个数分别代表不同时间段的系统平均负载（一分钟、五分钟、以及十五分钟），它们的数字当然是越小越好。数字越高，说明服务器的负载越大，这也可能是服务器出现某种问题的信号。

　　而事实不完全如此，是什么因素构成了负载均值的大小，以及如何区分它们目前的状况是 “好”还是“糟糕”？什么时候应该注意哪些不正常的数值？

　　回答这些问题之前，首先需要了解下这些数值背后的些知识。我们先用最简单的例子说明，一台只配备一块单核处理器的服务器。

　　行车过桥

　　一只单核的处理器可以形象得比喻成一条单车道。设想下，你现在需要收取这条道路的过桥费 — 忙于处理那些将要过桥的车辆。你首先当然需要了解些信息，例如车辆的载重、以及还有多少车辆正在等待过桥。如果前面没有车辆在等待，那么你可以告诉后面的司机通过。如果车辆众多，那么需要告知他们可能需要稍等一会。

　　因此，需要些特定的代号表示目前的车流情况，例如：

　　0.00 表示目前桥面上没有任何的车流。实际上这种情况与 0.00 和 1.00 之间是相同的，总而言之很通畅，过往的车辆可以丝毫不用等待的通过。

　　1.00 表示刚好是在这座桥的承受范围内。这种情况不算糟糕，只是车流会有些堵，不过这种情况可能会造成交通越来越慢。

　　超过 1.00，那么说明这座桥已经超出负荷，交通严重的拥堵。那么情况有多糟糕？例如 2.00 的情况说明车流已经超出了桥所能承受的一倍，那么将有多余过桥一倍的车辆正在焦急的等待。3.00 的话情况就更不妙了，说明这座桥基本上已经快承受不了，还有超出桥负载两倍多的车辆正在等待。

　　上面的情况和处理器的负载情况非常相似。一辆汽车的过桥时间就好比是处理器处理某线程的实际时间。Unix 系统定义的进程运行时长为所有处理器内核的处理时间加上线程在队列中等待的时间。

　　和收过桥费的管理员一样，你当然希望你的汽车（操作）不会被焦急的等待。所以，理想状态下，都希望负载平均值小于 1.00 。当然不排除部分峰值会超过 1.00，但长此以往保持这个状态，就说明会有问题，这时候你应该会很焦急。

　　“所以你说的理想负荷为 1.00 ？”

　　嗯，这种情况其实并不完全正确。负荷 1.00 说明系统已经没有剩余的资源了。在实际情况中，有经验的系统管理员都会将这条线划在 0.70：

　　“需要进行调查法则”：如果长期你的系统负载在 0.70 上下，那么你需要在事情变得更糟糕之前，花些时间了解其原因。

　　“现在就要修复法则”：1.00 。如果你的服务器系统负载长期徘徊于 1.00，那么就应该马上解决这个问题。否则，你将半夜接到你上司的电话，这可不是件令人愉快的事情。

　　“凌晨三点半锻炼身体法则”：5.00。如果你的服务器负载超过了 5.00 这个数字，那么你将失去你的睡眠，还得在会议中说明这情况发生的原因，总之千万不要让它发生。

阅读(1467) | 评论(1) | 转发(0) |

0

上一篇：网络编辑所指的PV/UV/PR

下一篇：利用U盘加载控制器驱动来安装Linux系统

给主人留下些什么吧！~~

chinaunix网友2011-03-20 15:23:59

学习了，多谢楼主分享哦!也欢迎广大linux爱好者来我的论坛一起讨论arm哦！www.lt-net.cn

回复 | 举报

关于我们 | 关于IT168 | 联系方式 | 广告合作 | 法律声明 | 免费注册

Copyright 2001-2010 ChinaUnix.net All Rights Reserved 北京皓辰网域网络信息技术有限公司. 版权所有

感谢所有关心和支持过ChinaUnix的朋友们