全部博文(18)
分类: LINUX
2013-04-11 15:01:12
Linux管理员不可不知的命令与工具
对于Linux管理员来说,有很多非常有用的工具可供选择。在这里,我只是列举出其中5个,Linux管理员日常操作都要用到的工具。我认为,功能最强的工具可能并不适合你的使用情况,而且绝对有些工具我还忘了把它们统计进来,如果是这样的话,我恳请大家把我没收录的工具在评论中写出来。另外,本文中提到的工具仅供选择,并不是每个人都一定需要它们,而那些没提到的工具,并不是说Linux管理员就不需要使用,像SSH, SCP这样的工具,每个Linux管理员都必须使用并且没有其他选择。
#5. head/tail命令
大多数情况下,登录服务器的唯一目的是诊断某些问题,常规方法是查看日志。有各种不同应用类型的日志,比如Apache日志、MySQL日志、邮件日志等。那么你用什么命令来查看日志呢,难道不是tail吗?这其实与此类似,我们有时候可以使用“head”命令来查看一个文件的开始几行。
几个例子:
1. *持续检查Apache错误日志文件,可以使用以下命令:
2.
3. $ tail -f /var/log/httpd/error_log
4.
5. *查看MySQL日志中的前15行内容,可以使用以下命令:
6.
7. $ head -15 /var/log/mysqld.log
8.
#4. vi/nano/emacs工具
一般而言,文本编辑器需要频繁地用来创建/更新配置文件。我更喜欢使用vim,使用起来非常舒服,很容易记住它的一些快速编辑命令。
下面是使用vi的几个例子。用vi打开一个文件,而且不进入插入模式(insert mode),那么你可以输入如下所示的有用字符:
1. =>跳至行末
2. $
3. => 跳至行首
4. 0
5. => 删除余下的行
6. D
7. => 重复上一个命令
8. . (点)
9. => 给每行的末尾加上“maal”。1表示第一行,$表示最后一行
10. :1,$ s/$/maal/
11. =>在5至10行的行首加上“bingo”
12. :5,10 s/^/bingo/
13. => 文件在光标之后的内容中如果出现foo,则把它替换成bar
14. :s/foo/bar/g
15. => 删除本行并进入插入模式
16. C
17. => 去掉windows系统文件中的^M
18. :se ff=unix
19. => 开启/关闭行数显示
20. :set nu
21. :set nonu
22. => 显示文件里的实际行数
23. :%!cat -n
24. => 定位光标下面的单词
25. * (星号)
26.
#3. screen命令
在nix世界中,screen命令是尚未得到充分利用的命令之一。打个比方,当你最后一次在远程服务器上执行一个命令时,如果你发现那个命令需要几个小时才能完成,或者当你需要登录10个服务器并检查东西、在它们之间复制文件的时候,突然之间,你的互联网连接重启了,ssh会话也终结了,这时,你就会用到screen命令,而一旦你开始使用这个命令,你就会被它吸引。Screen是一个终端复用器(terminal multiplexer),允许你通过使用一个物理终端来管理多个进程(比如ssh会话)。每个进程都有自己的虚拟窗口,而你可以在跟每个进程交互的虚拟窗口之间来回切换。
我们再深入的解释一下。假设你有许多服务器,理想情况下你应该把ssh(端口22)访问限制放在特定的IP地址上面。这样,你可以登陆一个允许远程IP访问的服务器。此时,你就可以键入“screen”(所有主要的linux版本都安装了screen命令)并开始执行。你会看到一个状态栏,你可以按Ctrl+ac组合键创建新的screen窗口。用Ctrl+an (下一个)和Ctrl+ap(上一个)组合键在窗口之间进行切换。通常,它提供的功能非常有用,比如远程终端会话管理(分离或共享终端会话),无限窗口数量(这与固定的Linux虚拟控制台数量不一样),在窗口之间复制/粘贴,在窗口中显示活动或静止,把终端分割成多个区(横向以及纵向),共享终端等等。
你可以把你的参数保存在.screenrc文件中,下面是我的.screenrc文件一样,在里面我已经重新定义了状态栏的外观和感觉,并且设置了键f5(上一个窗口)和f6(下一个窗口)的含义:
1. $ cat ~/.screenrc
2. #请不要有烦人的铃声
3. vbell on
4.
5. #在挂起时分离
6. autodetach on
7.
8. #不显示版权页
9. startup_message off
10.
11. #模仿.logout消息
12. pow_detach_msg "Screen session of \$LOGNAME \$:cr:\$:nl:ended."
13.
14. #告知$TERMCAP硬状态(窗口列表和时钟)支持
15. termcapinfo xterm* ti@:te@
16.
17. #把每个窗口中的shell设成登录shell
18. shell -$SHELL
19.
20. defscrollback 10000
21.
22. #按照某种序列扩展vt100描述
23.
24. termcap vt* AF=\E[3%dm:AB=\E[4%dm
25. caption always
26. caption string '%{= wk}[ %{k}%H %{k}][%= %{= wk}%?%-Lw%?%{r}(%{r}%n*%f%t%?(%u)%?%{r})%{k}%?%+Lw%?%?%= %{k}][%{b} %d/%m %{k}%c %{k}]'
27.
28. #重新定义按键绑定
29.
30. bind -k F5 prev
31. bind -k F6 next
32.
#2. netstat/nmap命令
这两个命令都是非常有用的命令,它们用来诊断网络问题。当然,ping/traceroute可能是最常用的命令,但是若要说哪个更有效,nmap和netstat命令比基本的ping命令用处要大。Netstat可以显示网络状态,Nmap是一种安全/端口扫描器,也可以说成是网络探索命令。
netstat的例子如下:
1. *显示全部互联网(端口80)连接数量:
2. $ netstat -an |grep :80 |wc -l
3. *显示机器上监听的所有端口:
4. $ netstat -ant | grep LISTEN
5. *在你的LAN上面用nmap命令扫描一个机器,并且获悉它的哪些端口是开放的:
6. $ nmap ip
7.
#1. find和grep命令
日常工作会遇到的问题包括:有多少文件占用了大多数的磁盘空间?删除所有超过两天的临时文件;找出因含有旧服务器名称而引起问题的文件数;把所有后缀名为“.list”的文件改成“.txt”文件。面对这些工作时,命令find和grep会是你最好的朋友。
Find命令用来搜索文件。你可以指定很多选项,比如文件创建日期、或者文件大小要大于你指定的容量等。通常,我们也把find跟xargs或者exec结合起来使用,在find命令返回的文件上执行命令。
find命令的例子:
1. *在/var目录中寻找10个最大的文件:
2. $ find /var -type f -ls | sort -k 7 -r -n | head -10
3.
4. *在/var/log/中寻找大小超过5GB的文件:
5. $ find /var/log/ -type f -size +5120M -exec ls -lh {} \;
6.
7. *寻找今天所有的文件并把它们复制到另外一个目录下面:
8. $ find /home/me/files -ctime 0 -print -exec cp {} /mnt/backup/{} \;
9.
10. *找到所有超过一周的临时文件夹并删除:
11. $ find /temp/ -mtime +7-type f | xargs /bin/rm -f
12.
13. *找到并重命名所有的mp3文件(把文件名字中的大写字母变成小写):
14. $ find /home/me/music/ -type f -name *.mp3 -exec rename 'y/[A-Z]/[a-z]/' '{}' \;
15.
16. grep命令的一些例子:
17. *打印Apache的文件根目录名称:
18. $ grep -i documentroot /etc/httpd/conf/httpd.conf
19.
20. *查看没有评论以及空行的文件内容:
21. $ grep -Ev “^$|^#” /etc/my.cnf
22.
23. *只打印分配给本接口的IP地址:
24. $ ifconfig eth0 | grep 'inet addr:' | cut -d':' -f2 | awk '{ print $1}'
25.
26. *查看某个特定日期发送了多少email消息:
27. $ cat /var/log/maillog | grep "status=sent" | grep "May 25" | wc -l
28.
29. *在进程列表中找出一个正在运行的process/daemon(多谢网友staranneph的提醒):
30. ps -ef | grep mysql
31.
32. *你也可以通过使用上面的命令来注释cpu/men的使用情况,比如像下面的命令输出,你可以看到Plesk的统计进程本身就占用了大于18%的cpu性能:
33. [root@myserver ~]# ps aux | grep statistics
34. root 8183 18.4 0.0 58384 2848 ? D 04:05 3:00 /usr/local/psa/admin/sbin/statistics
35.
linux uptime命令主要用于获取主机运行时间和查询linux系统负载等信息。uptime命令过去只显示系统运行多久。现在,可以显示系统已经运行了多长时间,信息显示依次为:现在时间、系统已经运行了多长时间、目前有多少登陆用户、系统在过去的1分钟、5分钟和15分钟内的平均负载。
uptime命令用法十分简单:直接输入
# uptime
即可。
输入样例:
18:02:41 up 41 days, 23:42, 1 user, load average: 0.00, 0.00, 0.00
1可以被认为是最优的负载值。负载是会随着系统不同改变得。单CPU系统1-3和SMP系统6-10都是可能接受的。
另外还有一个参数 -V ,是用来查询版本的。 (注意是大写的字母v)
[linux @ localhost]$ uptime -V
procps version 3.2.7
[linux @ localhost]$ uptime
显示结果为:
10:19:04 up 257 days, 18:56, 12 users, load average: 2.10, 2.10,2.09
显示内容说明:
10:19:04 //系统当前时间
up 257 days, 18:56 //主机已运行时间,时间越大,说明你的机器越稳定。
12 user //用户连接数,是总连接数而不是用户数
load average // 系统平均负载,统计最近1,5,15分钟的系统平均负载
那么什么是系统平均负载呢? 系统平均负载是指在特定时间间隔内运行队列中的平均进程数。
如果每个CPU内核的当前活动进程数不大于3的话,那么系统的性能是良好的。如果每个CPU内核的任务数大于5,那么这台机器的性能有严重问题。
如果你的linux主机是1个双核CPU的话,当Load Average 为6的时候说明机器已经被充分使用了。
vmstat是一个查看虚拟内存(Virtual Memory)使用状况的工具,使用vmstat命令可以得到关于进程、内存、内存分页、堵塞IO、traps及CPU活动的信息。本文介绍了虚拟内存的运行原理,继而介绍了vmstat的用法和使用范例。
一、前言
很显然从名字中我们就可以知道vmstat是一个查看虚拟内存(Virtual Memory)使用状况的工具,但是怎样通过vmstat来发现系统中的瓶颈呢?在回答这个问题前,还是让我们回顾一下Linux中关于虚拟内存相关内容。
二、虚拟内存运行原理
在系统中运行的每个进程都需要使用到内存,但不是每个进程都需要每时每刻使用系统分配的内存空间。当系统运行所需内存超过实际的物理内存,内核会释放某些进程所占用但未使用的部分或所有物理内存,将这部分资料存储在磁盘上直到进程下一次调用,并将释放出的内存提供给有需要的进程使用。
在Linux内存管理中,主要是通过“调页Paging”和“交换Swapping”来完成上述的内存调度。调页算法是将内存中最近不常使用的页面换到磁盘上,把活动页面保留在内存中供进程使用。交换技术是将整个进程,而不是部分页面,全部交换到磁盘上。
分页(Page)写入磁盘的过程被称作Page-Out,分页(Page)从磁盘重新回到内存的过程被称作Page-In。当内核需要一个分页时,但发现此分页不在物理内存中(因为已经被Page-Out了),此时就发生了分页错误(Page Fault)。
当系统内核发现可运行内存变少时,就会通过Page-Out来释放一部分物理内存。经管Page-Out不是经常发生,但是如果Page-out频繁不断的发生,直到当内核管理分页的时间超过运行程式的时间时,系统效能会急剧下降。这时的系统已经运行非常慢或进入暂停状态,这种状态亦被称作thrashing(颠簸)。
三、使用vmstat
1.用法
vmstat [-a] [-n] [-S unit] [delay [ count]]
vmstat [-s] [-n] [-S unit]
vmstat [-m] [-n] [delay [ count]]
vmstat [-d] [-n] [delay [ count]]
vmstat [-p disk partition] [-n] [delay [ count]]
vmstat [-f]
vmstat [-V]
-a:显示活跃和非活跃内存
-f:显示从系统启动至今的fork数量 。引申閱讀: http://www.cnblogs.com/leoo2sk/archive/2009/12/11/talk-about-fork-in-linux.html
-m:显示slabinfo
-n:只在开始时显示一次各字段名称。
-s:显示内存相关统计信息及多种系统活动数量。
delay:刷新时间间隔。如果不指定,只显示一条结果。
count:刷新次数。如果不指定刷新次数,但指定了刷新时间间隔,这时刷新次数为无穷。
-d:显示磁盘相关统计信息。
-p:显示指定磁盘分区统计信息
-S:使用指定单位显示。参数有 k 、K 、m 、M ,分别代表1000、1024、1000000、1048576字节(byte)。默认单位为K(1024 bytes)
-V:显示vmstat版本信息。
2.使用说明
例子1:每2秒输出一条结果
字段说明:
Procs(进程):
r: 运行队列中进程数量
b: 等待IO的进程数量
Memory(内存):
swpd: 使用虚拟内存大小
free: 可用内存大小
buff: 用作缓冲的内存大小
cache: 用作缓存的内存大小
Swap:
si: 每秒从交换区写到内存的大小
so: 每秒写入交换区的内存大小
IO:(现在的Linux版本块的大小为1024bytes)
bi: 每秒读取的块数
bo: 每秒写入的块数
系统:
in: 每秒中断数,包括时钟中断。
cs: 每秒上下文切换数。
CPU(以百分比表示):
us: 用户进程执行时间(user time)
sy: 系统进程执行时间(system time)
id: 空闲时间(包括IO等待时间)
wa: 等待IO时间
例子2:显示活跃和非活跃内存
使用-a选项显示活跃和非活跃内存时,所显示的内容除增加inact和active外,其他显示内容与例子1相同。
字段说明:
Memory(内存):
inact: 非活跃内存大小(当使用-a选项时显示)
active: 活跃的内存大小(当使用-a选项时显示)
对Linux系统管理员而言,监控系统是很重要的工作。Linux系统监控工具有很多,top是最常用的一个,可以动态观察系统进程状况,方便系统管理员实时了解系统资源现状。本文对top工具的各个参数进行了深入的介绍。
常用热键 |
用途 |
t |
显示摘要信息开关. |
m |
显示内存信息开关. |
A |
分类显示系统不同资源的使用大户。有助于快速识别系统中资源消耗多的任务。 |
f |
添加删除所要显示栏位. |
o |
调整所要显示栏位的顺序. |
r |
调整一个正在运行的进程Nice值. |
k |
结束一个正在运行的进程. |
z |
彩色/黑白显示开关 |
一、相关设定默认值
全局
|
|
|
摘要区
|
|
|
任务区域
|
|
|
注:*标示的设定,可以在启动top时,使用命令行参数覆盖指定参数值。
二、命令行启动参数:
用法: top -hv | -bcisSHM -d delay -n iterations [-u user | -U user] -p pid [,pid ...]
-b : 批次模式运行。通常用作来将top的输出的结果传送给其他程式或储存成文件。
-c : 显示执行任务的命令行。
-d : 设定延迟时间
-h : 帮助
-H : 显示线程。当这个设定开启时,将显示所有进程产生的线程。
-i : 显示空闲的进程。
-n : 执行次数。一般与-b搭配使用
-u : 监控指定用户相关进程
-U : 监控指定用户相关进程
-p : 监控指定的进程。当监控多个进程时,进程ID以逗号分隔。这个选项只能在命令行下使用。
-s : 安全模式操作
-S : 累计时间模式
-v : 显示top版本,然后退出。
-M : 自动显示内存单位(k/M/G)
三、栏位信息
在top中,分别使用26个英文字母对应进程相关信息栏位。可已通过f来添加或移除指定的栏位,通过o来调整对栏位显示顺序。下面我们针对这些栏位进行说明。
a: PID (Process Id):任务的进程ID
b: PPID (Parent Process Pid):父任务的进程ID
c: RUSER (Real User Name):任务的所有者真实名称
d: UID (User Id):任务所有者ID
e: USER (User Name):任务所有者名称
f: GROUP (Group Name):任务所有者群组名
g: TTY (Controlling Tty):终端
h: PR (Priority):优先级
i: NI (Nice value):Nice值
j: P (Last used CPU (SMP)):
k: %CPU (CPU usage):CPU使用率
l: TIME (CPU Time):CPU时间
m: TIME+ (CPU Time, hundredths):CPU时间,精确到秒
n: %MEM (Memory usage (RES)):内存使用率
o: VIRT (Virtual Image (kb)):虚拟内存。VIRT = SWAP + RES
p: SWAP (Swapped size (kb)):交换空间
q: RES (Resident size (kb)):常驻内存。RES = CODE + DATA
r: CODE (Code size (kb)):
s: DATA (Data+Stack size (kb)):
t: SHR (Shared Mem size (kb)):共享内存。
u: nFLT (Page Fault count):
v: nDRT (Dirty Pages count):
w: S (Process Status):进程状态
分别有以下几种:
D = uninterruptible sleep = 不可被唤醒睡眠
R = running = 正在运行中
S = sleeping = 睡眠状态
T = traced or stopped = 出错或停止状态
Z = zombie = 僵尸状态
x: Command (Command line or Program name):进程名或命令行
y: WCHAN (Sleeping in Function):
z: Flags (Task Flags):
示例1:增加和移除进程信息栏位(输入f)
示例2:调整进程信息栏位显示顺序(输入o)
四、交互命令
1.全局命令
回车、空格 : 刷新显示信息
?、h : 帮助
= : 移除所有任务显示的限制
A : 交替显示模式切换
B : 粗体显示切换
d、s : 更改界面刷新时间间隔
G : 选择其它窗口/栏位组
I : Irix或Solaris模式切换
u、U : 监控指定用户相关进程
k : 结束进程
q : 退出top
r : 重新设定进程的nice值
W : 存储当前设定
Z : 改变颜色模板
2.摘要区命令
l : 平均负载及系统运行时间显示开关
m : 内存及交换空间使用率显示开关
t : 当前任务及CPU状态显示开关
1 : 汇总显示CPU状态或分开显示每个CPU状态
3.任务区命令
外观样式
b : 黑体/反色显示高亮的行/列。控制x和y交互命令的顯示樣式。
x : 高亮显示排序的列
y : 高亮显示正在运行的任务
z : 彩色/黑白显示。
显示内容
c : 任务执行的命令行或进程名称
f、o : 增加和移除进程信息栏位及调整进程信息栏位显示顺序
H : 显示线程
S : 时间累计模式
u : 监控指定用户相关进程
任务显示的数量
i : 显示空闲的进程
n或# : 设置任务显示最大数量
任务排序
M : 按内存使用率排序
N : 按PID排序
P : 按CPU使用率排序
T : 按Time+排序
< : 按当前排序栏位左边相邻栏位排序
> : 按当前排序栏位右边相邻栏位排序
F 或 O : 选择排序栏位
R : 反向排序