Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1352254
  • 博文数量: 245
  • 博客积分: 10021
  • 博客等级: 上将
  • 技术积分: 3094
  • 用 户 组: 普通用户
  • 注册时间: 2008-05-12 14:51
文章存档

2011年(2)

2009年(152)

2008年(91)

我的朋友

分类:

2009-01-17 13:59:39

排序命令: sort, wc, uniq

很多时候,我们都会去计算一次资料里头的相同型态的资料总数,举例来说, 使用 last 可以查得这个月份有登入主机者的身份。那么我可以针对每个使用者查出他们的总登入次数吗? 此时就得要排序与计算之类的指令来辅助了!底下我们介绍几个好用的排序与统计指令喔!

# sort
sort 是很有趣的指令,他可以帮我们进行排序,而且可以依据不同的资料型态来排序喔! 例如数字与文字的排序就不一样。此外,排序的字元与语系的编码有关,因此, 如果您需要排序时,建议使用 LC_ALL=C 来让语系统一,资料排序比较好一些。

[root@linux ~]# sort [-fbMnrtuk] [file or stdin]
参数:
-f  :忽略大小写的差异,例如 A 与 a 视为编码相同;
-b  :忽略最前面的空白字元部分;
-M  :以月份的名字来排序,例如 JAN, DEC 等等的排序方法;
-n  :使用‘纯数字’进行排序(预设是以文字型态来排序的);
-r  :反向排序;
-u  :就是 uniq ,相同的资料中,仅出现一行代表;
-t  :分隔符号,预设是 tab 键;
-k  :以那个区间 (field) 来进行排序的意思,
范例:

范例一:个人帐号都记录在 /etc/passwd 下,请将帐号进行排序。
[root@linux ~]# cat /etc/passwd | sort
adm:x:3:4:adm:/var/adm:/sbin/nologin
apache:x:48:48:Apache:/var/www:/sbin/nologin
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
# 我省略很多的输出~由上面的资料看起来, sort 是预设‘以第一个’资料来排序,
# 而且预设是以‘文字’型态来排序的喔!所以由 a 开始排到最后啰!

范例二:/etc/passwd 内容是以 : 来分隔的,我想以第三栏来排序,该如何?
[root@linux ~]# cat /etc/passwd | sort -t ':' -k 3
root:x:0:0:root:/root:/bin/bash
iiimd:x:100:101:IIIMF server:/usr/lib/iiim:/sbin/nologin
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
bin:x:1:1:bin:/bin:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
# 看到特殊字体的输出部分了吧?怎么会这样排列啊?呵呵!没错啦~
# 如果是以文字型态来排序的话,原本就会是这样,想要使用数字排序:
# cat /etc/passwd | sort -t ':' -k 3 -n
# 这样才行啊!用那个 -n 来告知 sort 以数字来排序啊!

范例三:利用 last ,将输出的资料仅取帐号,并加以排序
[root@linux ~]# last | cut -d ' ' -f1 | sort

sort 同样是很常用的指令呢!因为我们常常需要比较一些资讯啦! 举个上面的第二个例子来说好了!今天假设你有很多的帐号,而且你想要知道最大的使用者 ID 目前到哪一号了!呵呵!使用 sort 一下子就可以知道答案咯!当然其使用还不止此啦! 有空的话不妨玩一玩!

# uniq
如果我排序完成了,想要将重复的资料仅列出一个显示,可以怎么做呢?

[root@linux ~]# uniq [-ic]
参数:
-i  :忽略大小写字元的不同;
-c  :进行计数
范例:

范例一:使用 last 将帐号列出,仅取出帐号栏,进行排序后仅取出一位;
[root@linux ~]# last | cut -d ' ' -f1 | sort | uniq

范例二:承上题,如果我还想要知道每个人的登入总次数呢?
[root@linux ~]# last | cut -d ' ' -f1 | sort | uniq -c

这个指令用来将‘重复的行删除掉只显示一个’,举个例子来说, 你要知道这个月份登入你主机的使用者有谁,而不在乎他的登入次数,那么就使用上面的范例, (1)先将所有的资料列出;(2)再将人名独立出来;(3)经过排序;(4)只显示一个! 由于这个指令是在将重复的东西减少,所以当然需要‘配合排序过的档案’来处理啰!

# wc
如果我想要知道 /etc/man.config 这个档案里面有多少字?多少行?多少字元的话, 可以怎么做呢?其实可以利用 wc 这个指令来达成喔!他可以帮我们计算输出的讯息的整体资料!

[root@linux ~]# wc [-lwm]
参数:
-l  :仅列出行;
-w  :仅列出多少字(英文单字);
-m  :多少字元;
范例:

范例一:那个 /etc/man.config 里面到底有多少相关字、行、字元数?
[root@linux ~]# cat /etc/man.config | wc
    138     709    4506
# 输出的三个数字中,分别代表: ‘行、字数、字元数’

范例二:我知道使用 last 可以输出登入者,但是 last 最后两行并非帐号内容,
        那么请问,我该如何以一行指令串取得这个月份登入系统的总人次?
[root@linux ~]# last | grep [a-zA-Z] | grep -v 'wtmp' | wc -l
# 由于 last 会输出空白行与 wtmp 字样在最底下两行,因此,我利用
# grep 取出非空白行,以及去除 wtmp 那一行,在计算行数,就能够瞭解啰!

wc 也可以当作指令?呵呵!这可不是上洗手间的 WC 呢! 这是相当有用的计算档案内容的一个工具组喔!举个例子来说, 当你要知道目前你的帐号档案中有多少个帐号时,就使用这个方法:‘ cat /etc/passwd | wc -l ’啦!因为 /etc/passwd 里头一行代表一个使用者呀! 所以知道行数就晓得有多少的帐号在里头了!而如果要计算一个档案里头有多少个字元时,呵呵!就使用 wc -c 这个参数吧!
阅读(1832) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~