分类:
2007-04-25 02:42:24
cat $*|
tr –sc A-Za-z ‘\012’| #将相邻的非字符数字转换为换行
sort| #简单单词排序
uniq –c | #将每组相同的单词删成一行,并以其计数为前缀
sort –n | #对计数排序
tail | #选取10个
5 #按5列打印
相关命令
1、tr命令
tr[-csdt] 第一字符集 第二字符集,它的输入来自于标准输入
-c 或--complement:取代所有不属于第一字符集的字符;
-d 删除所有属于第一字符集的字符
-s 把连续重复的字符以单独一个字符表示
-t 先删除第一字符集较第二字符集多出的字符
2、uniq命令
uniq [-cdu][-f<栏位>][-s<字符位置>][-w<字符位置>][--help][--version][输入文件][输出文件]
检查及删除文本文件中重复出现的行列。
参数:
-c或--count 在每列旁边显示该行重复出现的次数。
-d或--repeated 仅显示重复出现的行列。
-f<栏位>或--skip-fields=<栏位> 忽略比较指定的栏位。
-s<字符位置>或--skip-chars=<字符位置> 忽略比较指定的字符。
-u或--unique 仅显示出一次的行列。
-w<字符位置>或--check-chars=<字符位置> 指定要比较的字符。
--help 显示帮助。
--version 显示版本信息。
[输入文件] 指定已排序好的文本文件。
[输出文件] 指定输出的文件。