Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1379028
  • 博文数量: 112
  • 博客积分: 7112
  • 博客等级: 少将
  • 技术积分: 1299
  • 用 户 组: 普通用户
  • 注册时间: 2007-05-31 16:27
文章分类

全部博文(112)

文章存档

2011年(19)

2010年(20)

2009年(16)

2008年(20)

2007年(37)

分类: LINUX

2007-11-09 23:27:42

Comm命令 

如果想对两个有序的文件进行比较,可以使用comm命令。 

语法:comm [- 123 ] file1 file2 

说明:该命令是对两个已经排好序的文件进行比较。其中file1和file2是已排序的文件。comm读取这两个文件,然后生成三列输出:仅在file1中出现的行;仅在file2中出现的行;在两个文件中都存在的行。如果文件名用“- ”,则表示从标准输入读取。 

选项1、2或3抑制相应的列显示。
例如comm - 12就只显示在两个文件中都存在的行
   comm - 23只显示在第一个文件中出现而未在第二个文件中出现的行;
   comm - 123则什么也不显示。
 
  # comm -23  b   a  >c    ##只显示只在b中 不在a中的所有b中的行
注意:使用这个命令前一定要用sort uniq进行排序及除重

不过awk这个优秀的命令也能做到还不用排序处理

awk 'NR==FNR{a[$0]++} NR>FNR&&!a[$0]' file1 file2   找出文件2中不同的值
awk 'NR==FNR{a[$0]++} NR>FNR&&a[$0]'  file1 file2   找出两文件中相同的值

awk  'NR==FNR{a[$0]}NR>FNR{ if(!($1 in a)) print $0}' file1 file2 找出文件2中不同的值
awk  'NR==FNR{a[$0]}NR>FNR{ if($1 in a)    print $0}' file1 file2 找出两文件中相同的值

 
----------------------------------------------------
Diff命令 

该命令的功能为逐行比较两个文本文件,列出其不同之处。它比comm命令完成更复杂的检查。它对给出的文件进行系统的检查,并显示出两个文件中所有不同的行,不要求事先对文件进行排序。 

语法:diff [选项] file1 file2 

说明:该命令告诉用户,为了使两个文件file1和file2一致,需要修改它们的哪些行。如果用“- ”表示file1或fiie2,则表示标准输入。如果file1或file2是目录,那么diff将使用该目录中的同名文件进行比较。例如: 

diff /usr/xu mine 

把目录/usr/xu 中名为mine的文件与当前目录中的mine文件进行比较。 

通常输出由下述形式的行组成: 

n1 a n3,n4 

n1,n2 d n3 

n1,n2 c n3,n4 

这些行类似ed命令把filel转换成file2。字母(a、d和c)之前的行号(n1,n2)是针对file1的,其后面的行号(n3,n4)是针对file2的。字母a、d和c分别表示附加、删除和修改操作。 

在上述形式的每一行的后面跟随受到影响的若干行,以“<”打头的行属于第一个文件,以“>”打头的行属于第二个文件。 

diff能区别块和字符设备文件以及FIFO(管道文件),不会把它们与普通文件进行比较。 

如果file1和file2都是目录,则diff会产生很多信息。如果一个目录中只有一个文件,则产生一条信息,指出该目录路径名和其中的文件名。 

diff各选项的含义如下: 

- b 忽略行尾的空格,而字符串中的一个或多个空格符都视为相等。如How are you与How are you被视为相同的字符串。 

- c 采用上下文输出格式(提供三行上下文)。 

- C n 采用上下文输出格式(提供n行上下文)。 

- e 产生一个合法的ed脚本作为输出。 

- r 当file1和file2是目录时,递归作用到各文件和目录上。 
阅读(2675) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~