ｇｒｅｐ　详细用法　说明-wsysx-ChinaUnix博客

wsysx的ChinaUnix博客wsysx.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

wsysx

博客访问： 508284
博文数量： 140
博客积分： 461
博客等级：下士
技术积分： 878
用户组：普通用户
注册时间： 2010-06-28 10:06

文章分类

全部博文（140）

开源协议相关事宜（2）
虚拟化与云计算（16）
关于内存（7）
扯淡（2）
ubuntu（2）
网络编程（3）
shell（5）
网络（0）
面试相关（8）
应用小技巧（3）
tcp（2）
赢得未来（7）
linux（30）
未分配的博文（53）

文章存档

2016年（1）

2015年（6）

2014年（20）

2013年（1）

2012年（16）

2011年（96）

我的朋友

最近访客

推荐博文

ｇｒｅｐ　详细用法　说明

分类：

2011-08-24 12:53:03

原文地址：ｇｒｅｐ　详细用法　说明作者：_Go_Home

语　　法：grep [-abcEFGhHilLnqrsvVwxy][-A][-B][-C] [-d][-e][-f][--help][范本样式][文件或目录...]
补充说明：
grep指令用于查找内容包含指定的范本样式的文件,如果发现某文件的内容符合所指定的范本样式,预设grep指令会把含有范本样式的那一列显示出来.若不指定任何文件名称,或是所给予的文件名为"-",则grep指令会从标准输入设备读取数据.

参　　数：
-a或--text 不要忽略二进制的数据.
-A或--after-context= 除了显示符合范本样式的那一列之外,并显示该列之後的内容.
-b或--byte-offset 在显示符合范本样式的那一列之前,标示出该列第一个字符的位编号.
-B或--before-context= 除了显示符合范本样式的那一列之外,并显示该列之前的内容.
-c或--count 计算符合范本样式的列数.
-C或--context=或- 除了显示符合范本样式的那一列之外,并显示该列之前後的内容.
-d或--directories= 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作.
-e或--regexp= 指定字符串做为查找文件内容的范本样式.
-E或--extended-regexp 将范本样式为延伸的普通表示法来使用.
-f或--file= 指定范本文件,其内容含有一个或多个范本样式,让grep查找符合范本条件的文件内容,格式为每列一个范本样式.
-F或--fixed-regexp 将范本样式视为固定字符串的列表.
-G或--basic-regexp 将范本样式视为普通的表示法来使用.
-h或--no-filename 在显示符合范本样式的那一列之前,不标示该列所属的文件名称.
-H或--with-filename 在显示符合范本样式的那一列之前,表示该列所属的文件名称.
-i或--ignore-case 忽略字符大小写的差别.
-l或--file-with-matches 列出文件内容符合指定的范本样式的文件名称.
-L或--files-without-match 列出文件内容不符合指定的范本样式的文件名称.
-n或--line-number 在显示符合范本样式的那一列之前,标示出该列的列数编号.
-q或--quiet或--silent 不显示任何信息.
-r或--recursive 此参数的效果和指定"-d recurse"参数相同.
-s或--no-messages 不显示错误信息.
-v或--revert-match 反转查找.
-V或--version 显示版本信息.
-w或--word-regexp 只显示全字符合的列.
-x或--line-regexp 只显示全列符合的列.
-y 此参数的效果和指定"-i"参数相同.
--help 在线帮助.

2. grep正则表达式元字符集(基本集)

^
锚定行的开始如：'^grep'匹配所有以grep开头的行.
$
锚定行的结束如：'grep$'匹配所有以grep结尾的行.
匹配一个非换行符的字符如：'gr.p'匹配gr后接一个任意字符,然后是p.
*
匹配零个或多个先前字符如：'*grep'匹配所有一个或多个空格后紧跟grep的行. .*一起用代表任意字符.
[]
匹配一个指定范围内的字符,如'[Gg]rep'匹配Grep和grep.
[^]
匹配一个不在指定范围内的字符,如：'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一个字母开头,紧跟rep的行.
(..)
标记匹配字符,如'(love)',love被标记为1.
<
锚定单词的开始,如:'
>
锚定单词的结束,如'grep>'匹配包含以grep结尾的单词的行.
x
重复字符x,m次,如：'0'匹配包含5个o的行.
x
重复字符x,至少m次,如：'o'匹配至少有5个o的行.
x
重复字符x,至少m次,不多于n次,如：'o'匹配5--10个o的行.
w
匹配文字和数字字符,也就是[A-Za-z0-9],如：'Gw*p'匹配以G后跟零个或多个文字或数字字符,然后是p.
W
w的反置形式,匹配一个或多个非单词字符,如点号句号等.
b
单词锁定符,如: 'bgrepb'只匹配grep.

3. 用于egrep和 grep -E的元字符扩展集
+
匹配一个或多个先前的字符.如：'[a-z]+able',匹配一个或多个小写字母后跟able的串,如loveable,enable,disable等.
?
匹配零个或多个先前的字符.如：'gr?p'匹配gr后跟一个或没有字符,然后是p的行.
a|b|c
匹配a或b或c.如：grep|sed匹配grep或sed
()
分组符号,如：love(able|rs)ov+匹配loveable或lovers,匹配一个或多个ov.
x,x,x
作用同x,x,x

4. POSIX字符类
为了在不同国家的字符编码中保持一至,POSIX(The Portable Operating System Interface)增加了特殊的字符类,如[:alnum:]是A-Za-z0-9的另一个写法.要把它们放到[]号内才能成为正则表达式,如[A- Za-z0-9]或[[:alnum:]].在linux下的grep除fgrep外,都支持POSIX的字符类.

[:alnum:]
文字数字字符
[:alpha:]
文字字符
[:digit:]
数字字符
[:graph:]
非空字符(非空格、控制字符)
[:lower:]
小写字符
[:cntrl:]
控制字符
[:print:]
非空字符(包括空格)
[:punct:]
标点符号
[:space:]
所有空白字符(新行,空格,制表符)
[:upper:]
大写字符
[:xdigit:]
十六进制数字(0-9,a-f,A-F)

5. Grep命令选项
-?
同时显示匹配行上下的？行,如：grep -2 pattern filename同时显示匹配行的上下2行.
-b,--byte-offset
打印匹配行前面打印该行所在的块号码.
-c,--count
只打印匹配的行数,不显示匹配的内容.
-f File,--file=File
从文件中提取模板.空文件中包含0个模板,所以什么都不匹配.
-h,--no-filename
当搜索多个文件时,不显示匹配文件名前缀.
-i,--ignore-case
忽略大小写差别.
-q,--quiet
取消显示,只返回退出状态.0则表示找到了匹配的行.
-l,--files-with-matches
打印匹配模板的文件清单.
-L,--files-without-match
打印不匹配模板的文件清单.
-n,--line-number
在匹配的行前面打印行号.
-s,--silent
不显示关于不存在或者无法读取文件的错误信息.
-v,--revert-match
反检索,只显示不匹配的行.
-w,--word-regexp
如果被引用,就把表达式做为一个单词搜索.
-V,--version
显示软件版本信息.

6. 实例
要用好grep这个工具,其实就是要写好正则表达式,所以这里不对grep的所有功能进行实例讲解,只列几个例子,讲解一个正则表达式的写法.

$ ls -l | grep '^a'
通过管道过滤ls -l输出的内容,只显示以a开头的行.

$ grep 'test' d*
显示所有以d开头的文件中包含test的行.

$ grep 'test' aa bb cc
显示在aa,bb,cc文件中匹配test的行.

$ grep '[a-z]' aa
显示所有包含每个字符串至少有5个连续小写字符的字符串的行.

$ grep 'w(es)t.*' aa

如果west被匹配,则es就被存储到内存中,并标记为1,然后搜索任意个字符(.*),这些字符后面紧跟着另外一个es(),找到就显示该行.如果用egrep或grep -E,就不用""号进行转义,直接写成'w(es)t.*'就可以了.

用‘grep’搜索文本文件
如果您要在几个文本文件中查找一字符串,可以使用‘grep’命令.‘grep’在文本中搜索指定的字符串.
假设您正在‘/usr/src/linux/Documentation’目录下搜索带字符串‘magic’的文件：

$ grep magic /usr/src/linux/Documentation/*
sysrq.txt:* How do I enable the magic SysRQ key?
sysrq.txt:* How do I use the magic SysRQ key?

其中文件‘sysrp.txt’包含该字符串,讨论的是 SysRQ 的功能.

默认情况下,‘grep’只搜索当前目录.如果此目录下有许多子目录,‘grep’会以如下形式列出：
grep: sound: Is a directory

这可能会使‘grep’的输出难于阅读.这里有两种解决的办法：

明确要求搜索子目录：grep -r
或忽略子目录：grep -d skip
当然,如果预料到有许多输出,您可以通过管道将其转到‘less’上阅读：
$ grep magic /usr/src/linux/Documentation/* | less

这样,您就可以更方便地阅读.

有一点要注意,您必需提供一个文件过滤方式(搜索全部文件的话用 *).如果您忘了,‘grep’会一直等着,直到该程序被中断.如果您遇到了这样的情况,按 ,然后再试.

下面是一些有意思的命令行参数：
grep -i pattern files ：不区分大小写地搜索.默认情况区分大小写,
grep -l pattern files ：只列出匹配的文件名,
grep -L pattern files ：列出不匹配的文件名,
grep -w pattern files ：只匹配整个单词,而不是字符串的一部分(如匹配‘magic’,而不是‘magical’),
grep -C number pattern files ：匹配的上下文分别显示[number]行,
grep pattern1 | pattern2 files ：显示匹配 pattern1 或 pattern2 的行,
grep pattern1 files | grep pattern2 ：显示既匹配 pattern1 又匹配 pattern2 的行.
这里还有些用于搜索的特殊符号：

\ 分别标注单词的开始与结尾.
例如：
grep man * 会匹配 ‘Batman’、‘manic’、‘man’等,
grep '\
grep '\' 只匹配‘man’,而不是‘Batman’或‘manic’等其他的字符串.
'^'：指匹配的字符串在行首,
'$'：指匹配的字符串在行尾,
如果您不习惯命令行参数,可以试试图形界面的‘grep’,如 reXgrep .这个软件提供 AND、OR、NOT 等语法,还有漂亮的按钮.如果您只是需要更清楚的输出,不妨试试 fungrep .
------------------------
grep的常用命令语法
1. 双引号引用和单引号引用
在grep命令中输入字符串参数时,最好将其用双引号括起来.例如："mystring".这样做有两个原因,一是以防被误解为 shell命令,二是可以用来查找多个单词组成的字符串,例如："jet plane",如果不用双引号将其括起来,那么单词 plane将被误认为是一个文件,查询结果将返回"文件不存在"的错误信息.
在调用变量时,也应该使用双引号,诸如： grep"$ MYVAR"文件名,如果不这样,将
没有返回结果.
在调用模式匹配时,应使用单引号.[root@localhost ]# echo `grep 123 111.txt` (#注意是反单引号)

2. 常用的grep选项有：
-c   只输出匹配行的计数.
-i   不区分大小写(只适用于单字符).
-h   查询多文件时不显示文件名.
-l   查询多文件时只输出包含匹配字符的文件名.
-n   显示匹配行及行号.
-s   不显示不存在或无匹配文本的错误信息.
-v   显示不包含匹配文本的所有行.

3. 特殊的–在多个文件中进行查询
$ grep "sort"*.doc     ( #在当前目录下所有. d o c文件中查找字符串"s o r t")

$ grep "sort it" *      (#或在所有文件中查询单词"sort it")
接下来的所有示例是指在单个文件中进行查询
4. 行匹配
$ grep -c "48″ data.f
$ 4                      (#grep返回数字4,意义是有4行包含字符串"4 8″.)
$ grep "48″ data.f          (#显示包含"4 8″字符串的4行文本)

5. 显示满足匹配模式的所有行行数：
[root@localhost oid2000]# grep -n 1234 111.txt
1:1234
3:1234ab

6. 精确匹配
[root@localhost oid2000]# grep "1234\>" 111.txt
1234

7. 查询空行,查询以某个条件开头或者结尾的行.
结合使用^和$可查询空行.使用- n参数显示实际行数
[root@localhost oid2000]# grep -n "^$" 111.txt    (返回结果 2:   #说明第二行是空行)
[root@localhost oid2000]# grep -n "^abc" 111.txt (#查询以abc开头的行)
[root@localhost oid2000]# grep -n "abc$" 111.txt (#查询以abc结尾的行)

8. 匹配特殊字符,查询有特殊含义的字符,诸如$ . ‘ " * [] ^ | \ + ? ,必须在特定字符前加\.
[root@localhost oid2000]# grep "\." 111.txt (#在111.txt中查询包含"."的所有行)
[root@localhost oid2000]# grep "my\.conf" 111.txt (#查询有文件名my. c o n f的行)

9. 目录的查询
[root@localhost oid2000]# ls -l |grep "^d"      (#如果要查询目录列表中的目录)
[root@localhost oid2000]# ls -l |grep "^d[d]"    (#在一个目录中查询不包含目录的所有文件)
[root@localhost]# ls -l |grpe "^d…..x..x" (#查询其他用户和用户组成员有可执行权限的目录集合)

------------------------
可简单地做如下归纳：

grep命令是linux下的行过滤工具,其参数繁多,下面就一一介绍个个参数的作用,希望对大家有所帮助.

grep -- print lines matching a pattern (将符合样式的该行列出)

◎语法: grep [options]
PATTERN [FILE...]

grep用以在file内文中比对相对应的部分,或是当没有指定档案时,由标准输入中去比对. 在预设的情况下,grep会将符合样式的那一行列出.此外,还有两个程序是grep的变化型,egrep及fgrep.其中egrep就等同于grep -E ,fgrep等同于grep -F .

◎参数
1. -A NUM,--after-context=NUM
除了列出符合行之外,并且列出后NUM行.
示例:   $ grep -A 1 panda file
(从file中搜寻有panda样式的行,并显示该行的后1行)

2. -a或--text
grep原本是搜寻文字文件,若拿二进制的档案作为搜寻的目标,则会显示如下的讯息: Binary file 二进制文件名 matches 然后结束.若加上-a参数则可将二进制档案视为文本文件搜寻,相当于--binary-files=text这个参数.
示例:    (从二进制档案mv中去搜寻panda样式)
(错误!!!)

$ grep panda mv
Binary file mv matches
(这表示此档案有match之处,详见--binary-files=TYPE )

$
(正确!!!)
$ grep -a panda mv

3. -B NUM,--before-context=NUM
与 -A NUM 相对,但这此参数是显示除符合行之外并显示在它之前的NUM行.
示例:    (从file中搜寻有panda样式的行,并显示该行的前1行)
$ grep -B 1 panda file

4. -C [NUM], -NUM, --context[=NUM]
列出符合行之外并列出上下各NUM行,默认值是2.
示例:    (列出file中除包含panda样式的行外并列出其上下2行)
(若要改变默认值,直接改变NUM即可)
$ grep -C[NUM] panda file

5. -b, --byte-offset
列出样式之前的内文总共有多少byte ..
exemple: $ grep -b panda file

显示结果类似于:
0:panda
66:pandahuang
123:panda03

6. --binary-files=TYPE
此参数TYPE预设为binary(二进制),若以普通方式搜寻,只有2种结果:
1.若有符合的地方：显示Binary file 二进制文件名 matches
2.若没有符合的地方：什么都没有显示.

若TYPE为without-match,遇到此参数,grep会认为此二进制档案没有包含任何搜寻样式,与-I 参数相同.若TPYE为text, grep会将此二进制文件视为text档案,与-a 参数相同.
Warning: --binary-files=text 若输出为终端机,可能会产生一些不必要的输出.

7. -c, --count
不显示符合样式行,只显示符合的总行数.
若再加上-v,--invert-match,参数显示不符合的总行数.

8. -d ACTION, --directories=ACTION
若输入的档案是一个资料夹,使用ACTION去处理这个资料夹.
预设ACTION是read(读取),也就是说此资料夹会被视为一般的档案；若ACTION是skip(略过),资料夹会被grep略过：若ACTION是recurse(递归),grep会去读取资料夹下所有的档案,此相当于-r 参数.

9. -E, --extended-regexp
采用规则表示式去解释样式.

10. -e PATTERN, --regexp=PATTERN
把样式做为一个partern,通常用在避免partern用-开始.

11. -f FILE, --file=FILE
事先将要搜寻的样式写入到一个档案,一行一个样式,然后采用档案搜寻.空的档案表示没有要搜寻的样式,因此也就不会有任何符合.
示例: (newfile为搜寻样式文件)
$grep -f newfile file

12. -G, --basic-regexp
将样式视为基本的规则表示式解释.(此为预设)

13. -H, --with-filename
在每个符合样式行前加上符合的文件名称,若有路径会显示路径.
示例: (在file与testfile中搜寻panda样式)
$grep -H panda file ./testfile
file:panda
./testfile:panda

14. -h, --no-filename
与-H参数相类似,但在输出时不显示路径.

15. --help
产生简短的help讯息.

16. -I
grep会强制认为此二进制档案没有包含任何搜寻样式,与--binary-files=without-match参数相同.
示例: $ grep -I panda mv

17. -i, --ignore-case
忽略大小写,包含要搜寻的样式及被搜寻的档案.
示例: $ grep -i panda mv

18. -L, --files-without-match
不显示平常一般的输出结果,反而显示出没有符合的文件名称.

19. -l, --files-with-matches
不显示平常一般的输出结果,只显示符合的文件名称.

20. --mmap
如果可能,使用mmap系统呼叫去读取输入,而不是预设的read系统呼叫.在某些状况,--mmap 能产生较好的效能. 然而,--mmap如果运作中档案缩短,或I/O 错误发生时,可能造成未定义的行为(包含core dump),.

21. -n, --line-number
在显示行前,标上行号.
示例: $ grep -n panda file
显示结果相似于下:
行号:符合行的内容

22. -q, --quiet, --silent
不显示任何的一般输出.请参阅-s或--no-messages

23. -R -r, --recursive
递归地,读取每个资料夹下的所有档案,此相当于 -d recsuse 参数.

24. -s, --no-messages
不显示关于不存在或无法读取的错误讯息.
小注: 不像GNU grep,传统的grep不符合POSIX.2协议,因为缺乏-q参数,且他的-s 参数表现像GNU grep的 -q 参数.
Shell Script倾向将传统的grep移植,避开-q及-s参数,且将输出限制到/dev/null.
POSIX:
定义UNIX及UNIX-like系统需要提供的功能.

25. -V, --version
显示出grep的版本号到标准错误.
当您在回报有关grep的bugs时,grep版本号是必须要包含在内的.

26. -v, --invert-match
显示除搜寻样式行之外的全部.

27. -w, --word-regexp
将搜寻样式视为一个字去搜寻,完全符合该"字"的行才会被列出.

28. -x, --line-regexp
将搜寻样式视为一行去搜寻,完全符合该"行"的行才会被列出.

阅读(492) | 评论(0) | 转发(0) |

上一篇：gcc归纳

下一篇：可重入函数与不可重入函数/转

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6