grep 技巧12则-j3kljs02398j-ChinaUnix博客

fishcriedifly.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

j3kljs02398j

博客访问： 87743
博文数量： 8
博客积分： 279
博客等级：二等列兵
技术积分： 125
用户组：普通用户
注册时间： 2011-09-04 16:26

个人简介

http://fishcried.com

文章分类

全部博文（8）

未分配的博文（8）

文章存档

2014年（4）

2011年（4）

我的朋友

相关博文

grep 技巧12则

分类： LINUX

2011-10-06 22:15:23

本文已经迁移到最新内容请查看

<==使用技巧

1. 多个关键字查找

1.1 关键字间 or

i. 使用-e

#包含了string.h或者stdlib.h的头文件
grep -l -e 'string\.h' -e 'stdlib\.h' /usr/include/*.h

-e 选项还可以避免关键字是-开头的导致选项解读失败。

ii. 使用元字符 \|

grep 'strint\.h\|stdlib\.h' /usr/include/*.h
#使用-E 看着舒服
grep -E 'string\.h|stdlig\.h' /usr/include/*.h

iii. 使用-f file

cat >multi_pattern
stdlib\.h
string\.h
grep -l -f multi_pattern /usr/include/*.h

1.2 关键字间 and

i. 通过管道

#同时包含'hello','world'的行
echo hello world | grep '\' | grep '\'

ii. 通过正则 |

grep -E 'pattern1.*pattern2|pattern2.*pattern1

如果包含2个关键字还好，要是n个就有n全排序列种可能！

2. 单词匹配

i. -w(gnu 选项)

grep -w 'main' /usr/include/*.h

这个-w很方便

ii. \<\>

grep '\' /usr/include/*.h

3.善用 -E

-E选项启用 extended expression,正则写起来更加灵活

#查看gcc帮助文件里两个the/that/and/or连在一起的行
man gcc | grep -E '(\|\|\|\) \1'
man gcc | grep -E -w '(the|that|and|or) \1'
#查看gcc帮助文件里含两个连续单词的行
man gcc | grep -E -w '([a-zA-Z] ) \1'

使用-E让书写更方便，省去很多的\,同时功能更强大。

4. 忽略大小写 -i

#查看INT_MAX的值
grep -i 'int_max' /usr/include/limits.h

-i与\n同时使用的乱象

#匹配连续相同单词
echo 'it IT' | grep -i -w -E '([a-z] ) \1'
echo 'it IT' | grep -E -w '([a-zA-Z] ) \1'

这是两个相同的单词吗？是的，因为告诉grep不计大小写的！
有的时候不要光图方便会不准确。

5. 递归查找 -r(posix 未说明)

#查看日志的错误信息
grep -i -w -r -E 'error|failed|failure' /var/log |less

6. 显示匹配行周围行 (posix 未说明)

    B/A/C(before/after/context
    -B n
    -A n
    -C n

7. 取反-v

grep -v -w 'hello' filename

如果没有取反，世界将不再美丽

8. 匹配数 -c

echo aaaa | grep -c 'a'

这个输出是1！因为grep是行匹配的

9. 输出文件名 -l

grep -l -r -i -w 'filename_max' /usr/include/*.h

10. 只输出匹配部分-o (gnu 选项)

echo abcddf |grep -o 'dd'

    可以用于验证自己写的正则

11. 如果是纯字符串搜索，-F 速度更快。

    做个实验：

#用gcc manual生成个纯字符串文件作为搜索关键字
man gcc | tr -cs '[:alpha:]' '\n' >grep.date
wc -l grep.date
97288 #这么多！

#比较不带-F，与带-F
time `man gcc | grep -F -f grep.date > /dev/null`
real 0m0.499s
user 0m0.741s
sys 0m0.056s
time `man gcc | grep -f grep.date > /dev/null`
real 4m9.630s
user 4m7.602s
sys 0m0.713s

    仔细看看时间的对比！
    当纯字符串匹配，尤其是要匹配的字符串非常多，-F不可不用。

12. 在查找进程的时候，利用[]实现同时grep -v grep的功能

    举例：

[Bob]@[Fck_without_U]:[~]-> ps -ef | grep "java -jar"
tdlteman 22023 22006 0 Oct07 ? 00:09:58 java -jar slave.jar
xiabao 31501 30737 0 11:08 pts/8 00:00:00 grep java -jar ###grep 自身也出来了
[Bob]@[Fck_without_U]:[~]-> ps -ef | grep "java -jar" | grep -v grep
tdlteman 22023 22006 0 Oct07 ? 00:09:58 java -jar slave.jar
#grep -v grep 精确结果
[Bob]@[Fck_without_U]:[~]-> ps -ef | grep "[j]ava -jar"
tdlteman 22023 22006 0 Oct07 ? 00:09:58 java -jar slave.jar
#看，神奇的事情发生了

    巧妙！

<==注意事项

1. [a-d] 与 [abcd] 不一定等价

    正则表达式中出现range[]是里面的序列是受字符集和环境变量影响的。典型的，许多 locale 将字符以字典顺序排序，在这些 locale 中， [a-d] 不与 [abcd] 等价；例如它可能与 [aBbCcDd] 等价。