grep 技巧10则-qingshanli1988-ChinaUnix博客

qingshanli1988qingshanli1988.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

qingshanli1988

博客访问： 1333956
博文数量： 273
博客积分： 5865
博客等级：准将
技术积分： 3280
用户组：普通用户
注册时间： 2010-11-11 10:01

文章分类

全部博文（273）

大数据（7）
负载均衡高可用（2）
logstash（3）
编译（3）
git（4）
puppet（0）
Centos（6）
php（6）
mysql（1）
shell（21）
vi（7）
程序员（3）
嵌入式（5）
fedora（5）
windows（3）
考研（4）
study（6）
financial（0）
encourage（3）
linux（55）
ubuntu（16）
firefox（7）
未分配的博文（106）

文章存档

2015年（33）

2014年（11）

2013年（11）

2012年（136）

2011年（32）

2010年（50）

我的朋友

最近访客

推荐博文

grep 技巧10则

分类：

2012-11-20 20:12:16

原文地址：grep 技巧10则作者：j3kljs02398j

本文已经迁移到最新内容请查看

<==使用技巧

1. 多个关键字查找

1.1 关键字间 or

i. 使用-e

#包含了string.h或者stdlib.h的头文件
grep -l -e 'string\.h' -e 'stdlib\.h' /usr/include/*.h

-e 选项还可以避免关键字是-开头的导致选项解读失败。

ii. 使用元字符 \|

grep 'strint\.h\|stdlib\.h' /usr/include/*.h
#使用-E 看着舒服
grep -E 'string\.h|stdlig\.h' /usr/include/*.h

iii. 使用-f file

cat >multi_pattern
stdlib\.h
string\.h
grep -l -f multi_pattern /usr/include/*.h

1.2 关键字间 and

i. 通过管道

#同时包含'hello','world'的行
echo hello world | grep '\' | grep '\'

ii. 通过正则 |

grep -E 'pattern1.*pattern2|pattern2.*pattern1

如果包含2个关键字还好，要是n个就有n全排序列种可能！

2. 单词匹配

i. -w(gnu 选项)

grep -w 'main' /usr/include/*.h

这个-w很方便

ii. \<\>

grep '\' /usr/include/*.h

3.善用 -E

-E选项启用 extended expression,正则写起来更加灵活

#查看gcc帮助文件里两个the/that/and/or连在一起的行
man gcc | grep -E '(\|\|\|\) \1'
man gcc | grep -E -w '(the|that|and|or) \1'
#查看gcc帮助文件里含两个连续单词的行
man gcc | grep -E -w '([a-zA-Z] ) \1'

使用-E让书写更方便，省去很多的\,同时功能更强大。

4. 忽略大小写 -i

#查看INT_MAX的值
grep -i 'int_max' /usr/include/limits.h

-i与\n同时使用的乱象

#匹配连续相同单词
echo 'it IT' | grep -i -w -E '([a-z] ) \1'
echo 'it IT' | grep -E -w '([a-zA-Z] ) \1'

这是两个相同的单词吗？是的，因为告诉grep不计大小写的！
有的时候不要光图方便会不准确。

5. 递归查找 -r(posix 未说明)

#查看日志的错误信息
grep -i -w -r -E 'error|failed|failure' /var/log |less

6. 显示匹配行周围行 (posix 未说明)

    B/A/C(before/after/context
    -B n
    -A n
    -C n

7. 取反-v

grep -v -w 'hello' filename

如果没有取反，世界将不再美丽

8. 匹配数 -c

echo aaaa | grep -c 'a'

这个输出是1！因为grep是行匹配的

9. 输出文件名 -l

grep -l -r -i -w 'filename_max' /usr/include/*.h

10. 只输出匹配部分-o (gnu 选项)

echo abcddf |grep -o 'dd'

    可以用于验证自己写的正则

11. 如果是纯字符串搜索，-F 速度更快。

    做个实验：

#用gcc manual生成个纯字符串文件作为搜索关键字
man gcc | tr -cs '[:alpha:]' '\n' >grep.date
wc -l grep.date
97288 #这么多！

#比较不带-F，与带-F
time `man gcc | grep -F -f grep.date > /dev/null`
real 0m0.499s
user 0m0.741s
sys 0m0.056s
time `man gcc | grep -f grep.date > /dev/null`
real 4m9.630s
user 4m7.602s
sys 0m0.713s

    仔细看看时间的对比！
    当纯字符串匹配，尤其是要匹配的字符串非常多，-F不可不用。

12. 在查找进程的时候，利用[]实现同时grep -v grep的功能

    举例：

[Bob]@[Fck_without_U]:[~]-> ps -ef | grep "java -jar"
tdlteman 22023 22006 0 Oct07 ? 00:09:58 java -jar slave.jar
xiabao 31501 30737 0 11:08 pts/8 00:00:00 grep java -jar ###grep 自身也出来了
[Bob]@[Fck_without_U]:[~]-> ps -ef | grep "java -jar" | grep -v grep
tdlteman 22023 22006 0 Oct07 ? 00:09:58 java -jar slave.jar
#grep -v grep 精确结果
[Bob]@[Fck_without_U]:[~]-> ps -ef | grep "[j]ava -jar"
tdlteman 22023 22006 0 Oct07 ? 00:09:58 java -jar slave.jar
#看，神奇的事情发生了

    巧妙！

<==注意事项

1. [a-d] 与 [abcd] 不一定等价

    正则表达式中出现range[]是里面的序列是受字符集和环境变量影响的。典型的，许多 locale 将字符以字典顺序排序，在这些 locale 中， [a-d] 不与 [abcd] 等价；例如它可能与 [aBbCcDd] 等价。

[iscs@linux-sp1]:/users/iscs>$ echo "ABC
> abc"|grep '[a-c]'
ABC
abc
[iscs@linux-sp1]:/users/iscs>$ echo "ABC
abc"|grep -E '[a-c]'
ABC
abc

    为了提高可移植性:
    1. 使用POSIX定义的字符组
    2. 定义环境变量LC_ALL

2. 匹配 - 开头的关键字如(--shit)grep出错

    如果关键字以-开头，会打乱grep对选项的解析
    解决：
    使用 -e选项或 --

[iscs@linux-sp1]:/users/iscs>$ echo "--shit"|grep --shit
grep: unrecognized option '--shit'
Usage: grep [OPTION]... PATTERN [FILE]...
Try `grep --help' for more information.
[iscs@linux-sp1]:/users/iscs>$ echo "--shit"|grep -- --shit
--shit
[test@test~]$ echo '--shit' | grep -e '--shit'
--shit

阅读(800) | 评论(0) | 转发(0) |

上一篇：高效操作Bash

下一篇：opensuse 使用总结安装配置

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6