文本过滤
1.正则表达式
一种用来描述文本模式的特殊语法
由普通字符(例如字符a到z)以及特殊字符(称为元字符,例如/,*,?等)组成
匹配字符串
文本过滤工具在某种模式下都支持正则表达式
基本元字符及其含义
^ 只匹配行首
$ 只匹配行尾
* 匹配0个或者多个单字符
[] 只匹配[]中的字符.可以是单字符,也可以是字符序列.可以使用-表示[]内字符序列范围,如用[1-5]代替
[12345]
\ 用来屏蔽一个元字符的特殊含义
. 匹配任意单个字符
touble$ --匹配以单词touble
^$ --匹配空行
^.$ --匹配包含一个字符的行
特殊字符
" ' || ^ * +
使用\屏蔽一个特殊字符
\*\.pas 正则表达式中匹配以*.pas结尾的所有字符或文件
用\{\}匹配模式结果出现的次数
A\{2\}B A出现两次;AAB
A\{2,\}B A至少出现两次;AAB AAAB AAAAAB......
A\{2,4\}B A出现2-4次;AAB AAAB AAAAB
[0-9]\{3\}\.[0-9]\{3\}\.[0-9]\{3\}\.[0-9]\{3\} 匹配IP地址
find命令形式,find命令选项
grep介绍
grep是unix和linux中使用最广泛的命令之一
对文本进行模式查找
grep命令选项
-c 只输出匹配行的计数
-i 不区分大小写(只适用于单字符)
-h 查询多文件时不显示文件名
-H 显示文件名
-I 查询多文件时只输出包含匹配字符的文件名
-n 显示匹配行及行号
-s 不显示不存在或者不匹配文本的错误信息
-v 显示不包括匹配字符的所有行
阅读(872) | 评论(0) | 转发(0) |