2015-04-10/2015-04-13正则 grep sed awk-JohnNagle-ChinaUnix博客

JohnNagle

首页　| 　博文目录　| 　关于我

JohnNagle

博客访问： 89928
博文数量： 51
博客积分： 0
博客等级：民兵
技术积分： 507
用户组：普通用户
注册时间： 2015-03-02 17:11

个人简介

还年轻，还有梦

文章分类

全部博文（51）

学习记录（41）
积累（1）
收藏（8）
未分配的博文（1）

文章存档

2015年（51）

我的朋友

Z_duck

相关博文

2015-04-10/2015-04-13正则 grep sed awk

分类： LINUX

2015-04-13 22:18:13

字符集合：数字[:digit:], 小写字母[:lower:], 大写字母[:upper:], 标点符
号[:puntct:], 空白字符[:space:], 所有字母[:alpha:], 所有字母和数字
[:alnum:]
正则就是有一定规律的字符串，有几个特殊符号很关键（. * + ? | )，我们平时不仅可以用命令行工具grep/sed/awk去引用正则，而且还可以把正则嵌入在nginx、apache、甚至php、python编程语言当中，学好正则可以让你受用无穷！

一、grep/egrep

1. 语法+选项

语法： grep [-cinvABC] 'word' filename

-c ：打印符合要求的行数

-n ：在输出符合要求的行的同时连同行号一起输出

-v ：打印不符合要求的行

-A ：后跟一个数字（有无空格都可以），例如 –A2则表示打印符合要求的行以及下面两行

-B ：后跟一个数字，例如 –B2 则表示打印符合要求的行以及上面两行

-C ：后跟一个数字，例如 –C2 则表示打印符合要求的行以及上下各两行

-r : 会把目录下面所有的文件全部遍历

-o : 只显示被匹配到的字符

-q :过滤但不显示出来（通常用在if判断里）

2. 例子介绍

过滤出带有某个关键词的行并输出行号 grep -n 'root' 1.txt

过滤出不带有某个关键词的行并输出行号grep -n -v 'root' 1.txt

过滤出所有包含数字的行 grep '[0-9]' 1.txt

过滤出所有不包含数字的行 grep -v '[0-9]' 1.txt

去除所有以'#'开头的行 grep -v '^#' 1.txt

去除所有空行和以'#'开头的行 grep -v '^$' 1.txt|grep -v '^#'

过滤出以英文字母开头的行 grep '^[a-zA-Z]' 1.txt

过滤出以非数字开头的行 grep '^[^0-9]' 1.txt

过滤任意一个或多个字符 grep 'r.o' 1.txt; grep 'r*t' 1.txt; grep 'r.*t' 1.txt

. 表示任意一个字符；*表示零个或多个前面的字符；.*表示零个或多个任意字符，空行也包含在内

指定过滤字符次数 grep 'o\{2\}' 1.txt

3. egrep

egrep工具是grep工具的扩展

egrep 'o+' 1.txt 表示1个或1个以上前面字符

egrep 'o?' 1.txt 表示0个或者1个前面字符

egrep 'roo|body' 1.txt 匹配roo或者匹配body

egrep 'r(oo)|(at)o' 1.txt 用括号表示一个整体

egrep '(oo)+' 1.txt 表示1个或者多个 'oo'

4. . * + ? 总结

. 表示任意一个字符（包括特殊字符）

* 表示零个或多个*前面的字符

.* 表示任意个任意字符（包含空行）

+ 表示1个或多个+前面的字符

？表示0个或1个?前面的字符

其中，+ ? grep不支持，egrep才支持。

二. sed

打印指定行 sed '10'p -n 1.txt; sed '1,4'p -n 1.txt; sed '5,$'p -n 1.txt

打印包含某个字符串的行 sed -n '/root/'p 1.txt 可以使用 ^ . * $等特殊符号

-e 可以实现同时进行多个任务 sed -e '/root/p' -e '/body/p' -n 1.txt 也可以用;实现 sed '/root/p; /body/p' -n 1.txt

删除行 sed '/root/d' 1.txt; sed '1d' 1.txt; sed '1,10d' 1.txt

替换 sed '1,2s/ot/to/g' 1.txt, 其中s就是替换的意思，g为全局替换，否则只替换第一次的，/也可以为 #, @ 等

删除所有数字 sed 's/[0-9]//g' 1.txt

删除所有非数字 sed 's/[^0-9]//g' 1.txt

调换两个字符串位置 head -n2 1.txt |sed 's/$root$$.*$$bash$/\3\2\1/'

直接修改文件内容 sed -i 's/ot/to/g' 1.txt

sed练习题：

把/etc/passwd 复制到/root/test.txt，用sed打印所有行
cp /etc/passwd /root/test.txt ;sed -n '1，$'p

打印test.txt的3到10行
sed -n '3,10'p test.txt

打印test.txt 中包含 'root' 的行
sed -n '/root/'p text.txt

删除test.txt 的15行以及以后所有行
sed '15,$'d test.txt

删除test.txt中包含 'bash' 的行
sed '/bash/'d test.txt

替换test.txt 中 'root' 为 'toor'
sed 's/root/root/g' test.txt

替换test.txt中 '/sbin/nologin' 为 '/bin/login'
sed 's#/sbin/nologin#/bin/login#g' test.txt

删除test.txt中5到10行中所有的数字
sed -r '5,10s/[0-9]+//g' test.txt

删除test.txt 中所有特殊字符（除了数字以及大小写字母）
sed -r 's/[^[:alnum:]]//g' test.txt

把test.txt中第一个单词和最后一个单词调换位置
sed -r 's/([a-zA-Z]+)(:.*\/)([a-zA-Z]+)/\3\2\1/g' test.txt
把test.txt中出现的第一个数字和最后一个单词替换位置
sed -r 's/([0-9])(.*\/)([a-Z]+$)/\3\2\1/g' test.txt

把test.txt 中第一个数字移动到行末尾
sed -r 's/([0-9])(.*$)/\2\1/' test.txt

在test.txt 20行到末行最前面加 'aaa:'
sed -r '20,$s/(.*)/aaa:\1/g' test.txt

三. awk

截取文档中的某段 awk -F ':' '{print $1}' 1.txt

也可以使用自定义字符连接每个段 awk -F':' '{print $1"#"$2"#"$3"#"$4}' 1.txt

匹配字符或字符串 awk '/oo/' 1.txt

针对某个段匹配 awk -F ':' '$1 ~/oo/' 1.txt

多次匹配 awk -F ':' '/root/ {print $1,$3}; $1 ~/test/; $3 ~/20/' 1.txt

条件操作符==, >,<,!=,>=;<=

awk -F ':' '$3=="0"' 1.txt;

awk -F ':' '$3>="500"' 1.txt;

awk -F ':' '$7!="/sbin/nologin"' 1.txt;

awk -F ':' '$3<$4' 1.txt ;

awk -F ':' '$3>"5" && $3<"7"' 1.txt

awk -F ':' '$3>"5" || $7=="/bin/bash"' 1.txt

awk内置变量 NF(段数) NR(行数)

head -n3 1.txt | awk -F ':' '{print NF}'

head -n3 1.txt | awk -F ':' '{print $NF}'

head -n3 1.txt | awk -F ':' '{print NR}'

打印20行以后的行awk 'NR>20' 1.txt

awk -F ':' 'NR>20 && $1 ~ /ssh/' 1.txt

更改某个段的值awk -F ':' '$1="root"' 1.txt

数学计算, 把第三段和第四段值相加，并赋予第七段 awk -F ':' '{$7=$3+$4; print $0}' 1.txt

计算第三段的总和 awk -F ':' '{(tot=tot+$3)}; END {print tot}' 1.txt

awk中也可以使用if关键词 awk -F ':' '{if ($1=="root") print $0}' 1.txt

awk练习题

用awk 打印整个test.txt （以下操作都是用awk工具实现，针对test.txt）
awk '{print $0}' test.txt 或者 awk '$0' test.txt

查找所有包含 'bash' 的行
awk '/bash/' test.txt

用 ':' 作为分隔符，查找第三段等于0的行
awk -F: ‘$3==0' test.txt

用 ':' 作为分隔符，查找第一段为 'root' 的行，并把该段的 'root' 换成 'toor' (可以连同sed一起使用)
awk -F : '$1=="root"' test.txt |sed 'sed 's/root/toor/g'

用 ':' 作为分隔符，打印最后一段
awk -F: '{print $NF}' test.txt

打印行数大于20的所有行
awk 'NR>20' test.txt

用 ':' 作为分隔符，打印所有第三段小于第四段的行
awk -F: '$3<$4' test.txt

用 ':' 作为分隔符，打印第一段以及最后一段，并且中间用 '@' 连接（例如，第一行应该是这样的形式 'root@/bin/bash' ）
awk -F: '{print $1"@"$NF}' test.txt

用 ':' 作为分隔符，把整个文档的第四段相加，求和
awk -F: '{(sum=sum+$3)}; END{print sum}' test.txt

阅读(539) | 评论(0) | 转发(0) |

上一篇：Linux特殊符号大全

下一篇：2015-04-15 Linux系统日常管理1

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6