Chinaunix首页 | 论坛 | 博客
  • 博客访问: 73868
  • 博文数量: 26
  • 博客积分: 1070
  • 博客等级: 少尉
  • 技术积分: 285
  • 用 户 组: 普通用户
  • 注册时间: 2009-04-27 09:32
文章分类

全部博文(26)

文章存档

2011年(1)

2010年(3)

2009年(22)

我的朋友

分类: LINUX

2009-08-06 20:19:28

统计一个文件中特定字符的个数
统计一个文件中某个字符串的个数,其实就是在在一块沙地里面找石头,有的人看到石头以后,在上面做个标记(grep),然后记住自己做了多少个标记;有的 人看到石头以后,把它挖了(tr),最后统计自己挖了多少石头;有的人看到石头以后,把它跳过去(awk),然后统计自己跳了多少次。

这是我用的的文件

[code]
[root@bzhou test]# cat file
hafsdha
hahafsdfsdhaha
haha
[/code]

我想匹配的是‘haha’这个字符串

1.grep的-o选项
[code]
[root@bzhou test]# grep -c 'haha' file
2
[/code]

最开始的时候是用-c这个选项,不过-c只能统计一行的,如果一行里面有多个匹配的字符串,那-c就无能为力了。
这个是正确的

[code]
[root@bzhou test]# grep -o 'haha' file | wc -l
3
[/code]

2. awk
这个东西要感谢CU上的blackold。
[code]
[root@bzhou test]# awk -v RS='haha' 'END {print --NR}' file
[/code]
-v 去设定一个变量的值,RS是记录的分隔符,默认的是新行(\n),就是说awk按照一行一行读数据,但是现在RS为'haha'后,就按'haha'读数据了,NR为已读的记录数,n个记录是被n-1个分隔符分开的,所以就是--NR了。

3.tr
严格意义上说,tr匹配不了字符串,只能去匹配单个字符。这里就匹配这个文件中‘h’的个数。
[code]
[root@bzhou test]# tr -cd 'h' 8
[root@bzhou test]# grep -o 'h' file | wc -l
8
[/code]
-d可以删除某个字符,如果只有-d就会输出删除特定字符后的字符串,但是-c可以反显,这就是显示了被删除的字符。然后可以用wc -c去统计下字符的个数。

这是在CU上面的文章,我其实就是个搬运工罢了。
http://blog.chinaunix.net/u2/82912/showart_1914688.html
阅读(947) | 评论(0) | 转发(0) |
0

上一篇:常用翻译

下一篇:电源管理安装与设置

给主人留下些什么吧!~~