统计一个文件中特定字符的个数-flyaway57-ChinaUnix博客

flyaway57

首页　| 　博文目录　| 　关于我

flyaway57

博客访问： 47061
博文数量： 13
博客积分： 570
博客等级：中士
技术积分： 145
用户组：普通用户
注册时间： 2008-10-21 09:23

文章分类

全部博文（13）

数通知识（0）
MPLS（0）
工作感悟（1）
测试理论（0）
python（6）

python lib（0）
心情感悟（1）
每周一歌（0）
linux（5）
未分配的博文（0）

文章存档

2010年（7）

2009年（4）

2008年（2）

我的朋友

相关博文

统计一个文件中特定字符的个数

分类： LINUX

2009-04-29 23:20:01

统计一个文件中某个字符串的个数，其实就是在在一块沙地里面找石头，有的人看到石头以后，在上面做个标记（grep），然后记住自己做了多少个标记；有的人看到石头以后，把它挖了（tr），最后统计自己挖了多少石头；有的人看到石头以后，把它跳过去（awk），然后统计自己跳了多少次。

这是我用的的文件

[code]
[root@bzhou test]# cat file
hafsdha
hahafsdfsdhaha
haha
[/code]

我想匹配的是‘haha’这个字符串

1.grep的-o选项
[code]
[root@bzhou test]# grep -c 'haha' file
2
[/code]

最开始的时候是用-c这个选项，不过-c只能统计一行的，如果一行里面有多个匹配的字符串，那-c就无能为力了。
这个是正确的

[code]
[root@bzhou test]# grep -o 'haha' file | wc -l
3
[/code]

2. awk
这个东西要感谢CU上的blackold。
[code]
[root@bzhou test]# awk -v RS='haha' 'END {print --NR}' file
[/code]
-v 去设定一个变量的值，RS是记录的分隔符，默认的是新行(\n)，就是说awk按照一行一行读数据，但是现在RS为'haha'后，就按'haha'读数据了，NR为已读的记录数，n个记录是被n-1个分隔符分开的，所以就是--NR了。

3.tr
严格意义上说，tr匹配不了字符串，只能去匹配单个字符。这里就匹配这个文件中‘h’的个数。
[code]
[root@bzhou test]# tr -cd 'h' 8
[root@bzhou test]# grep -o 'h' file | wc -l
8
[/code]
-d可以删除某个字符，如果只有-d就会输出删除特定字符后的字符串，但是-c可以反显，这就是显示了被删除的字符。然后可以用wc -c去统计下字符的个数。

这是在CU上面的文章，我其实就是个搬运工罢了。

阅读(1708) | 评论(0) | 转发(0) |

上一篇：linux上的主机名

下一篇：tethereal抓分片包

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6