全部博文(315)
分类: LINUX
2009-04-16 12:53:38
首先要了解一下Apache的log记录形式,如下:
第一项为客户端的IP,第二项为访问时间,后面还请求的具体动作,浏览器类型等。我们关心的就是一条记录的第一项,我们知道,客户端每发起一次HTTP请求Apache就会生成如上的一条记录,那么我们自统计的时候就需要注意除掉重复的IP。
用shell实现如下,涉及到awk,sort,unip等工具。
用awk打印每行的第一项。
用sort排序,方便后面去掉重的IP。
用uniq去掉重复IP的。
然后就可以用wc统计了。
awk '{print $1}' access_log | sort | uniq | wc
简单来说就是一些UNIX工具的结合。