Chinaunix首页 | 论坛 | 博客
  • 博客访问: 782708
  • 博文数量: 738
  • 博客积分: 7000
  • 博客等级: 少将
  • 技术积分: 5000
  • 用 户 组: 普通用户
  • 注册时间: 2008-09-12 09:00
文章分类

全部博文(738)

文章存档

2011年(1)

2008年(737)

我的朋友

分类:

2008-09-12 09:10:59

 统计网站的访问量有很多专业的第三方工具,例如Google Analytics,提供强大,而且详细的统计功能。当然,也许不是每个人都需要这么复杂而且操作麻烦的工具,如果你只是需要大概了解一下网站的访问量和访问URL的比例,那么让我们看看最简单最容易的统计工具:Unix Shell。

 一个RoR网站的访问纪录,Web Server(Apache or lighttpd)会记录所有的访问请求,包括动态请求和静态请求,但大量图片,JS,的请求对我们没有太大的统计价值,因此web server的日志参考价值就不大。

 RoR会记录所有动态请求日志到log/production.log里面,我们要做的就是让RoR进行日志,每天产生一个新的日志文件。很简单,修改config/environment.rb

ruby 代码

RAILS_DEFAULT_LOGGER = Logger.new("#{RAILS_ROOT}/log/#{RAILS_ENV}.log""daily")   


 那么每天就会产生一个诸如production.log.20070702这样的日志文件。

一、统计每日动态请求处理总数

代码

cat production.log.20070702|grep "200 OK"|wc -l   

 打印日志文件,挑选正确处理的请求行,统计行数,一条shell命令就搞定了网站处理的动态请求数量。虽然动态请求数量不等于网站访问量,但是可以作为一个重要的参考指标。

二、统计URL的访问频度

 网站管理员都很希望知道哪些频道受欢迎被访问的频繁,哪些URL格外受到关注,不必寻求专业的网站流量统计系统,一条shell命令就搞定了:

代码

cat production.log.20070702 |grep "200 OK" | awk '{print $17}'|sort|uniq -c | sort -r -n > stat.log  

 打印日志文件,挑选正确处理请求行,把第17列即URL那一列挑出来,排序,统计唯一URL出现的次数,按照URL次数倒序输出到stat.log文件里面,让我们看看stat.log是什么:

代码

10096 [http://]   
 3590 [http://forums/index]   
 3446 [http://forums/board/]   
 3300 [http://index/rss_index_topics]   
 2477 [http://forums/board/Life]   
 1605 [http://forums/board/AJAX]   


 网站首页被访问了10096次,论坛频道首页被访问了3590次,......

 是不是很爽?我们用一条shell命令可以做简单的网站访问统计系统了。那么用做的系统,能不能这样统计呢?其实照样可以。你可以在tomcat的配置文件里面设置输出详细的日志信息,然后照样用shell命令搞定。

【责编:Peng】

--------------------next---------------------

阅读(540) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~