Chinaunix首页 | 论坛 | 博客
  • 博客访问: 805706
  • 博文数量: 94
  • 博客积分: 1767
  • 博客等级: 上尉
  • 技术积分: 1168
  • 用 户 组: 普通用户
  • 注册时间: 2008-12-13 23:16
个人简介

ha

文章分类

全部博文(94)

文章存档

2014年(2)

2013年(17)

2012年(6)

2011年(15)

2010年(23)

2009年(23)

2008年(8)

我的朋友

分类: 系统运维

2011-08-11 13:08:41

比如Apche的日志格式是这样的:
%h %l %u %t \"%r\" %>s %b
具体的例子:
111.222.111.222 - - [03/Apr/2002:10:30:17 +0800] "GET /index.html HTTP/1.1" 200 419

最简单的想法是将日志一一读出来,然后按日志中的时间字段排序
cat log1 log2 log3 |sort -k 4 -t " "
注释:
-t " ": 日志字段分割符号是空格
-k 4: 按第4个字段排序,也就是:[03/Apr/2002:10:30:17 +0800] 这个字段
-o log_all: 输出到log_all这个文件中

这相当于先把几个日志文件的内容按自定列进行排序,然后在输出,显然这样的效率比较低。对于Apache的日志,其实本身已经是一个“已经按照时间排好序“的文件了,而sort对于这种文件的排序合并提供了一个优化合并算法:使用 -m merge合并选项。因此:合并这样格式的3个日志文件log1 log2 log3并输出到log_all。像这样就可以了:
sort -m log1 log2 -o log_all

阅读(2535) | 评论(0) | 转发(0) |
0

上一篇:Apache日志分析_shell命令行

下一篇:织网的

给主人留下些什么吧!~~