压缩/解压缩:
1.tar zxvf FileName.tar.gz解压缩tar.gz文件
2.tar zcvf FileName.tar.gz DirName 压缩成tar.gz文件
grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行
打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
Grep主要用于查找:
比如:Grep -i(忽略大小写) -c(统计行数) "匹配的字符串" Myfile.txt
Awk主要用于以分隔符分隔的数据字段的查找和替换,输出等
比如:awk -F"#_(分隔符)" '{ print $1(输出第一个字段) }' myfile.com
cut命令用途:从文件的每个行中写出选定的字节、字符或字段。
项目用到的代码:
在一命名为2008_2_27_*的文本格式如下:
1#_2#_3#_4#_5#_6#_7#_8#_9#_10(2为IP,7为页面)中
查找""的PV和UV值。
PV为页面访问量,可重复,即7的值为该页面""。
UV为IP访问量,不可重复。
cut -d '#' -f 2,7 2008_2_27_* | grep "" | cut -d '#' -f 1 | sort | uniq | wc -l
awk -F"#_" '{if ($7~/http:\/\/mgame.qq.com/){print $7}}' 2008_2_27_* | wc -l 或者
cut -d '#' -f 7 2008_2_27_* | grep "" | wc -l
阅读(547) | 评论(0) | 转发(0) |