我的python歷程--第三天-wantfly-ChinaUnix博客

数据玩家

首页　| 　博文目录　| 　关于我

wantfly

博客访问： 316163
博文数量： 94
博客积分： 2220
博客等级：大尉
技术积分： 975
用户组：普通用户
注册时间： 2004-12-17 21:17

文章分类

全部博文（94）

Techniqe（3）
杂类（3）
python（5）
?存?份（2）
shell（7）
informix（21）
Windows（3）
General（2）
职业生涯（3）
人生哲理（0）
心情日记（2）
network（8）
项目管理（6）
oracle（6）
linux（22）
未分配的博文（1）

文章存档

2011年（5）

2010年（11）

2009年（1）

2008年（2）

2006年（1）

2005年（65）

2004年（9）

我的朋友

小雅贝贝

相关博文

我的python歷程--第三天

分类： Python/Ruby

2005-10-24 21:37:37

今天看了正则表达式的用法，和AWK，SED的表示方法差不多，这样可以省点力了。
还利用Karrigell实现了WEB的输出。将Karrigell安装上，不过gadfly没有装成功。

RE的EXAMPLE:

import re
# open a file
file = open("z:web.log","r")
text = file.readlines()
file.close()

# compiling the regular expression:
keyword = re.compile("10.7.1.31")
# searching the file content line by line:
for line in text:
if keyword.search (line):
print line

################################
利用Karrigell实现了WEB的输出的sample,
我的Karrigell是安装在c:Karrigell的,将以下代码存为index.py,放到c:karrigell目录下:
打开IE或firefox执行:即可得到输出的代码.
我试了几次,我的WEBEXTD20051013.log文件有82.5M(兆) ,大约有60多万行的LOG信息。
生成网页的时间不超过一分钟，看来PYTHON的执行速度和文本处理能力还是不错的。

import sys
import re
import string
import datetime

input = sys.stdin
input = open("z:WEBEXTD20051013.log")

ip_list = []
user_list = []
#ii = 0
for line in input.readlines():
list1 = line.split(" ")
if list1[0] not in ip_list:
ip_list.append(list1[0])
#user_list.append(list1[1])
#print ip_list

print "

"
for x in range(2,len(ip_list)):
    #print ip_list[x]
    print ""
    print ""
    print ""
print "

"
print ip_list[x]
print "

"
print "test width 30%"
print "

"
print "test width 50%"
print "

"

总结：
1。对RE的使用，感觉还是没有LINUX下的SED，AWK，GREP来的方便.因为只能对每行分别进行处理
不象GREP一样,直接对整个文档进行处理.也许是我还没有找到方法吧.
2. 在作第二的WEB页面输入的SAMPLE时老是出现list out of range的ERROR MESSAGE.不知道是为什么.
开始以为是LIST大小有限制,但后面使用
for x in range(200000)
a.append(")
这样的代码来测试,也没有问题.不知道问题出现在什么地方.明天再研究一下吧.

阅读(1783) | 评论(0) | 转发(0) |

上一篇：我的python歷程--第二天

下一篇：一切从游戏开始:

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6