Chinaunix首页 | 论坛 | 博客
  • 博客访问: 19884611
  • 博文数量: 679
  • 博客积分: 10495
  • 博客等级: 上将
  • 技术积分: 9308
  • 用 户 组: 普通用户
  • 注册时间: 2006-07-18 10:51
文章分类

全部博文(679)

文章存档

2012年(5)

2011年(38)

2010年(86)

2009年(145)

2008年(170)

2007年(165)

2006年(89)

分类: Python/Ruby

2010-03-25 18:29:02

#!/usr/bin/env python
# -*- coding: cp936 -*-
#2010-3-25
#python 测试与应用:41357415
#深圳IT招聘求职:105095215
#武冈深圳高级群:66250781
#因为我现在还有找到在大量文件查找python实现的好方法。
#实现采用了grep的方法。
#使用了os.popen而不是subprocess中的Popen,因为前者的参数更简单
#不知subprocess中的Popen是否有更好的地方?
#gtalk: xurongzhong#gmail.com



import re
import time
import random
import sys
import os


for line in open("smu.csv"):
        line = line.strip()
        attr = line.split(',')
        docid = attr[0]
        isu_spam_rank = attr[1]
        isu_quality_rank = attr[2]
        isu_PornRank = attr[3]
        isu_PoliticRank  = attr[4]
        
        strings = "grep " + docid + " spamRank.20.dat.csv"
        f = os.popen(strings)
        data = f.readline()
        f.close()
        if data :
            value = data.strip().split(',')[1]
            if int(value) == int(isu_spam_rank):
                    pass
            else:
                    print docid +"**value**isu_spam_rank**" + value + "--------" + isu_spam_rank
                    print "error"
                   
for line in open("smu.csv"):
        line = line.strip()
        attr = line.split(',')
        docid = attr[0]
        isu_spam_rank = attr[1]
        isu_quality_rank = attr[2]
        isu_PornRank = attr[3]
        isu_PoliticRank  = attr[4]
       
        strings = "grep " + docid + " qualityRank.20.dat.csv"
        f = os.popen(strings)
        data = f.readline()
        f.close()
        if data :
            value = data.strip().split(',')[1]
            if int(value) == int(isu_quality_rank):
                    pass
            else:
                    print docid +"**value**isu_quality_rank**" + value + "--------" + isu_quality_rank
                    print "error"
                   
for line in open("smu.csv"):
        line = line.strip()
        attr = line.split(',')
        docid = attr[0]
        isu_spam_rank = attr[1]
        isu_quality_rank = attr[2]
        isu_PornRank = attr[3]
        isu_PoliticRank  = attr[4]
       
        strings = "grep " + docid + " pornRank.20.dat.csv"
        f = os.popen(strings)
        data = f.readline()
        f.close()
        if data :
            value = data.strip().split(',')[1]
            if int(value) == int(isu_PornRank):
                    pass
            else:
                    print docid +"**value**isu_PornRank**" + value + "--------" + isu_PornRank
                    print "error"
                   
f.close



 
阅读(32209) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~