阴月皇朝hades.blog.chinaunix.net
李纳斯
全部博文(36)
2012年(1)
2011年(5)
2010年(9)
2009年(21)
flb_2001
duanzi_1
Bsolar
jiangale
风尘_NUL
songhuan
司马辽太
kuang_hp
欧阳逍遥
sauer
分类: Python/Ruby
2009-08-31 11:23:20
#coding=gb2312 #抓取sina读书频道小说 import re import urllib as ub booklist = [40438,27128,27204,'浴火凤凰'] titlePre = "(.*?)<\/h1>" contentsPre = "(.*?)<\/div>" start = booklist[1] end = booklist[2]+1 for i in range(start,end): url = '%d_%d.html' % (booklist[0],i) ufh = ub.urlopen(url) cont = ufh.read() title = re.findall(titlePre,cont) contents = re.findall(contentsPre,cont) fh = open(booklist[3]+'.txt','a') wcs =title[0]+"\r\n\n"+contents[0]+"\r\n\n" fh.write(wcs) fh.close()
上一篇:又是框架
下一篇:js等比例缩放图片
登录 注册