Chinaunix首页 | 论坛 | 博客
  • 博客访问: 562967
  • 博文数量: 142
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 1452
  • 用 户 组: 普通用户
  • 注册时间: 2013-09-12 16:28
文章分类

全部博文(142)

文章存档

2016年(10)

2015年(60)

2014年(72)

我的朋友

分类: Python/Ruby

2015-09-14 19:00:36

     python 爬虫

点击(此处)折叠或打开

  1. import re
  2. import urllib


  3. def getHtml(url) :
  4.     page = urllib.urlopen(url);
  5.     html = page.read();
  6.     return html
  7. def getImg(html) :
  8.     reg = r'id="p-ad" .*'
  9.     imgre = re.compile(reg)
  10.     imglist = re.findall(imgre,html)
  11.     return imglist


  12. print "begin ..."
  13. html = getHtml("http:// ")


  14. #html = getHtml(" style="color:#0000CC;">)
  15. print getImg(html)


阅读(740) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~