Chinaunix首页 | 论坛 | 博客
  • 博客访问: 4424
  • 博文数量: 3
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 10
  • 用 户 组: 普通用户
  • 注册时间: 2013-12-16 17:49
文章分类
文章存档

2013年(3)

我的朋友
最近访客

分类: Python/Ruby

2013-12-16 17:53:02

原文地址:python写小爬虫 作者:zhangzhengxing

#!/usr/bin/python
import re
import urllib

def getHtml(url):
    page=urllib.urlopen(url)
    html=page.read()
    return html
def getImg(html):
    reg=r'src="(.*?\.jpg)"width'
    imgre=re.compile(reg)
    imglist=re.findall(imgre,html)
    x=0
    for imgurl in imglist:
          urllib.urlretrieve(imgurl,'%s.jpg'%x)
          x += x
html=getHtml("")
print getImg(html)

阅读(255) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~