Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2897204
  • 博文数量: 348
  • 博客积分: 2907
  • 博客等级: 中校
  • 技术积分: 2272
  • 用 户 组: 普通用户
  • 注册时间: 2010-03-12 09:16
个人简介

专注 K8S研究

文章分类

全部博文(348)

文章存档

2019年(22)

2018年(57)

2016年(2)

2015年(27)

2014年(33)

2013年(190)

2011年(3)

2010年(14)

分类: Python/Ruby

2013-07-05 02:27:54

此Python小脚本为抓取此页面: 下的所有jpg图像

'''
Created on 2013-4-2

@author: Administrator
'''
import re
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'src="(.*?\.jpg)" width'
    imgreg = re.compile(reg)
    imglist = re.findall(imgreg, html)
    x = 0
    for imgurl in imglist:
        urllib.urlretrieve(imgurl, '%s.jpg' % x)
        x += 1
        
html = getHtml("")
getImg(html)
阅读(2403) | 评论(0) | 转发(0) |
0

上一篇:python多线程学习

下一篇:python装饰器学习

给主人留下些什么吧!~~