分享一个Python爬虫小脚本-MingZznet-ChinaUnix博客

Mingz技术博客

首页　| 　博文目录　| 　关于我

MingZznet

博客访问： 537631
博文数量： 71
博客积分： 0
博客等级：民兵
技术积分： 159
用户组：普通用户
注册时间： 2013-07-13 12:37

个人简介

aaaaaaaaa

文章分类

全部博文（71）

v8（4）
杂项（1）
firefox（1）
Qt（21）
Linux（1）
json（2）
ubuntu（0）
PyQt（1）
python（40）
未分配的博文（0）

文章存档

2013年（71）

我的朋友

相关博文

分享一个Python爬虫小脚本

分类： Python/Ruby

2013-07-24 12:45:12

原文地址：分享一个Python爬虫小脚本作者：《一剑》飘香

此Python小脚本为抓取此页面：下的所有jpg图像

'''
Created on 2013-4-2

@author: Administrator
'''
import re
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'src="(.*?\.jpg)" width'
    imgreg = re.compile(reg)
    imglist = re.findall(imgreg, html)
    x = 0
    for imgurl in imglist:
        urllib.urlretrieve(imgurl, '%s.jpg' % x)
        x += 1

html = getHtml("")
getImg(html)

阅读(265) | 评论(0) | 转发(0) |

上一篇：python实现爬虫

下一篇：python多线程学习

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6