分享一个Python爬虫小脚本-《一剑》飘香-ChinaUnix博客

Chinaunix首页 | 论坛 | 博客

《一剑》飘香skyai1.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

《一剑》飘香

博客访问： 650854
博文数量： 110
博客积分： 3808
博客等级：中校
技术积分： 1930
用户组：普通用户
注册时间： 2010-05-15 14:32

个人简介

声的伟大！

文章分类

全部博文（110）

Python（3）
Redis（2）
网络（1）
Databases（8）
linux系统监控（11）
linux（5）
linux学习札记（44）

linux_REDIS（0）

linux_YUM（2）

linux_VPN（0）

linux_MAIL（2）

linux_SMB（1）

linux_FTP（2）

linux_WWW（7）

linux_DNS（1）

linux_DHCP（1）

linux_IPTABLES（5）
linux系统管理（9）
心情日记（5）
性能测试（1）
它山之石（0）
水字兰亭（1）
Shell（18）
未分配的博文（2）

文章存档

2014年（1）

2013年（2）

2012年（12）

2011年（81）

2010年（14）

我的朋友

最近访客

推荐博文

相关博文

分享一个Python爬虫小脚本

分类： Python/Ruby

2013-04-02 10:21:34

此Python小脚本为抓取此页面：下的所有jpg图像

'''
Created on 2013-4-2

@author: Administrator
'''
import re
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'src="(.*?\.jpg)" width'
    imgreg = re.compile(reg)
    imglist = re.findall(imgreg, html)
    x = 0
    for imgurl in imglist:
        urllib.urlretrieve(imgurl, '%s.jpg' % x)
        x += 1

html = getHtml("")
getImg(html)

阅读(3886) | 评论(0) | 转发(4) |

0

上一篇：Python备份脚本

下一篇：python easygui简单使用示例

给主人留下些什么吧！~~

关于我们 | 关于IT168 | 联系方式 | 广告合作 | 法律声明 | 免费注册

Copyright 2001-2010 ChinaUnix.net All Rights Reserved 北京皓辰网域网络信息技术有限公司. 版权所有

感谢所有关心和支持过ChinaUnix的朋友们