python 多线程下载图片程序-jack_sir-ChinaUnix博客

Chinaunix首页 | 论坛 | 博客

LINUX 点点滴滴jackzzg.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

博客访问： 672455
博文数量： 198
博客积分： 4256
博客等级：上校
技术积分： 1725
用户组：普通用户
注册时间： 2009-12-15 13:12

文章分类

全部博文（198）

Perl（1）
Oracle（5）
Java web管理（1）
Django（4）
Python（9）
MongoDB（9）
Mail（5）
ftp（2）
安全（6）
负载均衡（4）
subversion（12）
Life and Philoso（4）
Ubuntu（20）
Others（16）

VIM（2）

android（2）

存储（4）

网络（1）

TRAC（1）

命令备忘（3）
LNMP（35）
LAMP（8）
SHELL（4）
linux系统管理（30）
mysql（14）
linux监控（9）
未分配的博文（0）

文章存档

2012年（12）

2011年（39）

2010年（135）

2009年（12）

我的朋友

最近访客

推荐博文

相关博文

python 多线程下载图片程序

分类： Python/Ruby

2011-03-23 13:30:15

python多线程编程实例：

参考文章：http://www.ibm.com/developerworks/cn/aix/library/au-threadingpython/

#!/usr/bin/env python

# -*- coding:utf-8 -*-

import cPickle

import os

import hashlib

import threading

from image import load

import Queue

queue = Queue.Queue()

class MutilThread(threading.Thread):

def __init__(self,queue):

threading.Thread.__init__(self)

self.queue = queue

def run(self):

#按照顺序执行，先put所有的的queue然后再逐步处理；

#while queue.qsize() != 0:

while True:

url = self.queue.get()

size = queue.qsize()

print "Thread's Size: %s" % size

SaveImage(url)

self.queue.task_done()

def DownloadImage():

Urllist = []

url_li = getMedicineImage(Urllist)

#先将所有的item，put到queue;

#for url in url_li:

#queue.put(url)

for i in range(4):

t = MutilThread(queue)

t.setDaemon(True)

t.start()

for url in url_li:

queue.put(url)

#size = queue.qsize()

#print "Queue's Size: %s" % size

queue.join()

def openFile(pickfile):

f = open(pickfile,'rb')

dct = cPickle.load(f)

f.close()

return dct

def SaveImage(url):

tail = url.split('.')[-1]

fl = hashlib.md5(url).hexdigest()

dirname = "images/"

f = open(dirname+fl+'.'+tail,'w')

f.write(load(url))

f.close()

def getMedicineImage(li):

pickfile = "yaopin.pkl"

hd = openFile(pickfile)

for trunk in hd['yaopin']:

print trunk

for sub in hd['yaopin'][trunk]:

for medicine in hd['yaopin'][trunk][sub]:

url = medicine['image_url']

if url != "http://img.39.net/ypk/images/spic_bg.gif":

li.append(url)

return li

def main():

# getMedicineImage()

DownloadImage()

if __name__=='__main__':

main()

从某个网站上面抓取的数据以dict的格式保存在 yaopin.pkl 文件中

yaopin.pkl是使用cPickle保存的python 字典对象，从中取出所有图片的url，并序列化。

SaveImage 独立的单个线程

阅读(1650) | 评论(0) | 转发(1) |

0

上一篇：django 学习记录（apache配置）

下一篇：NoSQL数据库探讨之一－为什么要用非关系数据库？

给主人留下些什么吧！~~

关于我们 | 关于IT168 | 联系方式 | 广告合作 | 法律声明 | 免费注册

Copyright 2001-2010 ChinaUnix.net All Rights Reserved 北京皓辰网域网络信息技术有限公司. 版权所有

感谢所有关心和支持过ChinaUnix的朋友们