urllib2.urlopen超时问题-wujing168-ChinaUnix博客

Linux学习之路

首页　| 　博文目录　| 　关于我

wujing168

博客访问： 1122773
博文数量： 321
博客积分： 7872
博客等级：少将
技术积分： 2120
用户组：普通用户
注册时间： 2007-05-16 09:06

文章分类

全部博文（321）

监控（3）
JavaScript（0）
BT（0）
redis（5）
架构（1）
sphinx（0）
web安全（1）
cacti（11）
python学习（24）
windows（4）
LVS（4）
错误解决（3）
其它（0）
shell（5）
Perl（2）
版本控制（2）
RSYNC（1）
DNS（7）
CDN（2）
协议（15）
VPN（1）
Squid（24）
网址收集（1）
性能优化（7）

sys（6）

web（1）
Nginx（15）
memcached（6）
NFS（3）
NIS服务器（1）
Web服务器（18）
Ftp（6）
服务器集群（8）
Mail（3）
MYSQL（41）
Linux（13）
系统管理（78）

内核参数优化（13）

内核（1）
未分配的博文（6）

文章存档

2017年（1）

2016年（1）

2015年（12）

2014年（17）

2013年（78）

2012年（15）

2011年（17）

2010年（67）

2009年（102）

2008年（11）

我的朋友

相关博文

urllib2.urlopen超时问题

分类： LINUX

2014-05-18 17:44:23

没有设置timeout参数，结果在网络环境不好的情况下，时常出现read()方法没有任何反应的问题，程序卡死在read()方法里，搞了大半天，才找到问题，给urlopen加上timeout就ok了，设置了timeout之后超时之后read超时的时候会抛出socket.timeout异常，想要程序稳定，还需要给urlopen加上异常处理，再加上出现异常重试，程序就完美了。

import urllib2

url=''

fails = 0

while True:

try:

if fails >= 20:

break

req = urllib2.Request(url)

response = urllib2.urlopen(req, None, 3)

page = response.read()

except:

fails += 1

print '网络连接出现问题, 正在尝试再次请求: ', fails

else:

break

--------------------------------------------------------------------------------------------------------

有时候我们在爬取网络数据时，会因为对方网速缓慢、服务器超时等原因，

导致 urllib2.urlopen() 之后的 read()操作（下载内容）卡死，要解决这个问题方法有如下几个：

1、为urlopen设置可选参数 timeout

import urllib2
#
r = urllib2.Request("")
try:
        print 111111111111111111
        f = urllib2.urlopen(r, data=None, timeout=3)
        print 2222222222222222
        result =  f.read()
        print 333333333333333333
except Exception,e:
        print "444444444444444444---------" + str(e)

print "55555555555555"

2、设置全局的socket超时：

import socket
socket.setdefaulttimeout(10.0)

或者使用：httplib2 or timeout_urllib2

3、使用定时器 timer

from urllib2 import urlopen
from threading import Timer
url = ""
def handler(fh):
fh.close()
fh = urlopen(url)
t = Timer(20.0, handler,[fh])
t.start()
data = fh.read() #如果二进制文件需要换成二进制的读取方式
t.cancel()

转自：

阅读(1260) | 评论(0) | 转发(0) |

上一篇：FTP的两种传输模式：BINARY和ASCII

下一篇：用python爬虫抓站的一些技巧总结 zz

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6