python 使用urllib2获取网页内容时，如何设置超时时间-dsy851009-ChinaUnix博客

个人简介

效字当先，以质为本。测试开发入行十余年，辉煌过，迷茫过，持续探寻人生的激情和前进的步伐！好好生活，认真工作！

文章分类

文章存档

2015年（14）

2014年（33）

2013年（31）

我的朋友

相关博文

分类： Python/Ruby

2017-04-21 11:10:38

#获取html内容

点击(此处)折叠或打开

#coding=utf8
import socket
import time
import urllib2
import os,sys
import json
socket.setdefaulttimeout(60) ----设置socket超时时间，60s
def getData(base_url, query=""):
req_header = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) \
Chrome/39.0.2171.71 Safari/537.36', 'Content-Type': 'application/x-www-form-urlencoded'}
req_timeout = 3 ---使用urllib2库本身自带的超时参数，一般情况下接口设置为3s，网页抓取设置为5s
url = ""
if query:
url = base_url + "&kw=" + urllib2.quote(query)
else:
url = base_url
print url
req = urllib2.Request(url, None, req_header)
# print req
retryTime = 3
return_dict = {}
while retryTime > 0:
try:
doc = urllib2.urlopen(req, None, timeout=req_timeout).read()
return json.loads(doc)
except Exception, e:
if retryTime == 1:
# logger.error(str(e)+', url:'+url)
print 'reTryTime:',retryTime,'\n\n'
retryTime -= 1
return return_dict

阅读(3010) | 评论(2) | 转发(0) |

给主人留下些什么吧！~~

dsy8510092017-05-10 11:43:22

aishiyue：学习了，谢谢分享

文明上网，理性发言...

回复 | 举报

aishiyue2017-05-10 10:59:51

学习了，谢谢分享

感谢所有关心和支持过ChinaUnix的朋友们