python模拟登录微博网站利用urllib2 和 cookie-OowarrioroO-ChinaUnix博客

Chinaunix首页 | 论坛 | 博客

首页　| 　博文目录　| 　关于我

博客访问： 298362
博文数量： 82
博客积分： 0
博客等级：民兵
技术积分： 874
用户组：普通用户
注册时间： 2015-03-21 09:58

个人简介

traveling in cumputer science!!

文章分类

全部博文（82）

C++（3）
MongoDB（6）
字符编码（1）
linux（9）
NLP（1）
other（0）
spark（15）
python（20）
android（7）
JAVA（1）
搜索引擎（2）
git（1）
Algorithm（5）
myLinuxCoding（11）
未分配的博文（0）

文章存档

2016年（13）

2015年（69）

我的朋友

zhaoriti

最近访客

推荐博文

相关博文

python模拟登录微博网站利用urllib2 和 cookie

分类： Web开发

2015-11-30 14:58:39

方法还有待改进，前期需手动操作，待后续更新。。。

1.从浏览器中获取要登录网站cookie

例如 chrome，步骤如下:
setting：

dvanced：

contentSetting：

all cookies and site data：

search sinalogin cookie and url：

2.通过 chrome 的 Developer Tools (key F12)调试登陆成功的微博主页，然后用里面的访问记录，找到会话期间的cookie

open your sina homepage press 'F12' get into the debug model
(1)在地址栏获取url
(2)然后像图中一样获取session期间的cookie

3.通过python的urllib2结合刚刚找到的cookie访问你的微博主页面

点击(此处)折叠或打开

import urllib2
import urllib
import sys
import re
url = 'your url'
headers = {'cookie':'your cookie'}
req = urllib2.Request(url, headers=headers)
r = urllib2.urlopen(req)
htmlcont = r.read()
print htmlcont
f = open('htmlcode', 'w')
f.write(htmlcont)
f.close()

通过上面的步骤获得了登陆成功页面的HTML代码，可通过浏览器打开，也可通过像selenium一样的工具包进行动态网页解析，提取网页内容。

阅读(2042) | 评论(0) | 转发(0) |

0

上一篇：urllib2中的两个重要概念 Openers和Handlers

下一篇：install Mongodb in ubuntu (Linux)

给主人留下些什么吧！~~

关于我们 | 关于IT168 | 联系方式 | 广告合作 | 法律声明 | 免费注册

Copyright 2001-2010 ChinaUnix.net All Rights Reserved 北京皓辰网域网络信息技术有限公司. 版权所有

感谢所有关心和支持过ChinaUnix的朋友们