校内网发帖机in Python，请勿滥用-fatsandwich-ChinaUnix博客

sandwich vs Linux

首页　| 　博文目录　| 　关于我

fatsandwich

博客访问： 454438
博文数量： 161
博客积分： 5005
博客等级：上校
技术积分： 1090
用户组：普通用户
注册时间： 2008-10-20 16:38

文章分类

全部博文（161）

linux kernel（3）
other（1）
mac（6）
php（7）
linux基础知识（10）
数据处理（2）
网络技术应用（6）
IT业界（3）
script（4）

shell（4）
eclipse（3）
杂（5）
architecture（4）
everyday sandwic（9）
内核（4）
Android（4）
常识（6）
C/C++（3）

基础知识（3）
perl（1）
linux下编程（4）

小白问题（1）

函数使用备忘（1）

Qt（1）
python（11）

Django（2）
linux管理（14）

pure-ftpd（1）
Linux应用（15）

netshare（1）
MySQL（7）
JAVA（20）

Junit（5）

语法（1）

Spring（7）
GCC内嵌汇编（1）
VI（3）
未分配的博文（5）

文章存档

2011年（21）

2010年（33）

2009年（89）

2008年（18）

我的朋友

相关博文

校内网发帖机in Python，请勿滥用

分类： Python/Ruby

2009-06-27 03:57:23

#!/usr/bin/python #encoding=utf-8 #使用前请查找并更改用户名和密码 import cookielib, urllib2, urllib, sys, time from xml.sax.saxutils import unescape from BeautifulSoup import BeautifulSoup # For processing HTML def formalize(text): result = '' lines = text.split(u'\n') for line in lines: line = line.strip() if len(line) == 0: continue result += line + u'\n\n' return result #登陆校内网 cj = cookielib.CookieJar() opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj)) exheaders = [("User-Agent","Mozilla/4.0 (compatible; MSIE 7.1; Windows NT 5.1; SV1)"),] opener.addheaders=exheaders url_login = '' body = (('email','xxxxx@gmail.com'), ('password','*********')) #TODO:更改登录名和密码 print "ERROR! you need to update the password to be successful!" req1 = opener.open(url_login, urllib.urlencode(body)) #这时，cookie已经进来了。 #下载糗事百科，一个个发帖 body = {'relative_optype':'publisher', 'blogControl':'1'} url_post = 'http://blog.xiaonei.com/NewEntry.do' #发帖部分 count = 0 for i in range(11, 12): url = "%d" % i data = urllib2.urlopen(url).readlines() soup = BeautifulSoup("".join(data)) contents = soup.findAll('div', "content") stories = [str(text) for text in contents] for story in stories: count += 1 print "processing page %d, %d items added" % (i, count) minisoup = BeautifulSoup(story) #text = ''.join([e for e in minisoup.recursiveChildGenerator() if isinstance(e, unicode)]) #text = urllib.unquote(unescape(text, {'"':'"'})) text = str(minisoup) #text = text.encode("utf-8") title = '糗事-%d' % count text += ' 来自糗事百科 ' body['title'] = title body['body'] = text req2 = opener.open(url_post, urllib.urlencode(body)) #不出意外的话，就已经发帖成功了

阅读(651) | 评论(0) | 转发(0) |

上一篇：将 Twitter 自动同步到 Facebook、饭否、校内、海内等网站的方法

下一篇：通过Twitter来更新校内状态

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6