博客备份界面版-yexin218-ChinaUnix博客

※一路风尘※leyond.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

yexin218

博客访问： 6642765
博文数量： 227
博客积分： 10047
博客等级：上将
技术积分： 6678
用户组：普通用户
注册时间： 2006-07-11 10:33

个人简介

网上的蜘蛛

文章分类

全部博文（227）

存在与活（72）
网页开发（5）
时事新闻（0）
思科网络（0）
Java学习（22）

Eclipse（2）
音乐宝盒（2）
英语沙龙（3）

英语写作（0）
新闻娱乐（0）
图片欣赏（2）
网络美文（0）
数据库（0）

LDAP（0）
资料常识（1）
操作系统（8）

Linux（3）
C/C++（15）

驱动开发（5）

linuxWeb（0）
JSP日志（1）

图表编程（0）
编程开发（96）

Python（7）

Ruby（1）

AS3（2）

NS2（31）

Flex（35）

XML（3）

VirtualWiFi（5）

JQuery（2）

struts（0）

LifeRay（0）

Ajax（4）

Delphi（0）

OpenGL（6）
未分配的博文（0）

文章存档

2010年（19）

2009年（29）

2008年（179）

我的朋友

相关博文

博客备份界面版

分类： Python/Ruby

2010-04-25 22:03:08

其实真的很丑，而且使用的递归的方式，所以要等所有下载完了才会显示结果。有点郁闷：更多的期待

代码：
baidublog.py: 这个在前一篇文章的基础上，修改了下一篇文章地址的查找：

def findNextBlogHtml(user,htmlContent): htmlBlogContent = unicode(htmlContent,'gb2312','ignore').encode('utf-8','ignore') # parser the html content htmlsoup = BeautifulSoup(htmlBlogContent) nextBlogUrlZero = htmlsoup.findAll("div",{"class":"opt"}) urlRe = re.compile('/.*?.html') urls = urlRe.findall(str(nextBlogUrlZero[0])) if(len(urls)>=1): blogUrl = re.findall(r"\w*.html",urls[0],re.I) if (len(blogUrl[0]) >6 ): htmlAddr = blogUrl[0] else: htmlAddr ="None" else: htmlAddr ="None" print htmlAddr

接下来是图形界面：

#-*- coding: utf-8 -*- from Tkinter import * from baidublog import * class GridDemo( Frame ): def __init__( self ): Frame.__init__( self ) self.master.title( "Baidu Blog Backup" ) self.grid( sticky = W+E+N+S ) self.label1 = Label( self,text="百度用户名：",width = 5 ) self.label1.grid( row = 0, column = 1, sticky = W+E+N+S ) self.entry1 = Entry(self,width=20) self.entry1.grid(row=0,column=2) self.entry1.insert(INSERT, "codedeveloper") self.label2 = Label( self,text="第一篇博文地址：",width = 8 ) self.label2.grid( row = 0, column = 3, sticky = W+E+N+S ) self.entry2 = Entry(self,width=40) self.entry2.grid(row=0,column=4,sticky = W+E+N+S) self.entry2.insert(INSERT, "977f3010ab7e17dcf7039e99.html") self.text = Text(self) self.text.grid(row =1,columnspan = 5,sticky = W+E+N+S) self.button = Button(self,text='Backup', width = 30,command=self.startBackupBlog) self.button.grid(row=2, columnspan =5) def startBackupBlog(self): user = self.entry1.get() firstBlogUrl = self.entry2.get() self.backupAction(user, firstBlogUrl) def backupAction(self,user,firstBlogUrl): #first read first blog

个人觉得：还是先读取文章分类中所有文章链表，然后根据线程等下载方式，可以提高效率

阅读(4138) | 评论(0) | 转发(0) |

上一篇：Python百度空间备份改进版1

下一篇：Filter驱动开发笔记(合计49篇)下载

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6