发布时间:2014-05-27 17:58:29
文章来源:CUHK 上学期有门课叫做 Semantic Web,课程 project 是要搜集整个系里面的教授信息,输入到一个系统里,能够完成诸如“如果选了A教授的课,因时间冲突,B教授的哪些课不能选”、“和A教授实验室相邻的实验室都是哪些教授的”这一类的查询。这就是所谓的“语义网”了啊。。。然而最坑爹的是,所有这些信息,老.........【阅读全文】
发布时间:2014-05-27 11:02:33
由Tornado Web服务器epoll的使用,本文主要对epoll作简单介绍,并给出示例 转载自:http://blog.csdn.net/piaojun_pj/article/details/6103709epoll的优点:1.支持一个进程打开大数目的socket描述符(FD) select 最不能忍受的是一个进程所打开的FD是有一定限制的.........【阅读全文】
发布时间:2014-05-27 11:00:10
mechanize是对urllib2的部分功能的替换,能够更好的模拟浏览器行为,在web访问控制方面做得更全面。结合beautifulsoup和re模块,可以有效的解析web页面,我比较喜欢这种方法。 下面主要总结了使用mechanize模拟浏览器的行为和几个例子(谷歌搜索,百度搜索和人人网登录等)1.初.........【阅读全文】
发布时间:2014-05-27 10:55:32
BeautifulSoup是Python的一个第三方库,可用于帮助解析html/XML等内容,以抓取特定的网页信息。目前最新的是v4版本,这里主要总结一下我使用的v3版本解析html的一些常用方法。1.初始化 导入模块#!/usr/bin/env pythonfrom BeautifulSoup import BeautifulSoup  .........【阅读全文】