发布时间:2016-07-08 08:27:12
最近刚开始使用python来做爬虫爬取相关数据,使用了python自带的urllib和第三方库requests,解析html使用了beautifulsoup以及lxml 这里说下lxml,lxml是python的一个html、xml解析库,lxml使用XPath能快速,简单的定位元素并获取信息。下面进入正题1. 遇到的中文乱码问题1.1 简单.........【阅读全文】
发布时间:2015-03-11 09:34:38
最近有一个mongo服务来做采集,需要监控这个采集服务是否正常,但是又不想用mongodb自带的监控服务,所以就自己开发了一个python脚本。 但是遇到python连接mongodb的时候遇到了环境上的问题,因为需要使用导入pymongo包,这个包python本身不自带,需要用户自己安装1. 安装方式1.1 .........【阅读全文】