发布时间:2014-12-15 13:03:42
最近需要采集被试浏览过的网页记录,但发现3男3女都是使用360浏览器,极速和安全两款。这些浏览器都能看到浏览记录,然而存在两个问题:一是时间仅精确到分钟而不是秒,要知道1分钟内用户可能会浏览好几个网页;二是无法自行导出全部浏览记录。 于是,我就开始探索如何解决.........【阅读全文】
发布时间:2014-08-22 08:37:37
一、简介 Larbin是一个用C++开发的开源网络爬虫,有一定的定制选项和较高的网页抓取速度。 Larbin爬虫结构图及主要模块对应关系如下图所示:  .........【阅读全文】