全部博文(272)
发布时间:2014-01-14 20:34:56
京东图书评论有非常丰富的信息,这里面就包含了购买日期、书名、作者、好评、中评、差评等等。以购买日期为例,使用Python + Mysql的搭配进行实现,程序不大,才85行。相关的解释我都在程序里加注了:from selenium import webdriverfrom bs4 import BeautifulSoupimport re.........【阅读全文】
发布时间:2013-09-24 15:48:42
大数据的好处经常提及我就不说了,我想谈谈反思,算作冷思考吧: 1、大数据源于一个概念,但发展至今已经形成了以技术为基础的商业体系,并慢慢形成产业生态圈。这与前几年的“云计算”发展脉络如出一辙。云计算和大数据热的背后,是行业的萧条。回想十多年前IT蓬勃.........【阅读全文】
发布时间:2013-09-09 09:52:43
IT圈内一直流传着这样一个说法,干技术的到了30岁便需要转型,如果30大几了其身影依旧在活跃在技术第一线不是特成功就是特失败。即使对于一个没有远大志向的程序员来说,年龄也是无法回避的问题。那么,如何在IT职场上进一步求得发展呢,《从技术走向管理——李元芳履职记》对这个问题进行了初步的回答。&.........【阅读全文】
发布时间:2013-08-11 21:54:33
做了多年的B/S开发,遇到过数不胜数的浏览器兼容问题,采用过N多JavaScript脚本以及CSS代码为应用程序打补丁。为什么我们会对HTML5这么推崇,因为做过前端开发的都知道。书中说道,现在使用最广泛的HTML4标准已经十余年没有重要更新,对于构建复杂的网页应用也越来越显得力不从心。 HTML5不是.........【阅读全文】
发布时间:2013-05-16 15:45:45
本来是想把这部分内容放到《数据抓取的艺术(二)》之中。但是随着任务的完成,我越来越感觉到其中深深的趣味,现总结如下: (1)时间 时间是一个与抓取规模相形而生的因素,数据规模越大,时间消耗往往越长。所以程序优化变得相当重要,要知道抓取时间越.........【阅读全文】
发布时间:2013-05-16 13:02:12
接前文:《数据抓取的艺术(一):Selenium+Phantomjs数据抓取环境配置》。一、程序优化程序优化:第一步开始:for i in range(startx,total): for j in range(starty,total): &.........【阅读全文】
skyfish8u82013-01-08 17:37
请我glance报错如下,安装glance过程都没报错,怎么解决?
root@testB:~# glance index
Failed to show index. Got error:
There was an error connecting to a server
Details: [Errno -2] Name or service not known