Chinaunix首页 | 论坛 | 博客
  • 博客访问: 65182
  • 博文数量: 26
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 144
  • 用 户 组: 普通用户
  • 注册时间: 2014-06-03 14:54
文章分类

全部博文(26)

文章存档

2014年(26)

我的朋友

发布时间:2014-06-08 22:26:15

查看Git版本$ git --version配置Git变量这些设置会在全局文件(用户主目录下的.gitconfig)或系统文件(如/etc/gitconfig)中做永久记录配置用户名和邮件地址:(将在版本库提交时用到,为确保提交者信息的正确性一定要设置)$ git config --global user.name "your name"$ git config --global .........【阅读全文】

阅读(849) | 评论(0) | 转发(0)

发布时间:2014-06-08 22:24:36

软件包git-doc包含了Git的HTML格式的文档。可以通过执行git help -w <sub-command>命令自动用web浏览器打开相关子命令<sub-command>的HTML帮助。从Git版本库进行安装的方法:如果在本地克隆一个Git项目的版本库,就可以用版本库同步的方式获取最新版本的Git,这样在下载不同版本的Git源代码时实际上采用了增量方.........【阅读全文】

阅读(884) | 评论(0) | 转发(0)

发布时间:2014-06-08 21:59:51

     世界上已经成型的爬虫软件多达上百种,本文对较为知名及常见的开源爬虫软件进行梳理,按开发语言进行汇总,如下表所示。虽然搜索引擎也有爬虫,但本次我汇总的只是爬虫软件,而非大型、复杂的搜索引擎,因为很多兄弟只是想爬取数据,而非运营一个搜索引擎。开源爬虫汇总表.........【阅读全文】

阅读(1112) | 评论(0) | 转发(0)

发布时间:2014-06-08 21:59:37

     本来是想把这部分内容放到《数据抓取的艺术(二)》之中。但是随着任务的完成,我越来越感觉到其中深深的趣味,现总结如下:     (1)时间     时间是一个与抓取规模相形而生的因素,数据规模越大,时间消耗往往越长。所以程序优化变得相当重要,要知道抓取时间越.........【阅读全文】

阅读(847) | 评论(0) | 转发(0)

发布时间:2014-06-08 21:59:17

      接前文:《数据抓取的艺术(一):Selenium+Phantomjs数据抓取环境配置》。一、程序优化程序优化:第一步开始:for i in range(startx,total):    for j in range(starty,total):  &.........【阅读全文】

阅读(782) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册