Chinaunix首页 | 论坛 | 博客
  • 博客访问: 63095
  • 博文数量: 26
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 144
  • 用 户 组: 普通用户
  • 注册时间: 2014-06-03 14:54
文章分类

全部博文(26)

文章存档

2014年(26)

我的朋友

发布时间:2014-07-06 20:38:37

作为主流开发语言, 用python 开发的程序越来越多。 方便的是大多linux系统里面都默认集成了python, 开发可以随时随地开始。 但有时候这也成为了一个短板, 比如说有时候我们需要开发和调试一些需要安装在默认python路径里的程序, 反复地修改和安装会使系统目录越来越乱,这对于一些有洁癖的程序员来说是不可接.........【阅读全文】

阅读(1374) | 评论(0) | 转发(0)

发布时间:2014-06-08 22:26:15

查看Git版本$ git --version配置Git变量这些设置会在全局文件(用户主目录下的.gitconfig)或系统文件(如/etc/gitconfig)中做永久记录配置用户名和邮件地址:(将在版本库提交时用到,为确保提交者信息的正确性一定要设置)$ git config --global user.name "your name"$ git config --global .........【阅读全文】

阅读(822) | 评论(0) | 转发(0)

发布时间:2014-06-08 22:24:36

软件包git-doc包含了Git的HTML格式的文档。可以通过执行git help -w <sub-command>命令自动用web浏览器打开相关子命令<sub-command>的HTML帮助。从Git版本库进行安装的方法:如果在本地克隆一个Git项目的版本库,就可以用版本库同步的方式获取最新版本的Git,这样在下载不同版本的Git源代码时实际上采用了增量方.........【阅读全文】

阅读(855) | 评论(0) | 转发(0)

发布时间:2014-06-08 21:59:51

     世界上已经成型的爬虫软件多达上百种,本文对较为知名及常见的开源爬虫软件进行梳理,按开发语言进行汇总,如下表所示。虽然搜索引擎也有爬虫,但本次我汇总的只是爬虫软件,而非大型、复杂的搜索引擎,因为很多兄弟只是想爬取数据,而非运营一个搜索引擎。开源爬虫汇总表.........【阅读全文】

阅读(1079) | 评论(0) | 转发(0)

发布时间:2014-06-08 21:59:37

     本来是想把这部分内容放到《数据抓取的艺术(二)》之中。但是随着任务的完成,我越来越感觉到其中深深的趣味,现总结如下:     (1)时间     时间是一个与抓取规模相形而生的因素,数据规模越大,时间消耗往往越长。所以程序优化变得相当重要,要知道抓取时间越.........【阅读全文】

阅读(816) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册