Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1683815
  • 博文数量: 297
  • 博客积分: 2907
  • 博客等级: 中校
  • 技术积分: 1540
  • 用 户 组: 普通用户
  • 注册时间: 2010-03-12 09:16
文章分类

全部博文(297)

文章存档

2018年(8)

2016年(2)

2015年(27)

2014年(33)

2013年(210)

2011年(3)

2010年(14)

发布时间:2013-07-04 23:39:21

网络爬虫(web crawler)又称为网络蜘蛛(web spider)是一段计算机程序,它从互联网上按照一定的逻辑和算法抓取和下载互联网的网页,是搜索引擎的一个重要组成部分。一般的爬虫从一部分start url开始,按照一定的策略开始爬取,爬取到的新的url在放入到爬取队列之中,然后进行新一轮的爬取,直到抓取完毕为止。我们看.........【阅读全文】

阅读(5619) | 评论(0) | 转发(1)

发布时间:2013-07-04 13:38:19

一、 Scrapy简介Scrapy is a fast high-level screen scraping and web crawling framework, used to crawl websites and extract structured data from their pages. It can be used for a wide range of purposes, from data mining to monitoring and automated testing.官方主页: http://www.scrapy.org/.........【阅读全文】

阅读(1036) | 评论(0) | 转发(1)

发布时间:2013-07-04 13:33:50

关键字:scrapy 入门教程 爬虫 Spider作者:http://www.cnblogs.com/txw1958/出处:http://www.cnblogs.com/txw1958/archive/2012/07/16/scrapy-tutorial.html  在这篇入门教程中,我们假定你已经安装了Scrapy。如果你还没有安装,那么请参考安装指南。我们将使用开放目录项目(dmoz)作为.........【阅读全文】

阅读(1528) | 评论(0) | 转发(1)
给主人留下些什么吧!~~

urgel_babay2016-05-11 11:05

转载了!仅作学习之用,谢谢

回复  |  举报

lkyuang2014-09-18 10:48

Echo "/usr/local/agent/sbin/zabbix_agentd -c /usr/local/agent/etc/zabbix_agentd.conf" >>/etc/tc.local


这个地方的开头 "Echo" 首字母不应该大写,  末尾的“tc.local”是不是打错了啊  “rc.local”

回复  |  举报

wgyzhechao2011-04-22 09:17

baby

回复  |  举报

蓝色虫2011-03-26 10:04

踩踩

回复  |  举报

iCymbidium2011-01-07 10:39

chinaboywg: 5年后CISSP早不值钱了
它要五年工作经验。。。那就看5年后啥好就考啥!O(∩_∩)O

回复  |  举报
留言热议
请登录后留言。

登录 注册