Chinaunix首页 | 论坛 | 博客
  • 博客访问: 116918
  • 博文数量: 42
  • 博客积分: 2100
  • 博客等级: 大尉
  • 技术积分: 481
  • 用 户 组: 普通用户
  • 注册时间: 2006-09-25 21:27
文章分类

全部博文(42)

文章存档

2011年(4)

2009年(3)

2008年(9)

2007年(22)

2006年(4)

我的朋友

分类: 系统运维

2007-09-12 14:13:33

Introduction

Heritrix is the Internet Archive's open-source, extensible, web-scale, archival-quality web crawler project.

Heritrix (sometimes spelled heretrix, or misspelled or missaid as heratrix/heritix/ heretix/heratix) is an archaic word for heiress (woman who inherits). Since our crawler seeks to collect and preserve the digital artifacts of our culture for the benefit of future researchers and generations, this name seemed apt.

more info


阅读(1131) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~