分类: Python/Ruby
2011-06-09 14:34:22
从开始玩网络已经是很久远的事了,至少感觉上是这样吧。那时Mosaic刚刚放出第一个版本,Gopher和Wais还依然是炙手可热的技术,我就找到了一个叫做Plexus的HTTP服务器程序。它的不同之处在于它是以Perl来执行的,这使它更易于扩展。当时还没有发明CGI,因此我们所有的只是servlets(尽管那时我们还不这么叫它)。随着时间的推移我逐渐从服务器端编程转向客户端的编程,但是始终不变的把Perl作为我的语言。结果就是我参与到Perl网络客户端库—LWP中来。
兹此后网络世界风起云涌。今天在我们的十指之端是几乎无可穷尽的信息:新闻、股票报价、天气预报、政务信息、购物、讨论组、产品信息、评论、游戏及别的娱乐方面的。而好消息就是LWP可以帮助自动处理所有这一切。
本书将告诉你如何使用LWP和与之相关的HTML模块写你自己有用的网站客户端程序。Sean做了大量的工作来展示这个库在用来制作自动处理有关网站的各种各样的任务而使用的工具时是如何之强大。也许你和我一样也有许多你要反复不断地填写的网页表单,那为何不写一个基于LWP的简单工具来为你完成呢?或是写一个不用你点一下鼠标就可以通过从很多网页里收集数据而为你做调研的工具?读完本书,你就完全具备了处理诸如此类任务的能力。
本书的焦点是如何针对传统Web浏览器而建立的服务来写脚本。也就是指那些通过HTML而提供的服务。尽管在一个人们已经发现Web是完全可以提供程序间接口的世界里(时下如火如荼的“Web Services”),但是可能HTML抓取作为从网络获取信息这种很有价值的途径依然会持续下去。我强烈认同Perl和LWP是这方面工作的极致之选。阅读Perl & LWP是带你入门的良途。
很高兴书写及维护LWP的基本代码,而且Sean写了这么一本使用它的好书。希望喜欢!
—Gisle Aas
LWP的主要作者和维护人