Chinaunix首页 | 论坛 | 博客
  • 博客访问: 74030
  • 博文数量: 29
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 272
  • 用 户 组: 普通用户
  • 注册时间: 2015-01-05 20:32
文章分类

全部博文(29)

文章存档

2016年(2)

2015年(27)

我的朋友

分类: Python/Ruby

2015-04-01 13:09:56

记录自己运用XPath的入门过程
例子参考,但是因为官网上例子的代码可能有点旧,
照着上面运行,不能通过。

1, 安装iPython和pyreadline模块    http://xilong.blog.51cto.com/4066370/743262

2, 在CMD中运行 scrapy shell

3, hxs = response.selector 这儿比较关键,如果照官网上运行hxs.select('//title/text()')会报错,可能之前的
    版本会自动的生一个HtmlXPathselector对象,当前的版本必须自已实例化一个。

4,之后都和官网上的一样,照提示使用推荐的XPath方法而不是select,就OK了。






阅读(982) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~