记录自己运用XPath的入门过程
例子参考,但是因为官网上例子的代码可能有点旧,
照着上面运行,不能通过。
1, 安装iPython和pyreadline模块 http://xilong.blog.51cto.com/4066370/743262
2, 在CMD中运行 scrapy shell
3, hxs = response.selector 这儿比较关键,如果照官网上运行hxs.select('//title/text()')会报错,可能之前的
版本会自动的生一个HtmlXPathselector对象,当前的版本必须自已实例化一个。
4,之后都和官网上的一样,照提示使用推荐的XPath方法而不是select,就OK了。
阅读(982) | 评论(0) | 转发(0) |