Chinaunix首页 | 论坛 | 博客
  • 博客访问: 37284
  • 博文数量: 36
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 215
  • 用 户 组: 普通用户
  • 注册时间: 2017-05-11 14:32
文章分类

全部博文(36)

文章存档

2018年(4)

2017年(32)

我的朋友

发布时间:2017-07-26 10:20:34

1.了解正则表达式正则表达式是用来匹配字符串非常强大的工具,在其他编程语言中同样有正则表达式的概念,Python同样不例外,利用了正则表达式,我们想要从返回的页面内容提取出我们想要的内容就易如反掌了。2.正则表达式的语法规则(1)数量词的贪婪模式与非贪婪模式注:我们一般使用非贪婪模式来提.........【阅读全文】

阅读(420) | 评论(0) | 转发(0)

发布时间:2017-07-20 10:35:33

1. Beautiful Soup的简介Beautiful Soup提供一些简单的、python式的用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码.........【阅读全文】

阅读(516) | 评论(0) | 转发(0)

发布时间:2017-07-10 15:32:42

  我们最常规的做法就是通过鼠标右键,选择另存为。但有些图片鼠标右键的时候并没有另存为选项,还有办法就通过就是通过截图工具截取下来,但这样就降低图片的清晰度。好吧~!其实你很厉害的,右键查看页面源代码。python 来实现这样一个简单的爬虫功能,把我们想要的代码爬取到本地。下面就看看如何使用&nbs.........【阅读全文】

阅读(369) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册