常用的Python爬虫与Web开发库介绍 Python学习-zhufenjun2017-ChinaUnix博客

老男孩Linux培训oldboyedu.com

首页　| 　博文目录　| 　关于我

zhufenjun2017

博客访问： 921395
博文数量： 354
博客积分： 0
博客等级：民兵
技术积分： 3730
用户组：普通用户
注册时间： 2017-08-21 18:43

文章分类

全部博文（354）

新媒体+短视频运（3）
测试开发（1）
go（7）
MySQL（43）
Java（46）
大数据（9）
Python（39）
Linux（206）
未分配的博文（0）

文章存档

2019年（126）

2018年（223）

2017年（5）

我的朋友

相关博文

常用的Python爬虫与Web开发库介绍 Python学习

分类： Python/Ruby

2018-05-11 14:35:21

　　Python爬虫和Web开发均是与网页相关的知识技能，无论是自己搭建的网站还是爬虫爬取别人的网站，都离不开相应的Python库，以下是常用的Python爬虫与Web开发库。

　　1.爬虫库

　　beautifulsoup4、urllib2、lxml和requests是学习Python爬虫必备的库，必须要掌握，当然有的同学说爬网页不是也可以用正则表达式吗，确实可以，但是会很不方便，因为bs4和lxml都有便捷的接口，一般我们都是和正则结合使用，如果对速度有要求的话，建议用lmxp，它比bs4 速度要快很多。

　　2.Scrapy

　　爬虫的世界里面有没有懒人专用的框架，当然有啦，scrapy就是其中比较有名的，可以快速、高层次的web抓取网页，并从web站点的页面中提取结构化的数据。

　　Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。最爽的就是它是一个框架，任何人都可以根据需求方便的修改，里面有很多类型爬虫的基类，如BaseSpider、sitemap爬虫等

　　3.Web框架

　　Django算是Python web框架里重量级的选手，主要是因为它提供了一站式的解决方案，包括缓存、ORM、后台管理、验证和表单等，使得开发复杂的数据库驱动的网站变的很简单，而且有非常齐备的官方文档。

　　Flask设计的理念跟Django完全相反，它是轻量级Web应用框架的代表。它只保留核心的功能，其他的功能都是可以变动，可以扩展的，你可以更加直接的需求灵活搭配。

　　Tornado全称叫Tornado Web Server，目前是Facebook开源的一个版本，它和其他主流的框架有一个非常明显的区别：就是非阻塞式服务器,速度非常快。特别对于长轮询，WebSocket等实时要求高的web服务来说是一个福音,基本可以和Node.js一决高下。

阅读(686) | 评论(0) | 转发(0) |

上一篇：Python数据分析库有什么？Python开发学习

下一篇：Linux运维学习之NFS网络文件系统介绍

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6