更多python、Linux、网络安全学习内容,可移步:www.oldboyedu.com或关注\"老男孩Linux\"公众号
分类: Python/Ruby
2021-06-02 16:09:22
Python是网络爬虫的首选语言,而Scrapy是写爬虫必须懂的框架,它是一个为了爬取网站数据,提取结构性数据而编写的应用框架,出名且强悍,接下来我们通过这篇文章详细的了解一下Scrapy框架。
什么是框架?
所谓的框架简单通用解释,就是一个具有很强通用性并且集成了很多功能的项目模板,该模板可被应用在不同的项目需求中,也可被视为是一个项目的半成品。
如何学习框架?
学习是框架中集成好的各种功能的特性是作用。
对于刚接触编程或者初级程序员来讲,对于一个新的框架,只需要掌握该框架的作用及各个功能的使用和应用即可,对于框架的底层实现和原理,在逐步进阶的过程中在慢慢深入即可。
什么是Scrapy框架?
Scrapy是一个为了抓取网站数据,提取结构性数据而编写的应用框架,非常出名,非常强悍。其内部已经被集成了各种功能,比如:高性能异步下载、队列、分布式、解析、持久化等。对于框架的学习,重点是学习其框架的特性、各个功能的用法即可。
Scrapy框架环境如何安装?
Mac、Linux安装:
pip install scrapy
Windows安装:
1. Pip3 install wheel
2. 下载twisted 地址为:~gohlke/pythonlibs/#twisted
3. 进入下载目录,执行pip install Twisted17.1.0cp36cp36mwin_amd64.whl,Twisted就是一个异步的的架构,被作用在scrapy中
4. pip3 install pywin32
5. pip3 install scrapy
6. 测试:在终端里录入scrapy指令,没有报错即表示安装成功。