专注 K8S研究
发布时间:2013-07-04 13:38:19
一、 Scrapy简介Scrapy is a fast high-level screen scraping and web crawling framework, used to crawl websites and extract structured data from their pages. It can be used for a wide range of purposes, from data mining to monitoring and automated testing.官方主页: http://www.scrapy.org/.........【阅读全文】
发布时间:2013-07-04 13:33:50
关键字:scrapy 入门教程 爬虫 Spider作者:http://www.cnblogs.com/txw1958/出处:http://www.cnblogs.com/txw1958/archive/2012/07/16/scrapy-tutorial.html 在这篇入门教程中,我们假定你已经安装了Scrapy。如果你还没有安装,那么请参考安装指南。我们将使用开放目录项目(dmoz)作为.........【阅读全文】
发布时间:2013-07-02 15:07:00
python 字符串的split方法是用的频率还是比较多的。比如我们需要存储一个很长的数据,并且按照有结构的方法存储,方便以后取数据进行处理。当然可以用json的形式。但是也可以把数据存储到一个字段里面,然后有某种标示符来分割。比如我们的存储的格式的:格式的:姓名,年龄|另外一个用户姓名,年龄name:haha,age:20.........【阅读全文】
发布时间:2013-07-02 15:04:30
python 获取日期我们需要用到time模块,比如time.strftime方法time.strftime('%Y-%m-%d',time.localtime(time.time()))最后用time.strftime()方法,把刚才的一大串信息格式化成我们想要的东西,现在的结果是:2013-03-31time.strftime里面有很多参数,可以让你能够更随意的输出自己想要的东西:下面是time.strftime.........【阅读全文】
发布时间:2013-07-02 14:54:08
python 字符串里面的join方法用的还是比较多,我们一般需要把列表或者元组连接成字符串,可以用这个。比如 info = ('a','b','c'),我们需要输出:'a+b+c'可以用字符串的join方法:c = "+".join(info)上面的元组,我们改一个列表看看:ainfo = ['a','b','c']c = "##".join(ainfo)输出结果:a##b##c.........【阅读全文】