scrapy实战百度百科数据抓取_a741423206-ChinaUnix博客

神奇的老狼

首页　| 　博文目录　| 　关于我

a741423206

博客访问： 168694
博文数量： 47
博客积分： 10
博客等级：民兵
技术积分： 466
用户组：普通用户
注册时间： 2012-10-31 23:12

个人简介

知乎：http://www.zhihu.com/people/chanpinjinglizhilu

文章分类

全部博文（47）

项目经理（2）
产品经理（2）
日常记录（10）
windows（1）
设计（1）
JavasScript（7）
经济（0）
shell（4）
liunx（5）
分析（11）
未分配的博文（4）

最近访客

推荐博文

scrapy实战百度百科数据抓取

发布时间：2015-01-17 17:40:53

Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。架构scrapy中文手册 http://scrapy-chs.readthedocs.org/zh_CN/latest/1.安装SCRAPYhttp://scrapy-chs.readthedocs.org/zh_CN/latest/intro/install.html2.创建一个.........【阅读全文】

阅读(5157) | 评论(0) | 转发(0)

o2o模式发展战略规划

发布时间：2015-01-15 09:12:35

......【阅读全文】

阅读(894) | 评论(0) | 转发(0)

如何分析一个行业

发布时间：2015-01-08 10:27:25

如何分析一个行业......【阅读全文】

阅读(817) | 评论(0) | 转发(0)

如何写一篇产品体验报告

发布时间：2015-01-08 10:18:44

如何写一篇产品体验报告......【阅读全文】

阅读(1201) | 评论(0) | 转发(0)

解密搜索引擎技术之中文分词与实现

发布时间：2014-11-03 11:00:07

中文分词一直都是中文自然语言处理领域的基础研究，也是中文搜索引擎的核心模块之一。目前而言的分词系统绝大多数都是基于中文词典的匹配算法，其中，最为常见的是最大匹配算法 (Maximum Matching，以下简称MM算法) ，而MM算法有三种：一种正向最大匹配、一种逆向最大匹配和双向匹配。本文以正向最大匹配算法为例介绍其基本.........【阅读全文】

阅读(1137) | 评论(0) | 转发(0)

给主人留下些什么吧！~~

留言热议

请登录后留言。

登录注册

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6