Chinaunix首页 | 论坛 | 博客
  • 博客访问: 63107
  • 博文数量: 26
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 144
  • 用 户 组: 普通用户
  • 注册时间: 2014-06-03 14:54
文章分类

全部博文(26)

文章存档

2014年(26)

我的朋友

发布时间:2014-06-08 21:59:17

      接前文:《数据抓取的艺术(一):Selenium+Phantomjs数据抓取环境配置》。一、程序优化程序优化:第一步开始:for i in range(startx,total):    for j in range(starty,total):  &.........【阅读全文】

阅读(754) | 评论(0) | 转发(0)

发布时间:2014-06-08 21:59:10

   数据抓取是一门艺术,和其他软件不同,世界上不存在完美的、一致的、通用的抓取工具。为了不同的目的,需要定制不同的代码。不过,我们不必Start from Scratch,已经有许多的基本工具、基本方法和基础框架可供使用。不同的工具、不同的方法、不同的框架的特点也不同。了解这些工具、方法和框架是首要任务,接.........【阅读全文】

阅读(698) | 评论(0) | 转发(0)

发布时间:2014-06-08 21:55:01

    ICTCLAS是张华平博士的杰作,经过多版本的演进后,于2014年释出的新版本,当然新版改名叫做NLPIR了,支持中英文分词,词性标注,关键语义提取,微博分词,修缮了部分bug,非商用永久免费。其中,对C/C++/C#/JAVA语言的支持都已非常完善,但我用的是Python,之前选择的是SCWS组件,但在实际使用过程中感.........【阅读全文】

阅读(1112) | 评论(0) | 转发(0)

发布时间:2014-06-08 21:54:50

   毋庸置疑,LibSVM是台湾牛人为世界机器学习的卓越贡献之一。一般都是基于Matlab的,其实LibSVM也可以用Python跑。   第一步,确定本机Python的版本:   32位的最易配置,哈哈,我的机器就是这么的古董。64位的童鞋请Google。   第二步,到官网http://www.csie.ntu.edu.........【阅读全文】

阅读(1559) | 评论(0) | 转发(0)

发布时间:2014-06-08 21:54:40

      由于最近手头项目需要,我查阅了Python相关的机器学习库。我将不断地更新本贴,从而详细说明各个库的优劣。一、前提      在Pthon下做机器学习,需要科学计算包和绘图库的支持,科学计算则是NumPy或SciPy,似乎NumPy更流行些。画图工具包则必定为matplotlib。这些都是开源、免.........【阅读全文】

阅读(878) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册