Chinaunix首页 | 论坛 | 认证专区 | 博客 登录 | 注册

hiya的技术博客hiyachen.blog.chinaunix.net

大数据、云计算、Linux操作系统、虚拟化

  • 博客访问: 4242120
  • 博文数量: 674
  • 博客积分: 10821
  • 博客等级: 上将
  • 技术积分: 11384
  • 用 户 组: 普通用户
  • 注册时间: 2005-12-02 10:41
  • 认证徽章:
个人简介

专注与操作系统相关的云计算,linux,openstack,spark, hadoop

文章分类

全部博文(674)

微信关注

IT168企业级官微



微信号:IT168qiye



系统架构师大会



微信号:SACC2013

订阅
热词专题
spark和redis集群部署 2016-04-19 22:25:21

分类: 大数据

https://redislabs.com/solutions/spark-and-redis
spark和redis部署:
http://www.kuqin.com/shuoit/20160413/351548.html
spark在美团
http://tech.meituan.com/spark-in-meituan.html
python和R之争
https://segmentfault.com/a/1190000004879349

在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Data Analysis),也就是A型数据科学。偏向工程的数据科学被称为数据构建(Data Building),也就是B型数据科学。

从工具上来看,按由业务到工程的顺序,这个两条是:EXCEL >> R >> Python >> Scala

阅读(1830) | 评论(0) | 转发(0) |
0

上一篇:elasticsearch学习

下一篇:hadoop+lucene

给主人留下些什么吧!~~
评论热议
请登录后评论。

登录 注册