Chinaunix首页 | 论坛 | 博客
  • 博客访问: 471203
  • 博文数量: 153
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 1575
  • 用 户 组: 普通用户
  • 注册时间: 2016-12-20 17:02
文章分类

全部博文(153)

文章存档

2017年(111)

2016年(42)

我的朋友

分类: 大数据

2017-01-24 16:53:57

1月15日在北京举行了首次阿里云大数据合作伙伴深度培训,我司获邀参加,我和两名研发的同学又一次来到了阿里巴巴望京园区。

?

2a9b92e211b09408f2691703a9bf66e56bbc9fa6

> 培训的第一部分内容、数加的介绍及应用

除了介绍性内容之外,还是有「干货」的,这个干货就是MaxCompute 的实践。MaxCompute原来叫做ODPS,,是阿里整个大数据解决方案的基础。

a52d1a099484a7ad6b89dfb453810297d878ea35

上来,给我们讲了什么事数据分析,话说我们是来学习大数据的,干嘛还要研究数据分析?
因为:大数据不是用来吹的!?

a33989a0015370e36bc5cc9e43c6b672aef68100

通过数据分析能够获得的好处有很多,但最重要的是获得数据化运营的能力!
为啥要数据化运营?
因为:百度、阿里巴巴、腾讯、苹果、谷歌、亚马逊的运营一个比一个的数据化,一个赛一个的赚钱!

48dffbbd76ca17bd1fd5e723acc193b911392263

又开始讲数据仓库了,说这个干嘛,我们不是要数据化运营吗?没有数据咋运营,数据多了自然就需要仓库放呗!
数据仓库领域已经发展了30多年了,大数据不是在颠覆,而是继承和扩展了相关领域知识。
「大」数据和「小」数据的分析处理流程是基本一致的。

1ae2985552ebd4be825a4816e6fc110383fbcc14

你听说过星型模型么?那你听说过范式模型么?
反正,在数据分析应用场景下是不太关注数据重复的,通常采用星型模型组织数据;在线业务应用场景需要尽量避免数据的重复存储,通常采用范式模型进行数据存储。
星型模型就是通过把数据组织成维度和事实表的一种数据建模方式,数据通过星型模式组织更有利于理解和分析。
这种建模方式数据仓库已经用了三十年,大数据仓库还要继续用。


阅读全文直接点击:
阅读(2084) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~