分类: 大数据
2017-01-24 16:53:57
1月15日在北京举行了首次阿里云大数据合作伙伴深度培训,我司获邀参加,我和两名研发的同学又一次来到了阿里巴巴望京园区。
?
除了介绍性内容之外,还是有「干货」的,这个干货就是MaxCompute 的实践。MaxCompute原来叫做ODPS,,是阿里整个大数据解决方案的基础。
上来,给我们讲了什么事数据分析,话说我们是来学习大数据的,干嘛还要研究数据分析?
因为:大数据不是用来吹的!?
通过数据分析能够获得的好处有很多,但最重要的是获得数据化运营的能力!
为啥要数据化运营?
因为:百度、阿里巴巴、腾讯、苹果、谷歌、亚马逊的运营一个比一个的数据化,一个赛一个的赚钱!
又开始讲数据仓库了,说这个干嘛,我们不是要数据化运营吗?没有数据咋运营,数据多了自然就需要仓库放呗!
数据仓库领域已经发展了30多年了,大数据不是在颠覆,而是继承和扩展了相关领域知识。
「大」数据和「小」数据的分析处理流程是基本一致的。
你听说过星型模型么?那你听说过范式模型么?
反正,在数据分析应用场景下是不太关注数据重复的,通常采用星型模型组织数据;在线业务应用场景需要尽量避免数据的重复存储,通常采用范式模型进行数据存储。
星型模型就是通过把数据组织成维度和事实表的一种数据建模方式,数据通过星型模式组织更有利于理解和分析。
这种建模方式数据仓库已经用了三十年,大数据仓库还要继续用。