Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1574126
  • 博文数量: 399
  • 博客积分: 8508
  • 博客等级: 中将
  • 技术积分: 5302
  • 用 户 组: 普通用户
  • 注册时间: 2009-10-14 09:28
个人简介

能力强的人善于解决问题,有智慧的人善于绕过问题。 区别很微妙,小心谨慎做后者。

文章分类

全部博文(399)

文章存档

2018年(3)

2017年(1)

2016年(1)

2015年(69)

2013年(14)

2012年(17)

2011年(12)

2010年(189)

2009年(93)

发布时间:2013-09-19 07:05:41

一、模块导入        Python有两种导入模块的方法,import module和from module import,二者功能基本相同,但也有细微差别,举例说明如下:        >>> import types        >>> types.FunctionType   &nbs.........【阅读全文】

阅读(1562) | 评论(0) | 转发(0)

发布时间:2013-09-19 06:55:44


Hive是目前应用最多最广的SQL on Hadoop工具,近期很多专业的大数据公司推出了很多新的,基于列式或者内存热数据的SQL工具,像Impala,Tez,Spark等等,但是Hive仍然是目前使用率最高和普及面最广的SQL on Hadoop的工具。在以前淘宝罗李的报告中,淘宝90%的业务跑在Hive上面。暴风影音的比例更高一些,大概95%以上都是跑在Hive上面。尽管很多人对Hive有看法,效率低,查询慢,bug多。但是并不可否认hive是一个开创性的工具,提供了更多的想象空间。而且,在生产集群上的数据查询程序的开发效率,Hive要远远高于自己写MR。......【阅读全文】

阅读(1633) | 评论(0) | 转发(0)
给主人留下些什么吧!~~

我本痴情2013-12-26 15:33

谢谢你的分享,收益颇多,谢谢

回复  |  举报

shiluodan2013-08-08 20:55

还只是菜鸟,不过还是希望能看到那些很厉害的博文。很感谢你的分享。

回复  |  举报
留言热议
请登录后留言。

登录 注册