Chinaunix首页 | 论坛 | 博客
  • 博客访问: 466495
  • 博文数量: 85
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 32
  • 用 户 组: 普通用户
  • 注册时间: 2013-04-13 13:49
文章分类

全部博文(85)

文章存档

2018年(1)

2014年(40)

2013年(44)

发布时间:2018-03-17 21:59:18

......【阅读全文】

阅读(2122) | 评论(0) | 转发(0)

发布时间:2014-01-26 23:02:02

......【阅读全文】

阅读(2465) | 评论(0) | 转发(0)

发布时间:2014-01-26 23:00:09

......【阅读全文】

阅读(2210) | 评论(0) | 转发(0)

发布时间:2014-01-26 22:59:24

有人问我,“你在大数据和Hadoop方面有多少经验?”我告诉他们,我一直在使用Hadoop,但是我处理的数据集很少有大于几个TB的。他们又问我,“你能使用Hadoop做简单的分组和统计吗?”我说当然可以,我只是告诉他们我需要看一些文件格式的例子。他们递给我一个包含600MB数据的闪盘,看起来这些数据并非样本数据,由于一.........【阅读全文】

阅读(2496) | 评论(0) | 转发(0)

发布时间:2014-01-26 22:55:18

linux平台下有个ls指令,大家都很熟悉:① ls | grep 2008   查询文件名包含2008的文件(这其实就是一个map,找到需要的数据)② ls | grep 2008 | wc -l 计算上述指令查询文件个数(这其实就是一个reduce,对找到数据进行汇总聚合) 再来一个例子,关于SQL:select * from device&nb.........【阅读全文】

阅读(2649) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册