HIVE的基础知识-jiongtoast-ChinaUnix博客

jiongtoast的ChinaUnix博客

首页　| 　博文目录　| 　关于我

jiongtoast

博客访问： 59237
博文数量： 15
博客积分： 0
博客等级：民兵
技术积分： 206
用户组：普通用户
注册时间： 2013-10-23 13:47

文章分类

全部博文（15）

数据处理（0）
Impala（1）
hadoop（2）
喃喃自语（4）
Hive（8）
未分配的博文（0）

文章存档

2013年（15）

我的朋友

相关博文

HIVE的基础知识

分类：大数据

2013-10-25 10:59:30

静下心来学习HIVE，做个笔记，能回答清楚下面的问题：
1、HIVE是什么？
2、HIVE的结构？
3、HIVE能干什么？
4、HIVE怎么干的？
5、HIVE干得怎么样？

1、HIVE是什么？
答：简单地说，Hive是基于Hadoop的数据仓库工具，可以将SQL转化为MapReduce任务，开发成本低，比较适合数据仓库的统计分析。

2、HIVE的结构？
答：可以将Hive分为服务器组件和客户端组件两部分：
服务器组件包括：（a）Drive：为类SQL语句（称为HQL）提供编译、调试、运行的功能，提交至MapReduce；
（b）Metastroe：元数据组件，提供元数据存储和服务，Hive支持Derby（默认）和My SQL数据库，元数据存储在Derby所在介质，metastore服务调用元数据；
（c）Thrift：facebook开发的一个软件框架，Hive集成了这个服务，以支持不同语言调用Hive接口。
客户端组件包括：（a）CLI：命令行；
（b）Web GUI：web端的图形界面；
（c）：Thrift客户端。

3、HIVE能干什么？
答：Google提出MapReduce的背景是海量数据且结构化、非结构数据都有，其实质是批处理方式，进行数据统计分析时开发效率及计算效率十分低下。程序员们在DBMS体现下对SQL的使用已经到了无以复加的地步，因此，Hive提出HQL语言，以类sql这种更友好的方式来完成MapReduce任务，在处理非结构化数据时，能发现Hive优势明显。

4、HIVE怎么干的？
这里借用一张图，Hadoop是基础，HIVE在其之上，在客户端以HQL发起一个查询，Hive通过元数据返回执行计划，并将计划提交至计算引擎，计算引擎通过Map/Reduce来执行：

5、HIVE干得怎么样？
答：呃，初学不好断定，随学习深入再做回答。

阅读(2149) | 评论(1) | 转发(1) |

上一篇：没有了

下一篇：Hive的安装配置

给主人留下些什么吧！~~

7大爷2013-10-28 09:30:40

学习学习~

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6