狂甩酷拽吊炸天
发布时间:2018-01-18 16:42:07
原 hive的复合数据类型hive中的列支持使用三类复杂的集合数据类型,即:array,map及struct,这些类型的名称是保留字,具体用法可参见该篇博文,里面有关于三类基本集合数据类型的操作实例,注:map中可.........【阅读全文】
发布时间:2018-01-18 16:11:06
hive中order by,sort by, distribute by, cluster by作用以及用法1. order by Hive中的order by跟传统的sql语言中的order by作用是一样的,会对查询的结果做一次全局排序,所以说,只有hive的sql中制定了order by所有的数据都会到同一个reducer.........【阅读全文】
发布时间:2018-01-18 11:27:21
最近在 Google 上看到一篇在 Hive 中利用正则表达式来自定义反序列化处理文本文件。百度后发现这块知识目前还没有人系统的总结一下。所以我就不才把之前记录的资料跟大家分享一下:SerDe 是Serializer 和 Deserializer 的简称。它是 Hive用来处理记录并且将它们映射到 Hive 表中的字段数据类型。为了更好的阐.........【阅读全文】
发布时间:2016-04-20 17:58:13
zookeeper、hadoop、hbase、redis、rabbitMQ单机部署及遇到的问题......【阅读全文】
发布时间:2016-03-15 15:58:04
Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。对于Hadoop的集群来讲,.........【阅读全文】