hive，hadoop，yarn相关总结_jelon521-ChinaUnix博客

宝马追猪

首页　| 　博文目录　| 　关于我

jelon521

博客访问： 1118459
博文数量： 165
博客积分： 0
博客等级：民兵
技术积分： 1352
用户组：普通用户
注册时间： 2016-03-11 14:13

个人简介

狂甩酷拽吊炸天

文章分类

全部博文（165）

软件安装（4）
python相关（17）
黑客之道（3）
数据库（16）
想coding吗？（10）
大数据（30）
关于linux（84）
未分配的博文（1）

文章存档

2024年（1）

2023年（1）

2022年（3）

2021年（4）

2020年（17）

2019年（37）

2018年（17）

2017年（35）

2016年（50）

我的朋友

最近访客

推荐博文

hive，hadoop，yarn相关总结

发布时间：2019-03-12 20:31:49

Hadoop参数调优 1. 设置合理的槽位数目在Hadoop中，计算资源是用槽位（slot）表示的。slot分为两种：Map slot和Reduce slot。 2. 调整心跳间隔心跳中包含节点资源使用情况、各任务运行状态等信息，如果太小，NameNode需要处理高并发的心跳信息，势必造成不小的压力；如果太大，则空闲的资源不能及时通知NameNod.........【阅读全文】

阅读(14429) | 评论(0) | 转发(0)

HBase基本架构及原理

发布时间：2018-11-16 20:33:25

原文：https://www.cnblogs.com/csyuan/p/6543018.htmlHBase是一个分布式的、面向列的开源数据库，它不同于一般的关系数据库,是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。HBase使用和 BigTable非常相同的数据模型。用户存储数据行在一个表里。一个数据行拥有一个可选择的键.........【阅读全文】

阅读(1552) | 评论(0) | 转发(0)

Hive中小表与大表关联(join)的性能分析

发布时间：2018-11-16 09:46:42

【转自：http://blog.sina.com.cn/s/blog_6ff05a2c01016j7n.html】经常看到一些Hive优化的建议中说当小表与大表做关联时，把小表写在前面，这样可以使Hive的关联速度更快，提到的原因都是说因为小表可以先放到内存中，然后大表的每条记录再去内存中检测，最终完成关联查询。这样的原因看似合理，.........【阅读全文】

阅读(1577) | 评论(0) | 转发(0)

spark submit参数及调优

发布时间：2018-11-14 19:51:03

原文：https://www.cnblogs.com/camilla/p/8301750.htmlpark submit参数介绍你可以通过spark-submit --help或者spark-shell --help来查看这些参数。使用格式: ./bin/spark-submit \ --class <main-class> \ --master <ma.........【阅读全文】

阅读(1336) | 评论(0) | 转发(0)

MapReduce计数器

发布时间：2018-11-07 10:48:49

1、MapReduce计数器是什么？计数器是用来记录job的执行进度和状态的。它的作用可以理解为日志。我们可以在程序的某个位置插入计数器，记录数据或者进度的变化情况。2、MapReduce计数器能做什么？ MapReduce 计数器（Counter）为我们提供一个窗口，用于观察 MapReduce .........【阅读全文】

阅读(1141) | 评论(0) | 转发(0)

给主人留下些什么吧！~~

jelon5212016-08-25 16:44

回复　　| 　举报

留言热议

请登录后留言。

登录注册

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6