狂甩酷拽吊炸天
发布时间:2018-11-16 09:46:42
【转自:http://blog.sina.com.cn/s/blog_6ff05a2c01016j7n.html】 经常看到一些Hive优化的建议中说当小表与大表做关联时,把小表写在前面,这样可以使Hive的关联速度更快,提到的原因都是说因为小表可以先放到内存中,然后大表的每条记录再去内存中检测,最终完成关联查询。这样的原因看似合理,.........【阅读全文】
发布时间:2018-11-14 19:51:03
原文:https://www.cnblogs.com/camilla/p/8301750.htmlpark submit参数介绍你可以通过spark-submit --help或者spark-shell --help来查看这些参数。 使用格式: ./bin/spark-submit \ --class <main-class> \ --master <ma.........【阅读全文】
发布时间:2018-11-07 10:48:49
1、MapReduce计数器是什么? 计数器是用来记录job的执行进度和状态的。它的作用可以理解为日志。我们可以在程序的某个位置插入计数器,记录数据或者进度的变化情况。2、MapReduce计数器能做什么? MapReduce 计数器(Counter)为我们提供一个窗口,用于观察 MapReduce .........【阅读全文】
发布时间:2018-09-28 19:00:13
二叉排序树又称为二叉查找树。它或者是一颗空树,或者是具有下列性质的二叉树:若它的左子树不为空,则左子树上所有节点的值均小于它的根结构的值;若它的右子树不为空,则右子树上所有节点的值均大于它的根结构的值;它的左、右子树也分别为二叉排序树。二叉树的第i层至多有2^{i-1}个结.........【阅读全文】