hive 、spark 、flink之想一想-京东云开发者-ChinaUnix博客

Chinaunix首页 | 论坛 | 博客

京东云开发者的ChinaUnix博客

首页　| 　博文目录　| 　关于我

京东云开发者

博客访问： 136504
博文数量： 165
博客积分： 0
博客等级：民兵
技术积分： 1655
用户组：普通用户
注册时间： 2022-09-26 14:37

文章分类

全部博文（165）

测试（26）
案例分享（31）
架构设计（24）
开发技能（26）
数据库（23）
未分配的博文（35）

文章存档

2024年（2）

2023年（95）

2022年（68）

我的朋友

最近访客

推荐博文

相关博文

hive 、spark 、flink之想一想

分类：云计算

2024-03-26 13:54:41

hive

1：hive是怎么产生的？

2：hive的框架是怎么样的？

3：hive 执行流程是什么？

4：hive sql是如何把sql语句一步一步到{BANNED}最佳后执行的？

5：hive sql任务常用参数调优做过什么？

spark

6：spark 是怎么产生的？

7：spark 框架是怎么样的？

8: spark的DAG是什么？

9：spark中的app，job,stage,task是什么？有什么好处？

10：spark的RDD是什么？与dataframe有什么区别？

11：spark 执行流程是什么？

12：spark sql是如何把sql语句一步一步到{BANNED}最佳后执行的？

13：spark 与mapreduce的区别是什么？

14： spark的反压原理是什么？主动还是被动？

flink

14：flink是怎么产生的？

15：flink的框架是怎么样的？

16：flink 的内存模型说一说？

17：flink的cp ,sp说一说原理，有什么区别？你们是怎么设置cp的相关参数？

18：flink的四个图是什么？分别都是什么环节对应什么图？

19：flink反压机制，你是如何理解的？你是如何定位、并有什么方案解决？与spark的反压有什么区别？

20：flink的barrier对齐和非对齐是怎么理解的？

21：flink的精准一次和至少一次是怎么理解的？

22：flink任务消费或者写入kafka时，并行度不一致有什么问题？

23：flink如何保证数据一致性？

24：flink对于kafka新增分区时，消费有什么问题吗？

25：flink消费kafka的offset是怎么维护的？自动提交？

26：flink任务如何设置TM，JM的并行度？

27：flink任务做过什么调优？

28：flink任务大状态时做过什么优化？

29：你们用flink做过实时数仓吗？你们的上下游的环境都是什么？全链路时效是多少？

阅读(277) | 评论(0) | 转发(0) |

0

上一篇：如何判断一个数仓模型的好坏？

下一篇：没有了

给主人留下些什么吧！~~

关于我们 | 关于IT168 | 联系方式 | 广告合作 | 法律声明 | 免费注册

Copyright 2001-2010 ChinaUnix.net All Rights Reserved 北京皓辰网域网络信息技术有限公司. 版权所有

感谢所有关心和支持过ChinaUnix的朋友们