Chinaunix首页 | 论坛 | 博客
  • 博客访问: 46715
  • 博文数量: 36
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 230
  • 用 户 组: 普通用户
  • 注册时间: 2020-06-08 14:16
文章分类
文章存档

2020年(36)

我的朋友
最近访客

分类: 大数据

2020-06-22 18:00:44

本课程针对企业不同数据规模技术方案进行讲解,紧贴企业热门需求,深入讲解企业级大数据技术的数据存储技术、数据采集技术、数据处理技术、任务调度技术等;课程针对知识点进行企业级案例式教学,理论结合实战,从0到1构建大数据生态技术的方方面面,内容涵盖大数据平台、Spark、Flink、OLAP等核心技术;用真实的企业级实时数仓项目、离线数仓项目、PB级实时用户行为分析系统、千亿级实时广告系统等多个大型项目,把大数据生态技术知识串连起来,让学员形成自己的技术栈,真正成为企业级的大数据开发工程师!

阶段一:小规模数据处理篇
第一单元
掌握Python基础语法 

1. 集合类型
2. 条件,循环
3. 文件操作
4. 函数和函数式编程
5. 面向对象

第二单元
掌握NumPy进行数据分析 
1. NumPy基本使用
2. Numpy进阶知识
第三单元
掌握Pandas进行数据分析 
1. Pandas基础知识
2. Series数据结构
3. DataFrame数据结构
4. 综合案例演示
阶段二:中等规模数据处理篇
第四单元
掌握Elastichsearch核心设计
1. Elastichsearch总体架构设计
2. Elastichsearch核心流程分析
3. Elastichsearch核心概念详解
第五单元
掌握Elastichsearch API使用与调优 
1. Elastichsearch语法详解
2. Elastichsearch容错原理剖析
3. Elastichsearch性能调优
第六单元
掌握ELK生态针对中等数据规模的方案实践
1. Logstash原理剖析与实战
2. Kibana原理剖析与实战
3. 企业级海量日志分析系统实战
阶段三:大数据基础平台篇
第七单元
掌握ZooKeeper核心设计与应用 
1. ZooKeeper架构设计原理
2. ZooKeeper核心读写流程剖析
3. ZooKeeper企业应用场景实战
第八单元 
掌握HDFS核心架构原理 
1. 大数据基础知识
2. HDFS架构设计原理
第九单元 
掌握HDFS企业级架构方案设计
1. HDFS高可用架构设计
2. HDFS联邦架构设计
3. HDFS企业级集群部署
第十单元
掌握MapReduce分布式计算模型
1. MapReduce核心原理剖析
2. MapReduce Shuffle机制深度剖析
3. MapReduce案例实操
第十一单元
掌握YARN任务调度模型 
1. YARN架构设计原理
2. YARN核心运行流程
阶段四:大数据存储篇
第十二单元
掌握Hive核心架构设计
1. Hive生态体系
2. Hive集群安装
3. HQL语法精讲
第十三单元 
掌握Hive企业实操
1. Hive函数精讲
2. Hive执行原理深度剖析
第十四单元
掌握Hive企业级解决方案
1. Hive企业级调优
2. Hive企业高频业务场景剖
第十五单元
掌握HBase核心架构原理
1. HBase架构设计原理剖析
2. HBase数据模型
3. HBase数据模型
4. HBase读写原理剖析
5. HBase企业级集群分布式部署
第十六单元
握HBase企业设计方案
1. HBase表设计
2. HBase RowKey设计
3. HBase二级索引方案实践
第十七单元
掌握Kafka核心架构设计
1. Kafka架构设计原理
2. Kafka核心概念深度剖析
第十八单元
掌握Kafka架构设计优势与运维 
1. Kafka架构设计优势
2. Kafka集群部署与运维
第十九单元
掌握Kafka客户端原理与性能调优 
1. Kafka生产者原理深度剖析
2. Kafka消费者原理
3. Kafka性能调优
阶段五:大数据采集篇
第二十单元
掌握Flume/Sqoop日志采集系统实践 
1. Sqoop核心原理剖析
2. Sqoop企业案例实操
3. Flume核心原理剖析
4. Flume企业案例实操
阶段六:任务调度篇
第二十一单元 
掌握Azkaban任务调度实践 
1. Azkanban架构原理
2. Azkanban企业案例实操
阶段七:大数据处理篇

相关课程推荐:


阅读(789) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~