课程详情 在线报名
Spark是类MapReduce的通用并行框架,Spark,拥有MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法;Spark核心框架概况、运行模式、基本术语的介绍、Spark的核心组件RDD及相关的数据分析方法、Spark的血统与检查点、Spark的技术原理、对Spark的基础使用进行阶段性实战训练,此过程需要学员进行实际动手操作,旨在将理论付诸实践,提供学员的实际动手能力;介绍Spark-SQL的基础理论,基本使用方法、对基于Spark-SQL的样例程序进行深度分析、流式数据分析框架Spark-Streaming的基础理论,基本使用方法、对基于Spark-Streaming的样例程序进行深度分析、机器学习框架Spark-MLlib的基础理论,基本使用方法、图计算框架Spark-GraphX的基础理论,基本使用方法、Spark的性能优化技术;对Spark的高级使用进行阶段性实战训练,此过程需要学员进行实际动手操作,旨在将理论付诸实践,提高学员的实际动手能力。
只要一个电话
我们免费为您回电