当前位置:网站首页 > Java基础 > 正文

spark java 入门教程



 <div> 下图描述了Spark的不同组件。 </div> <div><img decoding="async" src="https://www.cainiaoya.com/images/spark/components_of_spark.jpg" alt="spark"></div> <div> <u>Apache Spark Core(核心)</u> </div> <div> Spark Core是所有其他功能都基于的Spark平台的基础通用执行引擎。它提供了外部存储系统中的内存中计算和引用数据集。 </div> <div> <u>Spark SQL</u> </div> <div> Spark SQL是Spark Core之上的组件,它引入了一个称为SchemaRDD的新数据抽象,该抽象为结构化和半结构化数据提供支持。 </div> <div> <u>Spark Streaming(流)</u> </div> <div> Spark Streaming利用Spark Core的快速调度功能来执行流分析。它以小批量提取数据,并对那些小批量数据执行RDD(弹性分布式数据集)转换。 </div> <div> <u>MLlib(机器学习库)</u> </div> <div> 由于基于分布式内存的Spark体系结构,MLlib是Spark之上的分布式机器学习框架。根据基准,它是MLlib开发人员针对交替最小二乘(ALS)实现而完成的。Spark MLlib的速度是Apache Mahout的基于Hadoop磁盘的版本的9倍(在Mahout获得Spark接口之前)。 </div> <div> <u>GraphX</u> </div> <div> GraphX是基于Spark的分布式图形处理框架。它提供了一个用于表达图形计算的API,该API可以通过使用Pregel抽象API对用户定义的图形进行建模。它还为此抽象提供了优化的运行时。 </div> 

版权声明


相关文章:

  • java基础视频教程 百度云2025-10-16 08:50:00
  • java编程教程42025-10-16 08:50:00
  • java掠夺机教程2025-10-16 08:50:00
  • java web api教程2025-10-16 08:50:00
  • java教程pdf文档2025-10-16 08:50:00
  • java教程433集2025-10-16 08:50:00
  • java架构 视频教程2025-10-16 08:50:00
  • java 画时序图教程2025-10-16 08:50:00
  • java联盟 教程视频2025-10-16 08:50:00
  • 韩国 java教程2025-10-16 08:50:00