spark生态圈包含哪些环境

时间：2024-10-02 08:01:37 科技百科

Spark生态圈具体是哪些？

从内往外看，生态圈核心是Spark Core，包括各种Spark的各种核心组件，它们能够对内存和硬盘进行操作，或者调用CPU进行计算。

紧邻核心圈的是与Spark相关的各类接口，比如Java，Python和R等。

这些接口的外部是针对不同类型数据的计算引擎。比如说针对关系型数据进行处理的Spark SQL，针对对流数据进行打包批量处理的Spark Steam，针对Machine Learning相关的库MLib，针对图的GraphX，以及针对大规模数据进行采样和计算从而缩短计算时间的BlinkDB。

如有侵权请及时联系我们处理，转载请注明出处来自