阅读量:127
Spark的四大组件包括:
-
Spark Core:Spark的核心组件,提供了基本的功能,如任务调度、内存管理、错误恢复等。
-
Spark SQL:用于结构化数据处理的组件,支持SQL查询和DataFrame API。
-
Spark Streaming:用于实时数据处理的组件,支持高吞吐量和容错性。
-
MLlib:Spark的机器学习库,提供了各种常用的机器学习算法和工具。