图文详解Spark的运行原理（入门必看）

admin • 2022-01-01 08:38 • 架构

前言

上期文章，介绍了 Spark 是包含多个紧密集成的组件，这些组件结合密切并且可以相互调用，这样我们可以像在平常软件项目中使用程序库一样，组合使用这些的组件。

本期学习目标

Spark 的运行模式

Spark 的集群架构

Worker 的工作职责

Driver 的工作职责

Spark的运行模式

就底层而言，Spark 设计为可以高效地在一个到数千个计算节点之间伸缩计算。为了实现这样的要求，同时获得最大灵活性，Spark支持在各种集群管理器上运行。

Spark 的运行模式主要有：

Spark的集群架构

Spark 的集群架构主要由 Cluster Manager(资源管理器)、Worker (工作节点)、Executor(执行器)、Driver(驱动器)、Application(应用程序) 5部分组成，如下图：

Cluster Manager ：Spark 集群管理器，主要用于整个集群资源的管理和分配，有多种部署和运行模式；
Worker ：Spark 的工作节点，用于执行提交的任务；
Executor ：真正执行计算任务的一个进程，负责 Task 的运行并且将运行的结果数据保存到内存或磁盘上；
Driver ：Application 的驱动程序，可以理解为驱动程序运行中的 main() 函数，Driver 在运行过程中会创建 Spark Context；
Application ：基于 Spark API 编写的应用程序，包括实现 Driver 功能的代码和在集群中多个节点上运行的 Executor 代码。

Worker 的工作职责

Driver 的工作职责

Application 通过 Driver 与 Cluster Manager 和 Executor 进行通信。

以上是本期分享，如有帮助请大家记得点赞+关注+收藏支持下哦～
下期开始讲解 Spark Core 相关内容。

前期回顾：

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

spark Spark Core Spark架构 Spark运行原理大数据

二维码

)">

nginx开启gzip压缩

中低速航空航天电子总线概述

下一篇>>

搜索内容