Flink – Task Failure Recovery

一、前言 当发生任务失败时,Flink 需要重启失败的任务和其他受影响的任务,以使作业恢复到正常状态。 重启策略和故障转移策略用于控制任务重启。重启策略决定失败/受影响的任务是否以及何时可以重启。故障…

Flink – Checkpoints

一、概述 检查点通过允许恢复状态和相应的流位置,来使 Flink 中的状态具有容错能力,从而为应用程序提供与无故障执行相同的语义。 请参阅 Checkpointing检查点 以了解如何为程序启用和配置…

面试题 – YARN

一、概念 YARN 是一个资源管理、任务调度的框架,主要包含三大模块: ResourceManager(RM) NodeManager(NM) ApplicationMaster(AM)。 其中, R…

面试题 – Spark

一、概念 Spark 提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。 二、核心架构 Spark Core 包含…

面试题 – Hadoop

一、概念 就是一个大数据解决方案。它提供了一套分布式系统基础架构。 核心内容包含 hdfs 和mapreduce。hadoop2.0 以后引入 yarn。 hdfs 是提供数据存储的,mapreduc…

close
arrow_upward