Flink状态后端的对比及机制
阅读原文时间:2023年07月09日阅读:1

1. Flink状态后端的类型:

MemoryStateBackend

FsStateBackend

RocksDBStateBackend

2. 各状态后端对比:

2.1 MemoryStateBackend:

  如果没有配置,默认使用MemoryStateBackend,此时Flink的状态会保存在TaskManager的内存中,而checkpoint会保存在JobManager的内存中。

MemoryStateBackend可以通过配置来使用异步快照,通过异步快照可以避免阻塞管道。默认开启异步,也可以通过MemoryStateBackend的构造函数配置进行关闭。

new MemoryStateBackend(MAX_NEW_STATE_SIZE,false);

  MemoryStateBackend的限制:

    每个独立的状态(state)默认限制大小为5MB,可以通过构造函数增加容量;

    状态的大小能超过akka的framesize大小

    聚合状态(aggregate state)必须放入JobManager的内存

  MemoryStateBackend的适用场景:

    本地调试

    Flink任务状态数据量较小的场景

2.2 FsStateBackend

  FsStateBackend通过配置文件系统路径来进行设置,例如:“hdfs://namenode:8020/flink/checkpoints”或者"file:///date/flink/checkpoints".

  FsStateBackend将动态数据保存在taskmanager的内存中,通过checkpoint机制,将状态快照写入配置好的文件系统或者目录中。最小元数据保存在jobManager的内存中,另外FsStateBackend通过配置一个fileStateThreshold阈值,小于该值时state存储到metadata中而非文件中。

  FsStateBackend默认通过配置来使用异步快照,避免阻塞管道,当然也可以通过

手机扫一扫

移动阅读更方便

阿里云服务器
腾讯云服务器
七牛云服务器

你可能感兴趣的文章