在 kubernetes 上持续部署有状态 apache flink 应用程序

2024-01-03

我想在 kubernetes 上运行 apache flink (1.11.1) 流应用程序。文件系统状态后端保存到 s3。 s3 的检查点正在运行

args:
  - "standalone-job"
    - "-s"
    - "s3://BUCKET_NAME/34619f2862ce3e5fc91d80eae13a434a/chk-4/_metadata"
    - "--job-classname"
    - "com.abc.def.MY_JOB"
    - "--kafka-broker"
    - "KAFKA_HOST:9092"

所以我面临的问题是：

我必须手动选择以前的状态目录。有可能让它变得更好吗？
该作业会增加 chk 目录，但不使用检查点。意味着当我第一次看到一个事件时我抛出一个新事件并将其存储到ListState<String>每当我通过 Gitlab 部署应用程序的较新版本时，它都会再次引发此事件。
当我将 state.backend 定义到文件系统时，为什么必须在代码中显式启用检查点？env.enableCheckpointing(Duration.ofSeconds(60).toMillis()); and env.getCheckpointConfig().enableExternalizedCheckpoints(RETAIN_ON_CANCELLATION);

你可能会更高兴Ververica 平台：社区版 https://www.ververica.com/getting-started，这将抽象级别提高到您不必处理此级别的细节的程度。它有一个在设计时考虑到 CI/CD 的 API。
我不确定我是否理解您的第二点，但您的作业在恢复期间会倒带并重新处理一些数据，这是正常的。 Flink 不保证精确一次处理，而是保证精确一次语义：每个事件都会影响 Flink 管理的状态一次。这是通过回滚到最近检查点中的偏移量，并将所有其他状态回滚到消耗完这些偏移量的所有数据后的状态来完成的。
拥有一个状态后端是必要的，因为它可以在作业运行时存储作业的工作状态。如果不启用检查点，则工作状态不会被检查点，并且无法恢复。但是，从 Flink 1.11 开始，您可以通过配置文件启用检查点，使用

execution.checkpointing.interval: 60000
execution.checkpointing.externalized-checkpoint-retention: RETAIN_ON_CANCELLATION

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Kubernetes

apacheflink

flinkstreaming

在 kubernetes 上持续部署有状态 apache flink 应用程序的相关文章

kubectl 从头开始连接远程集群

我创建了一个使用ansible的本地Kubernetes集群 https github com kubernetes incubator kubespray 一切都在运行但现在我尝试连接我的kubectl与集群在虚拟机中我的集群运行在
从我的应用程序 Helm 图表配置第三方 Helm 图表

我似乎在任何地方都找不到任何关于此的明确信息但是 Helm 图表中是否有可能需要第三方例如stable jenkins 并指定配置值我看到的所有示例都是为了运行helm install直接命令但我希望能够将其配置为我的应用程序的一部
使用 JWT 的 Istio Origin 身份验证不起作用

我一直在使用 JWT 将身份验证策略应用于我的测试服务我已关注本指南 https istio io docs tasks security authn policy end user authentication它确实按预期工作了但是
获取 Pod 处于挂起状态的平均时间

我正在尝试使用 prometheus 计算 pod 在 grafana 中处于挂起状态的平均时间我可以使用此查询生成一个图表以获取一段时间内处于挂起状态的 Pod 数量 sum kube pod status phase phase P
使用 GlobalWindow 在 Beam 中进行状态垃圾收集

Apache Beam 最近推出了状态细胞 https beam apache org blog 2017 02 13 stateful processing html 通过StateSpec和 StateId注释在 Apache Fli
应用程序网关如何防止请求发送到最近终止的 Pod？

我目前正在 Azure 中研究和试验 Kubernetes 我正在使用 AKS 和应用程序网关入口据我了解当 Pod 添加到服务时端点会更新入口控制器会不断轮询此信息随着新端点的添加 AG 也会更新当它们被移除时 AG 也被更新
为什么我无法杀死 k8s pod 中的 python 进程？

我试图杀死一个 python 进程 ps aux grep python root 1 12 6 2 1 2234740 1332316 Ssl 20 04 19 36 usr bin python3 batch run py root 4
如何在 Helm 图表中配置 docker 入口点

我有以下内容docker compose文件我不明白如何设置working dir and entrypoint在掌舵deployment yaml 有人有关于如何执行此操作的示例吗 docker compose version 3 5
容器上的“container_memory_working_set_bytes”指标和 OOM-killer 之间有什么关系？

我试图找出并理解 OOM killer 如何在容器上工作为了弄清楚这一点我读了很多文章发现 OOM killer 会根据oom score And oom score是由oom score adj以及该进程的内存使用情况有两个指标c
Microk8s 节点未准备好 - InvalidDiskCapacity

microk8s的节点不想启动 Kube system Pod 处于挂起状态 kubectl describe nodes说是警告InvalidDiskCapacity 我的服务器有足够的资源 PODS NAMESPACE NAME REA
oauth2-proxy 身份验证调用在 kubernetes 集群上运行缓慢，并带有 nginx 入口的身份验证注释

我们使用以下描述的方法在 K8S 集群上保护了一些服务的安全这一页 https kubernetes github io ingress nginx examples auth oauth external auth 具体来说我们有 ng
Docker For Windows CE：Kubernetes：无法连接到服务器 eof

我根本找不到无法连接到服务器 eof 的解决方案希望我们能解决这个问题并在将来搜索解决此问题时对某人有所帮助我试图在屏幕截图中包含所有信息如果需要更多信息请告诉我我已尝试添加所需的信息如果您还需要或希望我尝试其他内容请告诉
Istio：RequestAuthentication jwksUri 无法解析内部服务名称

Notice 其根本原因与Istio 当我启用 JWT RequestAuthentication 时运行状况检查 sidecar 失败 https stackoverflow com questions 66446178 istio h
kubectl 部署失败

我正在为 GKE 上的 Spring boot 应用程序设置 CI CD 管道 CI 构建步骤工作正常但交付构建步骤由于错误没有对象传递到应用错误而失败我可以在云构建中看到以下日志 Starting Step 0 Deploy S
无法连接到代理“证书由未知机构签名”

我正在尝试通过 Kubernetes 部署上的 cloudsql proxy 容器连接到 CloudSQL 实例我已安装 cloudsql 凭据以及值GOOGLE APPLICATION CREDENTIALS set 但是我的日志中仍
如何使用同一 k8s 集群内的 kubectl exec 从另一个 pod 中的一个 pod 执行命令

我在一个集群中有两个 Pod 让我们称它们为 A 和 B 我已经在 pod A 中安装了 kubectl 并且尝试使用 pod A 在 pod B 中运行命令kubectl exec it podB bash 我收到以下错误 Error f
Kubernetes Python 客户端连接问题

我已经设置了官方 Kubernetes Python 客户端 https github com kubernetes client python https github com kubernetes client python 我正在运行
Kubernetes，无法访问其他节点服务

我正在 3 个带有 CentOS 7 的 VirtualBox 虚拟机 1 个 master 和 2 个 minions 中使用 Kubernetes 不幸的是安装手册说的是这样的every service will be accessib
在 Kubernetes 中什么是删除集合？

列出 K8s 中的所有 API 资源时您会得到 kubectl api resources owide NAME SHORTNAMES APIGROUP NAMESPACED KIND VERBS bindings true Bindin
Ingress 未在 GKE 和 GCE 上获取地址

创建入口时不会生成地址并且从 GKE 仪表板查看时它始终位于Creating ingress地位描述入口没有显示任何事件我在 GKE 仪表板上看不到任何线索有没有人有类似的问题或关于如何调试的任何建议我的部署 yaml api

随机推荐

CKEditor - 无工具栏

所以我得到了一个textarea with CKEditor插件但我只想让它干净没有任何东西没有工具栏没有状态栏或任何栏这很简单但我在文档或网络上找不到它 My CKEditor开始于 texto ckeditor skin o
升级到 Swift 3 后，属性“self.delegate”未在 super.init 调用中初始化

升级到 Swift 3 后我现在收到此错误属性 self delegate 未在 super init 调用时初始化在 NSObject 类上定义 open class NSObject NSObjectProtocol public
Android Oreo WebView 在第二次加载后渲染布局太小

在某些 Android Oreo 设备上当我第一次在 webview 上加载 url 时 URL 页面会正确加载但是当我再次加载 URL 时页面会缩小在低于 android oreo 的设备上页面可以为所有设备正确加载此外当
VS2008 中“<<”和“++”的运算符优先级优化

我遇到了一个奇怪的 VS2008 C 问题看起来运算符优先级没有得到尊重我的问题是这个的输出是什么 int i 0 std cout lt lt i 0 Not zero zero lt lt i lt lt std endl 通常情况
如何在 WordPress 主题中包含 jQuery？

我对 WordPress 还很陌生我正在研究如何将 jQuery 包含到主题中我将以下函数创建为函数 php theme function load java scripts Load FlexSlider JavaScript tha
在选项卡栏开关上弹出到根导航控制器时出现问题

尝试模仿复制内置地址簿特别是从电话应用程序内部编辑联系人或查看现有联系人信息时的行为当您导航到另一个选项卡时编辑状态将重置并弹出新联系人或信息视图以便当您返回联系人选项卡时您将返回到根表视图我使用 setEd
如果没有锚点，则无法使用菜单弹出帮助程序

我想在操作栏中使用弹出菜单项当我在活动中使用它时一切正常但是当我切换到片段时我得到 MenuPopupHelper cannot be used without an anchor 我的片段 Override public boolea
Django __str__ 返回非字符串（类型 NoneType）

我正进入状态 str returned non string type NoneType 编辑时出错Product模型对象产品型号 class Product models Model ProductName models CharFi
无法在 Ubuntu 18.04 LTS 上安装 rstanarm

我无法安装rstanarm on R 3 5 3运行于Ubuntu 18 04 LTS 我使用了以下命令 install packages rstanarm and devtools install github stan dev rsta
如何直接从 R 控制台打开工作目录？

我怎样才能打开我的getwd 直接从 R 控制台获取文件夹如果我想查看我最近刚刚导出到那里的东西这很有用谷歌搜索没有透露任何信息我没有能力构建一个函数如果您确实想要一个文件浏览器您可以创建一个函数来打开目录根据您使用的操作系统
导入错误：使用 Azure SDK 时无法导入名称会话

我正在使用 Azure SDK 运行代码首先我通过下载sdkpip install azure 然后我编写运行以下 python 代码 import requests import os make sure you configure
Rails Basecamp 风格子域最佳实践

我的目标是为每个子域拥有单独的用户帐户在任何情况下我都不想在子域之间进行异花授粉我看过了罗比拉塞尔 http www robbyonrails com articles 2009 01 11 subdomain accounts w
从 url mysql 或 python 中提取模式编号

我有一堆 url 其中有一个字符串 hotel 4 digit number hotel1234 or slash 4digit html 1234 html 是否有正则表达式可以使用 python 或 mysql 提取 4 位数字例如
在 AWS Lambda 上使用来自 Python 的 NodeJS 4 脚本

问题我有一个在 AWS Lambda 上运行的 Python 脚本该脚本正在使用subprocess执行 NodeJS 4 脚本我尝试过什么 subprocess check output my script js 得到非零结果得到
更改外部变量的值

我们在 File1 c 中有 int arr 10 在 File2 c 中 extern int arr int main arr 0 10 return 0 这样做可能会出现哪些问题以及为什么数组不是指针内存访问将会出错 In Fil
从头开始实现 cv2.warpPerspective()

我正在使用 OpenCV 函数进行一些实验cv2 warpPerspective当我决定从头开始编码以更好地理解它的管道时尽管我希望遵循了每一个理论步骤但似乎我仍然遗漏了一些东西并且我正在努力理解什么请你帮助我好吗 SRC 图像
谷歌应用引擎支持环境变量吗？

我注意到开发人员控制台似乎没有公开任何可以配置静态环境变量的地方 GAE 是否期望我将这些变量捆绑为构建服务器部署的一部分如果是这样 GAE Google Cloud 上是否有任何文档介绍了原因或详细说明了其原理几年过去了仍然没有我
Ruby 枚举器如何终止迭代？

朋友们我需要帮助解释一下在下面的 Ruby 代码中什么条件白蚁循环会做什么它应该是一个无限循环但是它如何终止呢 Ruby code fib Enumerator new do y a b 1 loop do y lt lt a
跟踪代码数据类型和操作

跟踪代码允许企业例如我们在 Box 上的用户数据中存储一些本地 ID 我意识到需要在企业上启用该功能我们的联系人正在处理第一个问题文档说它是一个数组其他答案表明它是一个名称值对的数组在数据类型中 Box API 到底将
在 kubernetes 上持续部署有状态 apache flink 应用程序

我想在 kubernetes 上运行 apache flink 1 11 1 流应用程序文件系统状态后端保存到 s3 s3 的检查点正在运行 args standalone job s s3 BUCKET NAME 34619f2862c

在 kubernetes 上持续部署有状态 apache flink 应用程序

所以我面临的问题是：

在 kubernetes 上持续部署有状态 apache flink 应用程序 的相关文章

随机推荐

热门标签

在 kubernetes 上持续部署有状态 apache flink 应用程序的相关文章