有什么方法可以监控 Airflow DAG 的执行时间吗?

2024-02-16

我想将 Airflow 与 Statsd 和 DataDog 一起使用来监控 DAG 是否需要例如是之前执行的两倍。所以,我需要某种用于 DAG 的实时计时器(或者operator).

我知道 Airflow 支持一些指标 https://airflow.apache.org/docs/stable/metrics.html。 然而,据我了解,所有指标都与已完成的任务/DAG 相关,对吧?所以,这不是解决方案,因为我想监视正在运行的 DAG。

我也考虑过超时执行 https://airflow.apache.org/docs/stable/_api/airflow/operators/index.html#airflow.operators.BaseOperator/SLA https://airflow.apache.org/docs/stable/concepts.html#slas功能,但它们不适合此用例

我希望收到一些 DAG 挂起的通知,但我不想杀死它。


您可以通过多种不同的方式来处理此问题:

  • 过去,我配置了一个遥测 DAG,它将通过查询元数据表来收集所有任务/DAG 的当前状态。我会收集这些指标并将其推送到 CloudWatch。由于这些内部字段经常发生变化,这成为了问题,因此我们在尝试升级到较新版本的 Airflow 时会遇到问题。
  • 还有一些保养得好的普罗米修斯出口商 https://github.com/search?q=airflow+prometheus一些公司已经开源了。通过设置这些,您可以根据需要频繁地轮询公开的导出路径(DataDog支持普罗米修斯 https://docs.datadoghq.com/integrations/prometheus/).

这些只是您的一些选择。由于 Airflow Web 服务器只是一个 Flask 应用程序,因此您可以真正以您认为合适的任何方式公开指标。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

有什么方法可以监控 Airflow DAG 的执行时间吗? 的相关文章

随机推荐

  • 通过关联 update_all

    我正在尝试通过关联使用 update all 并且收到 mysql 错误 有人知道为什么吗 class Basket lt ActiveRecord Base has many basket items has many articles
  • 有没有实现按键删除并同时获取值? [复制]

    这个问题在这里已经有答案了 我正在做一个性能关键的程序 一些学术性的东西 我希望尽可能地优化 不像它证明的 这是 瓶颈 我有一个自定义字典结构 NET 的包装器Dictionary lt gt 并且我会在一个阶段不断地删除项目 通过Key价
  • 如何使用按钮触发回调更新?

    我刚刚开始使用破折号 举个例子here https plot ly dash getting started part 2 interactivity 我想转换下面的破折号应用程序 import dash from dash depende
  • 批处理文件变量范围问题

    当尝试创建 dos Windows 7 命令行 批处理文件时 我遇到了一个奇怪的变量范围问题 该文件执行一些字符串操作来创建新的文件路径 谁能明白为什么在下面的示例中 OUTPUT FILENAME 变量总是最终为空 echo Enter
  • Java 8 元空间与堆使用

    我有这段代码可以动态生成类并加载它 import javassist CannotCompileException import javassist ClassPool public class PermGenLeak private st
  • 测试覆盖率 React,伊斯坦布尔 -_registerComponent(...):目标容器不是 DOM 元素

    我正在使用 React Redux Webpack 编写一个应用程序 我正在使用 karma mocha 构建测试 并希望使用 istanbul 进行测试覆盖 为了使覆盖范围与业力覆盖范围一起工作 我设置了以下内容karma config
  • 是否可以根据批次标签(y_true)分布更新每个批次的学习率?

    编辑 请参阅此问题的结尾以获取解决方案 TL DR 我需要找到一种方法来计算每批次的标签分布 并更新学习率 有没有办法访问当前模型的优化器来更新每批的learning rate 下面是如何计算标签分布 它可以在损失函数中完成 因为默认情况下
  • Spark 中简单的 RDD 写入 DynamoDB

    刚刚在尝试将基本 RDD 数据集导入 DynamoDB 时陷入困境 这是代码 import org apache hadoop mapred JobConf var rdd sc parallelize Array Map col1 gt
  • 有没有办法即使在 Chrome 或 Firefox 关闭时也显示桌面通知?

    我们正在开发一个使用 GCM 向最终用户发送推送通知的网站 我们已经了解了 Service Worker 等所有内容 我们用这个开发了一个原型codelab https developers google com web fundament
  • 即使用户注销后也保持节点处于运行状态

    即使用户注销 如何保持节点应用程序在 Windows 中运行 即使用户注销后 如何继续运行节点http服务器 您有 2 个不错的选择 一种是上面评论中提到的Forever https www npmjs com package foreve
  • 将文件流式传输到 S3“错误:流意外结束”

    Update 我相信这could是因为我使用的是express提供的body解析器 这是否会扰乱多方试图解析的流 我的解决方案基于这个答案 https stackoverflow com a 15830910 971592 我正在尝试做的事
  • jqgrid如何在同一列显示多个值

    我想知道如何在 jqGrid 的单列中显示多个值 这是我当前网格定义的示例 grid1 jqGrid url Default aspx getGridData datatype json colModel contains the inpu
  • np 数组之间的欧氏距离

    我有两个 numpy 数组 a 和 b a 和 b 的尺寸相同 a 的尺寸可以与 b 的尺寸不同 例如 a 1 2 5 7 b 3 8 4 7 9 15 有没有一种简单的方法来计算 a 和 b 之间的欧几里得距离 以便这个新数组可以在 k
  • JavaScript 中的应用函数

    我正在学习 JavaScript 目前正在尝试找出原因 在蜘蛛猴 https developer mozilla org en SpiderMonkey concat apply 1 2 返回预期的 1 2 but Array concat
  • 如何使用Torch生成的模型进行预测?

    我已经执行了神经网络 tutorial lua https github com nicholas leonard dp blob master examples neuralnetwork tutorial lua 现在我有了模型 我想用
  • 尝试...否则...除了语法错误

    我无法理解这个 无法运行此代码 我不知道为什么它是语法错误 try newT read existingArtist newT Exif Image Artist value existingKeywords newT Xmp dc sub
  • Android:AsyncTask 或带有 ExecutorService 的普通 Java 线程 [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 我的应用程序使用Service做一些背景工作 我正在服务中使用额外的线程来进行一些计算 为此 我每 5 到 10 秒创建两个线程 运行 5 到
  • .NET混淆工具/策略[关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 我的产品有几个组件 ASP NET Windows Forms App 和 Windows Service 大约 95 的代码是用 VB NET
  • firebase云函数ServerValue增量不起作用

    我有一个 firebase 功能 我想在这里增加ServerValue 但它不起作用并给出错误 我哪里做错了 我在下面附上控制台屏幕截图 注 我不太了解javascript java代码也可能有错误 const functions requ
  • 有什么方法可以监控 Airflow DAG 的执行时间吗?

    我想将 Airflow 与 Statsd 和 DataDog 一起使用来监控 DAG 是否需要例如是之前执行的两倍 所以 我需要某种用于 DAG 的实时计时器 或者operator 我知道 Airflow 支持一些指标 https airf