Airflow 远程日志记录不起作用

2024-01-08

我有一个正在运行的 Apache - Airflow 1.8.1 实例。

我有一个工作连接(及其 ID)可以写入 Google Cloud Storage,并且我的气流用户有权写入存储桶。

我尝试通过添加来使用远程日志存储功能

remote_base_log_folder = 'gs://my-bucket/log'

remote_log_conn_id = 'my_working_conn_id'

仅此而已(除此之外我没有触及任何配置)

我重新启动了所有服务,但日志没有上传到 gcs(我的存储桶仍然是空的),并且我的文件系统空间仍在减少。

您是否已成功启用 gcs 远程日志?如果是,您改变/做了什么?


我设法将远程日志记录到 GCS。首先,您需要授予服务帐户写入 GCS 存储桶的权限。

这是我设置的 GCP 连接:

然后,编辑airflow.cfg文件:

remote_base_log_folder = gs://my-backup/airflow_logs
remote_log_conn_id = my_gcp_conn

编辑配置文件后,需要重新初始化:

airflow initdb

# start the web server, default port is 8080
airflow webserver -p 8080

通过打开“教程”DAG 进行测试,您应该能够在 GCS 中看到本地和远程日志:

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Airflow 远程日志记录不起作用 的相关文章

  • Java 自定义记录器:记录标准或/和最佳实践

    我正在开发一个框架 我希望 jar 尽可能轻量且独立 所以我写了一个日志类 import java util Date import java util Properties public class Logger private stat
  • 保存日志 - SimpleHTTPServer

    如何保存控制台的输出 例如 192 168 1 1 2014 年 8 月 18 日 12 05 59 代码 404 消息未找到文件 到一个文件 这是代码 import SimpleHTTPServer import SocketServer
  • Node.js Google-云存储上传目的地规范

    我有一个 Node js 服务器并且正在使用谷歌云上传一些图像文件的包Firebase 存储 上传本身工作正常 但 google cloud API 似乎只能将文件上传到 Firebase Storage 根文件夹 有没有办法指定远程位置来
  • 记录 http.ResponseWriter 内容

    Premise 我发现了类似的问题 但不适用于我的情况 因此请不要将其标记为重复 我在 Go 中有一个 HTTP 服务器 并且创建了一个中间件记录请求 响应时间 我也想记录响应 我用过httputil DumpRequest在一个名为的函数
  • Logback 配置在单行上有异常吗?

    我的日志被提取 传输并合并到 elasticsearch 中 多行事件很难跟踪和诊断 有没有办法使用收集器和正则表达式将异常行分组到单个记录中登录配置 https logback qos ch manual layouts html xTh
  • 如何在 C++ 中的嵌套词法作用域可访问的作用域中声明静态信息?

    我想声明范围的标识符 该标识符将用于自动填充最内部范围内任何日志记录语句的字段 它们通常会 但并非总是如此 例如 lambda 使用 引入的块 匹配封闭块的 名称 用法看起来像这样 namespace app LOG CONTEXT app
  • JavaMail 的 DCH 类错误

    我正在尝试使用 Glassfish 3 1 提供的 jar 文件在 Java EE 6 中使用 JavaMail 设置一个简单的日志记录测试 关于这个主题似乎有很多问题 但我还没有找到任何有帮助的答案 我的测试代码如下所示 import j
  • 如何在 NextJS 中记录所有路由

    我对 NextJS 非常陌生 我目前有一个非常简单的应用程序 它提供少量页面 如果路由不存在 则返回 404 页面 我想记录每个请求 包括不存在的页面并返回 404 页面 我正在 docker 容器内运行该应用程序 或者我希望将日志写入标准
  • 如何将log4j日志文件更改为utf8

    我收到了一个使用 log4j 作为记录器应用程序的代码 如何为其生成 UTF8 日志文件 log4j 创建的日志文件目前为 ASCII 格式 我已经尝试过以下操作 按照以下说明设置日志文件的文件编码 vi current set bomb
  • gcloud.exceptions.Forbidden:403缺少或权限不足

    我是 Google Cloud Platform 的新手 我已经设置了一个 Google VM 实例 运行命令时 我在本地计算机上遇到身份验证问题 python manage py makemigrations 您能否建议一些提示 步骤来解
  • 通过 Gradle 进行测试时记录日志

    在测试时 Gradle 似乎将 stdout stderr 重定向到project dir build reports tests index html 有没有办法避免这种重定向 并将内容打印到控制台 附加信息 这是一个 Scala 2 9
  • 包装 NLog 时如何保留调用点信息

    我有一个包装 NLog 的类 称为 NLogger 我的日志保存到我的数据库中 我遇到的问题是如何显示日志记录发生的位置 我有这个
  • GAE:java.lang.NoClassDefFoundError:com/google/appengine/api/blobstore/BlobstoreServiceFactory

    请帮我解决这个问题 我正在使用 blob 存储来保存图像 它在我的本地环境中运行得非常好 但是 当我在云中部署相同的代码时 它会抛出异常 java lang NoClassDefFoundError com google appengine
  • 将屏幕(程序)输出保存到文件

    我需要保存整个输出Screen https en wikipedia org wiki GNU Screen到一个文件以便稍后检查所有内容 原因是我通过串行端口转储闪存 使用 Screen 与其交互 我想将其保存到文件中以检查内存结构 我试
  • 从 pytest_generate_tests 方法在 junit xml 中添加日志

    我正在使用 Jenkins 来解析 Junit XML 任何开发人员也会考虑 Jenkins 故障以进行分类 这意味着所有日志都应该在 Junit xml 中可用 问题是 pytest generate tests 方法有一个非常大的实现
  • 如何在 Apache Airflow 中混合使用 Celery Executor 和 Kubernetes Executor?

    我有多个使用 Celery Executor 的 dag 但我希望使用 Kubernetes Executor 运行一个特定的 dag 我无法推断出一种良好且可靠的方法来实现这一目标 我有一个airflow cfg我在其中声明了Celery
  • GCP - 获取有关存储桶的完整信息

    我需要获取存储在Google Bucket中的文件信息 信息如文件大小 存储类别 上次修改时间 类型 我搜索了谷歌文档 但它可以通过curl或控制台方法来完成 我需要从 Python API 获取该信息 例如下载 blob 将 blob 上
  • Google Cloud Storage 上的批量重命名对象

    是否可以使用 gsutil 或其他工具 批量重命名 Google Cloud Storage 上的对象 我正在尝试找出一种方法将一堆图像从 JPG 重命名为 jpg 这是在 bash 中执行此操作的本机方法 下面逐行代码进行解释 gsuti
  • 基于外部文件的气流中的动态任务

    我正在从外部文件读取元素列表并循环元素以创建一系列任务 例如 如果文件中有 2 个元素 A B 将有2个系列的任务 A1 gt A2 B1 gt B2 此读取元素逻辑不是任何任务的一部分 而是 DAG 本身的一部分 因此 调度程序在读取 D
  • 如何使用 ILoggerFactory 记录 Polly 的重试

    或者 如何从静态方法记录 From https github com App vNext Polly https github com App vNext Polly你有这样的例子 其中记录器神奇地可用 Policy Timeout 30

随机推荐