As you can see in the image : airflow is making too much time between tasks execution ?
it almost represents 30% of the DAG execution time.
I've changed the airflow.cfg
file to:
job_heartbeat_sec = 1
scheduler_heartbeat_sec = 1
但我仍然有相同的延迟率。
为什么它会这样?
这是设计使然。例如,我使用 Airflow 执行大型工作流程,其中某些任务可能需要很长时间。 Airflow 不适用于需要几秒钟才能执行的任务,它当然可以用于该任务,但可能不是最合适的工具。
话虽如此,您无能为力,因为您已经找到了要配置的关键设置。
此外,您可能想尝试增加调度程序的线程数:
[scheduler]
max_threads = 4
这也可以通过设置环境变量来完成:
AIRFLOW__SCHEDULER__MAX_THREADS=4
但是,不要指望延迟会减少那么多。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)