使用 flink runner 在梁上进行 Tensorflow 变换

2023-12-21

这可能看起来很愚蠢,但这是我在这里发表的第一篇文章。抱歉做错了什么。

我目前正在使用 python2.7 使用 TFX 0.11(即 tfdv-tft-tfserving)和tensorflow 1.11 构建一个简单的 ML 管道。我目前有一个 apache-flink 集群,我想将其用于 TFX。我知道 TFX 背后的框架是 apache-beams 2.8,它(apache-beams)目前通过便携式运行器层支持带有 python SDK 的 flink。

但问题是我如何通过这个便携式运行器概念使用 apache-beams 和 flink 运行器在 TFX (tfdv-tft) 中进行编码,因为 TFX 目前似乎只支持 DirectRunner 和 DataFlowRunner (Google Cloud)。

我在网上搜索了一段时间,在TFX网站上看到最后一行,

“请使用 tensorflow-transform 标签将有关使用 tf.Transform 的任何问题直接提交至 Stack Overflow。”

这就是我在这里的原因。任何想法或解决方法都非常感激。谢谢你!


谢谢你的提问。

免责声明:Portable Flink Runner 仍处于实验阶段,仅适用于少量的输入数据。

以下是如何通过 Beam 在 Flink 上运行 TFX。

先决条件

  • Linux
  • Docker
  • 光束回购:https://github.com/apache/beam https://github.com/apache/beam
  • 用于输入和输出的分布式文件系统。

运行 python 管道的说明:https://beam.apache.org/roadmap/portability/#python-on-flink https://beam.apache.org/roadmap/portability/#python-on-flink
注意:我们目前仅支持 Flink 1.5.5

指示

1)构建Worker容器:

  • 转到 Beam 结账目录
  • 运行 gradle 命令: ./gradlew :beam-sdks-python-container:docker

2) 运行 Flink 的 Beam JobServer:

  • 转到 Beam 结账目录
  • 运行 gradle 命令:./gradlew beam-runners-flink_2.11-job-server:runShadow 注意:此命令不会完成,因为它会启动作业服务器并保持其运行。

3)提交管道

  • 请参阅https://github.com/angoenka/model-analysis/blob/hack_1/examples/chicago_taxi/preprocess_flink.sh https://github.com/angoenka/model-analysis/blob/hack_1/examples/chicago_taxi/preprocess_flink.sh
  • 注意:确保将以下标志传递到您的管道

--experiments=beam_fn_api --runner PortableRunner --job_endpoint=localhost:8099 --experiments=worker_threads=100 --execution_mode_for_batch=BATCH_FORCED

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 flink runner 在梁上进行 Tensorflow 变换 的相关文章

随机推荐

  • 使用 python API 将视频上传到 Youtube 并将其设置为不公开

    我正在使用python 客户端库 http code google com p gdata python client 将视频上传到 youtube 我需要将其隐私设置为不公开 但是API page http code google com
  • 发送 JSON 数组 RETROFIT 2 (Android)

    我是新手 知道这个问题有很多帖子 但我找不到答案 因此 我需要使用 Retrofit2 和请求 PATCH 来升级用户及其议程 但是 我不知道如何使用 Retrofit2 做到这一点 即使我的研究 没有任何作用 你能帮我吗 谢谢提前 D 这
  • 以编程方式创建饼图[关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 如何以编程方式从 java 生成饼图 我有一些由程序处理的数据 然后我想创建一个包含饼图的图像文件 P
  • 超时已过期。从池中获取连接之前超时时间已过。 。例外

    出现异常 超时已过 从池中获取连接之前超时时间已过 发生这种情况的原因可能是所有池连接都在使用中并且已达到最大池大小 code HotelDealsDataClassesDataContext hotelDealsDataContext D
  • 如何添加多个悬停工具而不在工具栏中显示多个图标?

    遵循示例here https github com bokeh bokeh blob 16e87ed63ca1aecaa42e93293f32d936685dcd3e sphinx source docs user guide exampl
  • 如何在 Flutter/Dart 中请求短信权限?

    我在用着权限处理程序 https pub dev packages permission handler请求视频和音频 但我无法让它请求发送短信的权限 我不知道这是否是我手机设置 我手机 摩托罗拉 Moto X4 XT1900 1 我手机操
  • 在 Ruby 中列出 attr_accessor 的最快/单行方法?

    列出定义的所有方法的最短的单行方法是什么attr accessor 如果我有课的话我想做到这一点MyBaseClass 任何扩展它的东西 我都可以得到attr accessor是在子类中定义的 像这样的事情 class MyBaseClas
  • 在 Grails 中翻译 HTML 选择元素

    认为这会更容易 想象一下
  • 插入/拔出耳机时 SKAudioNode() 崩溃

    我正在使用一个SKAudioNode 在我的游戏中播放背景音乐 我有播放 暂停功能 在插入耳机之前一切正常 根本没有声音 当我调用暂停 播放函数时 出现此错误 AVAudioPlayerNode mm 333 开始 所需条件为假 engin
  • Xcode:无法获取进程的任务

    我已经在使用 Xcode 4 的 iPhone 上以发布模式运行了我的应用程序 一切都很顺利 直到我切换到模拟器并切换回 iPhone 切换回来后 该应用程序在 iPhone 上启动 但主屏幕立即显示 在 Xcode 中我得到 failed
  • objectid 的 mongodb 部分最有可能是唯一的

    在我的应用程序中 我让 mongo 通过其 ObjectId 方法生成订单 id 但在用户测试中 我们担心订单 ID 会让人感到 恐吓 即如果您需要通过电话与某人讨论您的订单 那么读出 24 个字母数字字符有点乏味 同时 我真的不想存储两个
  • 简单的PHP模板解析

    我想创建一个简单的 PHP 类 用于在 PHP 中解析基本的 HTML 电子邮件模板 非常基本 将 PHP 数组传递到一个函数中 该函数有一个包含带有占位符的电子邮件模板 HTML 的变量 var name PHP 数组的键将是模板中的变量
  • java.lang.NoClassDefFoundError: org/hibernate/cfg/Configuration

    我正在尝试在 Eclipse 中使用 Hibernate 进行初始设置 同时使用 Tomcat 进行部署 我遇到了以下问题 java lang ClassNotFoundException org hibernate cfg Configu
  • Android:AlarmManager 在过去的时间触发

    这是我的警报管理器代码 Intent intent new Intent getBaseContext AlarmReciever class intent setAction com example projectx ACTION Pen
  • 从 System.Type 初始化通用对象

    我需要创建一个泛型类型 但我在编译时不知道该类型 我想这样做 Type t typeof whatever var list new List
  • python3.0上的安装工具

    我试图为 python3 0 安装 setuptool 包 但不幸的是 我尝试安装它说模块名称 dist 丢失 请帮我解决这个问题 截至 2013 年 3 月的编辑 请查看下面已接受的答案 以获取 LennartRegebro 的最新回复
  • 如何访问Django模板中的动态键? [复制]

    这个问题在这里已经有答案了 请看下面的代码 for row in df src iterrows tr td td tr
  • cURL 加载时间太长

    我使用 cURL 调用 PHP 中的 REST 端点来获取一些 JSON 数据
  • 如何使用 Xcode 调试 dylib?

    我有一个 arith 库的 Xcode 项目 我可以使用调试配置来构建它 并且我需要调试它 我怎样才能做到这一点 理想的方法是设置测试代码以在项目文件中构建执行 然后在 arith 库的源代码中设置断点 但是 Xcode arith 项目似
  • 使用 flink runner 在梁上进行 Tensorflow 变换

    这可能看起来很愚蠢 但这是我在这里发表的第一篇文章 抱歉做错了什么 我目前正在使用 python2 7 使用 TFX 0 11 即 tfdv tft tfserving 和tensorflow 1 11 构建一个简单的 ML 管道 我目前有