使用 flink runner 在梁上进行 Tensorflow 变换

2023-12-21

这可能看起来很愚蠢，但这是我在这里发表的第一篇文章。抱歉做错了什么。

我目前正在使用 python2.7 使用 TFX 0.11（即 tfdv-tft-tfserving）和tensorflow 1.11 构建一个简单的 ML 管道。我目前有一个 apache-flink 集群，我想将其用于 TFX。我知道 TFX 背后的框架是 apache-beams 2.8，它（apache-beams）目前通过便携式运行器层支持带有 python SDK 的 flink。

但问题是我如何通过这个便携式运行器概念使用 apache-beams 和 flink 运行器在 TFX (tfdv-tft) 中进行编码，因为 TFX 目前似乎只支持 DirectRunner 和 DataFlowRunner (Google Cloud)。

我在网上搜索了一段时间，在TFX网站上看到最后一行，

“请使用 tensorflow-transform 标签将有关使用 tf.Transform 的任何问题直接提交至 Stack Overflow。”

这就是我在这里的原因。任何想法或解决方法都非常感激。谢谢你！

谢谢你的提问。

免责声明：Portable Flink Runner 仍处于实验阶段，仅适用于少量的输入数据。

以下是如何通过 Beam 在 Flink 上运行 TFX。

先决条件

Linux
Docker
光束回购：https://github.com/apache/beam https://github.com/apache/beam
用于输入和输出的分布式文件系统。

运行 python 管道的说明：https://beam.apache.org/roadmap/portability/#python-on-flink https://beam.apache.org/roadmap/portability/#python-on-flink
注意：我们目前仅支持 Flink 1.5.5

指示

1）构建Worker容器：

转到 Beam 结账目录
运行 gradle 命令： ./gradlew :beam-sdks-python-container:docker

2) 运行 Flink 的 Beam JobServer：

转到 Beam 结账目录
运行 gradle 命令：./gradlew beam-runners-flink_2.11-job-server:runShadow 注意：此命令不会完成，因为它会启动作业服务器并保持其运行。

3）提交管道

请参阅https://github.com/angoenka/model-analysis/blob/hack_1/examples/chicago_taxi/preprocess_flink.sh https://github.com/angoenka/model-analysis/blob/hack_1/examples/chicago_taxi/preprocess_flink.sh
注意：确保将以下标志传递到您的管道

--experiments=beam_fn_api --runner PortableRunner --job_endpoint=localhost:8099 --experiments=worker_threads=100 --execution_mode_for_batch=BATCH_FORCED

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 flink runner 在梁上进行 Tensorflow 变换的相关文章

单词预测算法

我确信有一篇关于此问题的帖子但我找不到提出这个确切问题的帖子考虑以下我们有字典可供使用我们收到了许多单词段落我希望能够根据此输入预测句子中的下一个单词假设我们有几个句子例如你好我的名字是汤姆他的名字是杰瑞他去了没有水的
线性问题和非线性问题之间的区别？点积和核技巧的本质

核技巧将非线性问题映射为线性问题我的问题是 1 线性问题和非线性问题的主要区别是什么这两类问题的差异背后的直觉是什么核技巧如何帮助在非线性问题上使用线性分类器 2 为什么点积在这两种情况下如此重要 Thanks 当人们说到分类问题的线
期望最大化算法的数值示例[重复]

这个问题在这里已经有答案了由于我不确定给出的公式有人可以提供 EM 算法的简单数字示例吗一个非常简单的具有 4 或 5 个笛卡尔坐标的坐标就可以了那这个呢 http en wikibooks org wiki Data Mining
Keras 错误：预计会看到 1 个数组

当我尝试在 keras 中训练 MLP 模型时出现以下错误我使用的是 keras 版本1 2 2 检查模型输入时出错您输入的 Numpy 数组列表传递给您的模型的尺寸不是模型预期的尺寸预期的查看 1 个数组但得到以下 12859
使用 glmnet 纠正 n 个数据集上的 n 个 LASSO 回归的输出（严格来说是所选的特征/变量）

注意这是对上一个问题 https stackoverflow com questions 75006466 how to replicate my results from running n lassos iteratively usi
为什么我的精确率-召回率和 ROC 曲线不平滑？

我有一些标记为 0 或 1 的数据我正在尝试使用随机森林来预测这些类别每个实例都标有 20 个用于训练随机森林的特征约 30 000 个训练实例和约 6000 个测试实例我使用以下代码绘制精确召回率和 ROC 曲线 precisio
在 R 中绘制决策树（插入符）

我已经训练了一个数据集rf方法例如 ctrl lt trainControl method LGOCV repeats 3 savePred TRUE verboseIter TRUE preProcOptions list thresh
“Dense”对象没有属性“op”[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我正在尝试使用tensorflow keras制作一个完全连接的模型这是我的代码 from tensorflow keras m
期望最大化抛硬币的例子

我最近一直在自学期望最大化并在这个过程中给自己举了一些简单的例子 http cs dartmouth edu cs104 CS104 11 04 22 pdf http cs dartmouth edu cs104 CS104 11 04
在逻辑回归中使用排名数据

当我努力学习这些概念时我将对此给予最大赏金我正在尝试在逻辑回归中使用一些排名数据我想使用机器学习来制作一个简单的分类器来判断网页是否好这只是一个学习练习所以我不期望有很好的结果只是希望学习过程和编码技术我已将数据放入 c
Keras Predict_classes 方法返回“列表索引超出范围”错误

我对 CNN 和机器学习总体来说是新手并且一直在尝试遵循 TensorFlow 的图像分类教程现在可以找到Google Colabhere https colab research google com drive 1gwZp7 t
sklearn：如何在 sknn 中重置回归器或分类器对象

我定义了一个回归器如下所示 nn1 Regressor layers Layer Rectifier units 150 Layer Rectifier units 100 Layer Linear regularize L2 dropo
Tensorflow推荐的系统规格？

我开始在我的 RHEL 6 5 机器上安装 Tensorflow 但事实证明 Tensorflow 需要 glibc gt 2 17 而 rhel 6 5 上默认的 glibc 是 2 12 我想知道是否有人可以帮助我了解张量流的最低推荐
在Python中表示语料库句子的一种热门编码

我是 Python 和 Scikit learn 库的初学者我目前需要从事一个 NLP 项目该项目首先需要通过 One Hot Encoding 来表示一个大型语料库我已经阅读了 Scikit learn 关于 preprocessi
matlab中的正则逻辑回归代码

我正在尝试正则化 LR 在 matlab 中使用以下公式很简单成本函数 J theta 1 m sum y i log h x i 1 y i log 1 h x i lambda 2 m sum theta j 梯度 J theta t
如何在sklearn决策树中显示特征名称？

我目前有一个决策树将功能名称显示为X index i e X 0 X 1 X 2 etc from sklearn import tree from sklearn tree import DecisionTreeClassifier d
使用 to_categorical 转换 np.array 时出现内存问题

我有一个像这样的 numpy 数组 0 1 1 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 1 我这样改造它以减少内存需求 x val x val asty
2022年Flink可以支持什么Java版本？

假设我开始一个新的 Flink Java 项目如果我寻找稳定的 Flink Java 生产体验我应该使用哪个版本官方docs https nightlies apache org flink flink docs master do
如何在 python 中使用 libSVM 计算精度、召回率和 F 分数

我想计算precision recall and f score using libsvm在Python中但我不知道如何我已经发现这个网站 http www csie ntu edu tw cjlin libsvmtools eval
我想使用 Flink 的 Streaming File Sink 写入 ORC 文件，但它无法正确写入文件

我正在从 Kafka 读取数据并尝试将其以 ORC 格式写入 HDFS 文件系统我使用了他们官方网站上的以下链接参考但我可以看到Flink为所有数据写入完全相同的内容并生成这么多文件并且所有文件都可以103KB https ci apa

随机推荐

使用 python API 将视频上传到 Youtube 并将其设置为不公开

我正在使用python 客户端库 http code google com p gdata python client 将视频上传到 youtube 我需要将其隐私设置为不公开但是API page http code google com
发送 JSON 数组 RETROFIT 2 (Android)

我是新手知道这个问题有很多帖子但我找不到答案因此我需要使用 Retrofit2 和请求 PATCH 来升级用户及其议程但是我不知道如何使用 Retrofit2 做到这一点即使我的研究没有任何作用你能帮我吗谢谢提前 D 这
以编程方式创建饼图[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案如何以编程方式从 java 生成饼图我有一些由程序处理的数据然后我想创建一个包含饼图的图像文件 P
超时已过期。从池中获取连接之前超时时间已过。。例外

出现异常超时已过从池中获取连接之前超时时间已过发生这种情况的原因可能是所有池连接都在使用中并且已达到最大池大小 code HotelDealsDataClassesDataContext hotelDealsDataContext D
如何添加多个悬停工具而不在工具栏中显示多个图标？

遵循示例here https github com bokeh bokeh blob 16e87ed63ca1aecaa42e93293f32d936685dcd3e sphinx source docs user guide exampl
如何在 Flutter/Dart 中请求短信权限？

我在用着权限处理程序 https pub dev packages permission handler请求视频和音频但我无法让它请求发送短信的权限我不知道这是否是我手机设置我手机摩托罗拉 Moto X4 XT1900 1 我手机操
在 Ruby 中列出 attr_accessor 的最快/单行方法？

列出定义的所有方法的最短的单行方法是什么attr accessor 如果我有课的话我想做到这一点MyBaseClass 任何扩展它的东西我都可以得到attr accessor是在子类中定义的像这样的事情 class MyBaseClas
在 Grails 中翻译 HTML 选择元素

认为这会更容易想象一下
插入/拔出耳机时 SKAudioNode() 崩溃

我正在使用一个SKAudioNode 在我的游戏中播放背景音乐我有播放暂停功能在插入耳机之前一切正常根本没有声音当我调用暂停播放函数时出现此错误 AVAudioPlayerNode mm 333 开始所需条件为假 engin
Xcode：无法获取进程的任务

我已经在使用 Xcode 4 的 iPhone 上以发布模式运行了我的应用程序一切都很顺利直到我切换到模拟器并切换回 iPhone 切换回来后该应用程序在 iPhone 上启动但主屏幕立即显示在 Xcode 中我得到 failed
objectid 的 mongodb 部分最有可能是唯一的

在我的应用程序中我让 mongo 通过其 ObjectId 方法生成订单 id 但在用户测试中我们担心订单 ID 会让人感到恐吓即如果您需要通过电话与某人讨论您的订单那么读出 24 个字母数字字符有点乏味同时我真的不想存储两个
简单的PHP模板解析

我想创建一个简单的 PHP 类用于在 PHP 中解析基本的 HTML 电子邮件模板非常基本将 PHP 数组传递到一个函数中该函数有一个包含带有占位符的电子邮件模板 HTML 的变量 var name PHP 数组的键将是模板中的变量
java.lang.NoClassDefFoundError: org/hibernate/cfg/Configuration

我正在尝试在 Eclipse 中使用 Hibernate 进行初始设置同时使用 Tomcat 进行部署我遇到了以下问题 java lang ClassNotFoundException org hibernate cfg Configu
Android：AlarmManager 在过去的时间触发

这是我的警报管理器代码 Intent intent new Intent getBaseContext AlarmReciever class intent setAction com example projectx ACTION Pen
从 System.Type 初始化通用对象

我需要创建一个泛型类型但我在编译时不知道该类型我想这样做 Type t typeof whatever var list new List
python3.0上的安装工具

我试图为 python3 0 安装 setuptool 包但不幸的是我尝试安装它说模块名称 dist 丢失请帮我解决这个问题截至 2013 年 3 月的编辑请查看下面已接受的答案以获取 LennartRegebro 的最新回复
如何访问Django模板中的动态键？ [复制]

这个问题在这里已经有答案了请看下面的代码 for row in df src iterrows tr td td tr
cURL 加载时间太长

我使用 cURL 调用 PHP 中的 REST 端点来获取一些 JSON 数据
如何使用 Xcode 调试 dylib？

我有一个 arith 库的 Xcode 项目我可以使用调试配置来构建它并且我需要调试它我怎样才能做到这一点理想的方法是设置测试代码以在项目文件中构建执行然后在 arith 库的源代码中设置断点但是 Xcode arith 项目似
使用 flink runner 在梁上进行 Tensorflow 变换

这可能看起来很愚蠢但这是我在这里发表的第一篇文章抱歉做错了什么我目前正在使用 python2 7 使用 TFX 0 11 即 tfdv tft tfserving 和tensorflow 1 11 构建一个简单的 ML 管道我目前有

使用 flink runner 在梁上进行 Tensorflow 变换

使用 flink runner 在梁上进行 Tensorflow 变换 的相关文章

随机推荐

热门标签

使用 flink runner 在梁上进行 Tensorflow 变换的相关文章