Apache Beam - 跳过管道步骤

2023-12-05

我正在使用 Apache Beam 设置一个由 2 个主要步骤组成的管道：

使用 Beam Transform 来转换数据
将转换后的数据加载到 BigQuery

管道设置如下所示：

myPCollection = (org.apache.beam.sdk.values.PCollection<myCollectionObjectType>)myInputPCollection
                .apply("do a parallel transform"),
                     ParDo.of(new MyTransformClassName.MyTransformFn()));

 myPCollection
    .apply("Load BigQuery data for PCollection",
            BigQueryIO.<myCollectionObjectType>write()
            .to(new MyDataLoadClass.MyFactTableDestination(myDestination))
            .withFormatFunction(new MyDataLoadClass.MySerializationFn())

我看过这个问题：

Apache Beam：跳过已构建的管道中的步骤

这表明我可以按照步骤 1 中的并行转换以某种方式动态更改可以将数据传递到的输出。

我该怎么做呢？不知道如何选择通过或不通过myPCollection从步骤1到步骤2。如果对象在myPCollection从步骤 1 开始是null.

你只是不从你的MyTransformClassName.MyTransformFn当您不想在下一步中使用它时，例如如下所示：

class MyTransformClassName.MyTransformFn extends...
  @ProcessElement
  public void processElement(ProcessContext c, ...) {
    ...
    result = ...
    if (result != null) {
       c.output(result);   //only output something that's not null
    }
  }

这样空值就不会到达下一步。

See the ParDo指南部分了解更多详细信息：https://beam.apache.org/documentation/programming-guide/#pardo

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

googlecloudplatform

ApacheBeam

Apache Beam - 跳过管道步骤的相关文章

光学标记阅读器的开源库[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我想要一个用于光学标记读取 OMR 的开源库有这样的库吗我想在我的 java 应用程序中使用这个库 zxing 可能对你有用 http
AbstractCollection 的 toArray 方法的实现中的代码有什么用

public Object toArray Estimate size of array be prepared to see more or fewer elements Object r new Object size Iterator
Java 多头中的斐波那契计算显示负值

我的斐波那契计算器工作正常但当数字增加时结果会出现负值就像它是一个Integer超过其最大值它正在使用缓存java util Map
为什么 DragHandler exportAsDrag 禁用我的 MouseMotionListener？

我想实现一个简单的 JComponent 拖放并带有 O Reilly Swing Hacks 的预览我的问题是如果 TransferHandler 启动 Drag MouseMotionListener 停止执行 mouseDrag
在 Eclipse 中跨文件搜索注释掉的代码

有没有一种快速方法可以在 Eclipse 中查找 Java 文件中所有注释掉的代码也许是搜索中的任何选项或者任何可以执行此操作的附加组件它应该只能找到被注释掉的代码而不是普通的注释在 Eclipse 中我只是在打开正则表达式复选
JPA 为每个项目选择最新实例

假设我有一个会议实体每次会议都有一个与会者和一个会议日期在我的会议表中我可能为每个与会者举行多个会议每个会议都有不同的日期我需要一个 JPA 查询该查询将为所有与会者仅选择最新的会议例如如果我的桌子看起来像这样 Meetin
UnsupportedOperationException：特权进程中不允许使用 WebView

我在用android sharedUserId android uid system 在我的清单中获得一些不可避免的权利从 HDMI 输入读取安卓盒子 http eweat manufacturer globalsources com s
如何使用java避免Mysql数据库中的“数据因列被截断”？

在我的 Java 程序中 Hibernate Bean 类定义一列例如 TimtableVO java Column name REPEAT DAYS private WeekdayType repeatDays hear Weekday
在 Java 中查询 XML 的最简单方法

我有带有 XML 的小字符串例如 String myxml
Java中通过FTP创建文件夹层次结构

Java 是否有现成的功能可以在远程 FTP 服务器上创建文件夹层次结构 Apache Commons 确实提供了 FTP 客户端但我找不到创建目录层次结构的方法它确实允许创建单个目录 makeDirectory 但创建整个路径似乎并不
Ubuntu 的打包 - Web 应用程序

Web 应用程序没有与 C 或类似文件不同的 make 文件但是它需要放置在特定的目录中例如 var www 我是 Linux 打包新手所以我的问题是如何将我的应用程序打包到 deb 中以便在安装时将其放入 etc myprog
使用java读取Excel工作表的单列

我有一张 Excel 表格我想编写一个方法该方法将参数作为要读取的列号并返回一个由该列中的所有数据组成的数组然后将该列元素放置在 xml 工作表中我怎样才能编写一个方法来做到这一点使用 Apache POI 您可以在他们的使用页
Apache HttpClient 执行时会在所有 HTTP 5XX 错误上抛出 IOException 吗？

The Apache HttpClient 文档 http hc apache org httpcomponents client ga httpclient apidocs org apache http client HttpClien
从 AlertDialog 返回值

我想构建一个函数来创建 AlertDialog 并返回用户输入的字符串这是我用于创建对话框的函数如何返回该值 String m Text private String openDialog String title AlertDialo
使用 Mockitos 传递参数化输入

我正在使用 Mockito 进行单元测试我想知道是否可以使用 Junit 测试中的方式发送参数化输入参数 e g InjectMocks MockClass mockClass new MockClass Test public void
在同一台计算机上设置 JBoss 的多个实例

我在 JBoss 社区中找到了下一页 http www jboss org community wiki ConfigurePorts http www jboss org community wiki ConfigurePorts 有下一
Java 8 Stream - 为什么过滤器方法不执行？ [复制]

这个问题在这里已经有答案了我正在学习使用java流进行过滤但是过滤后的流没有打印任何内容我认为过滤器方法没有被执行我的过滤代码如下 Stream of d2 a2 b1 b3 c filter s gt s startsWith b
从 SQL 语句中检索元数据（表名）

我使用的是 Visual Studio 2008 我创建了一个 Winforms 应用程序并且尝试从 SQL 语句中提取表名 con new SqlConnection connString String queryString Sele
Java Calendar.set(Calendar.DAY_OF_WEEK, Calendar.SUNDAY)，它会向后滚动、向前滚动还是未知？

假设以下代码在 2009 年 8 月 22 日星期六执行 Calendar c Calendar getInstance c set Calendar DAY OF WEEK Calendar SUNDAY c get Calendar
使用 Tomcat 和 gradle 进行休眠

免责声明我是 Java 新手我正在尝试使用 Tomcat 和 Gradle 设置 Hibernate 构建运行正确但看起来像persistence xml文件未被读取我的项目结构如下 build gradle src main ja

随机推荐

在 C# 中向变量名称添加数字

我的问题有点像这里的问题如何在 C 中动态命名变量然而它有点不同所以我想知道它是否可能我正在尝试从 settings 文件中读取一堆字符串我将它们全部命名为 Time1 Time2 Time3 等我希望用户能够向文件添加更多时间
Swift 中的重复字符串

我的任务是创建一个函数该函数接受字符串和 int 两个参数该函数将返回一个字符串该字符串重复字符串参数 int 的次数这是我想到的但出现错误顺便说一句这是我在工作时在 CodeCardio 上做的所以我无法在 Xcode 中
ATL CString 到字符数组的转换

我想转换一个CString into a char 有人告诉我该怎么做吗我的代码是这样的 CString strCamIP1 T char g acCameraip 16 17 strCamIP1 theApp GetProfileStr
我如何知道 getScript Ajax 调用何时完成？

我正在使用 jQuerygetScript将 X 数量的 js 文件加载到我的页面中每个 JS 页面都有一个 AJAX 调用用于从数据库获取数据我正在使用 done方法上getScript查看所有文件何时加载但我需要等到所有 AJA
Rails：重命名控制器和相应的模型

有没有一种简单的方法可以重命名我的应用程序中的控制器和模型以及相应代码中的所有实例我正在使用 textmate 这是否像使用替换功能并将 Post 一词替换为 Report 一样简单您需要更改名称控制器以及相关的Model Views
Graphviz/Dot - 如何用独特的颜色标记树上的所有叶子？

我有一个将图形打印为 dot 文件的脚本我想用独特的颜色突出显示不同程度的所有顶点 Graphviz 可以吗所以我对以下内容感兴趣 For each i degree vertex use color i 作为一个特例如何用独特的颜
从 Windows 窗体到 WPF [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我已经有很长时间的经验了Windows 窗体开发人员但现在是时候搬到WPF因为一个新的 WPF 项目即将到来而我只有很短的准备时间来准备学习 W
Grails GORM：如何创建复合主键并将其用于表关系？

我有两个表其中一个旧表 A 有两个应用作复合外键的字段另一个新表 B 应使用复合主键作为复合外键each row A has one row B关系我如何用 GORM 来描述这些表到目前为止我已经能够创建一个反映旧表的域类 A
Python从数据中删除异常值

我有一个数据框如下 ID Value A 70 A 80 B 75 C 10 B 50 A 1000 C 60 B 2000 我想按 ID 对这些数据进行分组从分组数据中删除异常值我们从箱线图中看到的异常值然后计算平均值 So far
iPhone NSDate 例如。下周五

我想创建一个函数来得出下周五的日期但我没有计划如何去做有人给我一个好的提示吗例如使用 NSDate 获取当前日期然后使用 NSCalendar 中的 components gt fromDate 获取 NSDateComponen
如何使用 Database First 创建模型后设置由实体框架中的数据库生成的 id 键

我在 Web API 项目中使用实体框架我已经从现有数据库 MySQL 创建了类和模型因此我基本上使用 EF DbContextGenerator 从 EDMX 模型生成类读取操作工作正常但我现在想要开始添加功能以将记录添加到数据库
未从 Github 语言统计中排除的路径

我已经读过相关的 SO 线程here and here 以及 Github 语言学家手动超控但我似乎无法从语言统计中排除一些顶级目录在当前的最新版本中这个仓库显示了 HTML 代码的优势单击 HTML 详细信息会列出两个 HTML
当基础数据更改时，GridView 内容不会更新

所以我有一个包含两个控件的 ASP NET 页面 a GridView显示来自 a 的行SqlDataSource 并且用户可以在其中选择一行 a DetailsView用户可以在其中看到and edit所选行的值 The DetailsV
将 CharFilter 与 Lucene 4.3.0 的 StandardAnalyzer 结合使用

我正在尝试添加一个CharFilter to my StandardAnalyzer 我的目的是从我索引的所有文本中删除标点符号例如我想要一个前缀查询 pf 来匹配 P F Changs 或 zara s 来匹配 Zara s 看来这里
如何在 Visual Studio 2008 中使用 .a lib 文件？

所以我将一些 C C 库编译成 a 文件图书馆是FFmpeg 52 任何人都可以为我提供有关如何在 Visual Studio 2008 中使用它的详细说明如何将其链接到 VS 以便编译器找到它等等这可能有用从 MinGW 静态库
Google BigQuery 中的查询表出现错误“访问被拒绝：BigQuery BigQuery：通配文件模式时权限被拒绝”。

我是 Google BigQuery 的新手如果我的问题有点简单请原谅我我先澄清一下这个问题的背景 Account1 创建一个存储桶多区域和外部表 Account1可以成功查询外部表数据授予 Account2 以下项目角色 Ac
在Python中从视频源创建视频缩略图

我有一个视频文件的 url 我想生成每个视频源 url 的缩略图我正在使用 Django 我的应用程序这样做 1 Crawl the some webpage 2 Extract all the video link from it 3
对数组中的值从小到大进行排序/排序

我有一个这样的公式 ArrayFormula sort INDEX B 1 B 10 MATCH E1 A 1 A 10 0 in columns A B a 1 b 2 c 3 d 4 e 5 f 6 g 7 h 8 i 9 j 10 a
应用程序上下文加载两次

我正在使用 Tomcat 7 和 Eclipse 使用 Struts 3 编写一个 Web 应用程序当我启动 Tomcat 时上下文似乎被加载了两次日志文件显示 applicationContext xml 被读取了两次我在 Tom
Apache Beam - 跳过管道步骤

我正在使用 Apache Beam 设置一个由 2 个主要步骤组成的管道使用 Beam Transform 来转换数据将转换后的数据加载到 BigQuery 管道设置如下所示 myPCollection org apache beam

Apache Beam - 跳过管道步骤

Apache Beam - 跳过管道步骤 的相关文章

随机推荐

热门标签

Apache Beam - 跳过管道步骤的相关文章