流中记录的排序

2023-12-07

以下是我的一些疑问：

我有两个不同的流stream1 and stream2其中元素是有序的。

1）现在当我这样做时keyBy在每个流上，顺序会保持不变吗？（因为这里的每个组都只会发送给一个任务管理器）我的理解是记录将按小组顺序排列，请在这里纠正我。

2）之后keyBy在这两个流上，我正在进行共同分组以获取匹配和不匹配的记录。这里的顺序也会维持吗？因为这也适用于KeyedStream。我在用EventTime, and AscendingTimestampExtractor用于生成timestamp and watermark.

3）现在我想对matching_nonMatchingStream我从 2) 使用地图/平面图得到。我需要再次执行keyBy在这里，或者如果我被束缚的话matching_nonMatchingStream运行在相同的TaskManager？我的理解是，链条将在这里工作，请纠正我，感到困惑。

4) slotSharingGroup- 你能详细描述一下吗根据文档：设置此操作的槽共享组。位于同一槽共享组中的操作的并行实例将共同位于同一槽中TaskManager插槽，如果可能的话。

关于订购保证

此页面提供了很好的概述和解释，以及订购保证：https://ci.apache.org/projects/flink/flink-docs-release-1.0/concepts/concepts.html#parallel-dataflows

要点是：

订单维持在每个并行流分区内。有关流分区的说明，请参见此处：https://ci.apache.org/projects/flink/flink-docs-release-1.0/concepts/concepts.html#parallel-dataflows

对于像“keyBy()”或“rebalance()”这样改变分区的操作，顺序是按每对源和目标流分区维护的，即每对发送和接收操作符。

正如 Matthias 提到的，如果一个组（由一个键定义，在一个接收目标运算符上运行）从多个发送者获取元素，则不存在明确定义的严格元素顺序。使用事件时间等概念，您可以根据数据（附加的时间戳）施加有意义的排序。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apacheflink

flinkstreaming

流中记录的排序的相关文章

无法在 Flink 新 Kafka Consumer-api (1.14) 中的检查点上向 Kafka 提交消费偏移量

我使用以下代码引用 Kafka 源连接器的 Flink 1 14 版本我期待以下要求在应用程序刚开始时必须读取 Kafka 主题的最新偏移量在检查点上它必须将消耗的偏移量提交给 Kafka 重新启动后当应用程序手动终止系统错误时
谁能分享一下 Scala 中的 Flink Kafka 示例吗？

谁能分享一下Scala中Flink Kafka 主要是从Kafka接收消息的工作示例吗我知道有一个Kafka字数统计 https github com apache spark blob master examples src main
Apache Flink：如何从 Cassandra 读取数据流/数据集？

我尝试将 Cassandra 视为 Flink 中的数据源并使用以下链接中提供的信息从 Cassandra 读取数据以在 Flink 中进行处理 https stackoverflow com questions 43067681 re
从 FlinkML 多元线性回归中提取权重

我正在运行 Flink 0 10 SNAPSHOT 的示例多元线性回归我不知道如何提取权重例如斜率和截距 beta0 beta1 无论你想怎么称呼它们我对 Scala 不太熟悉这可能是我问题的一半感谢任何人可以提供的任何帮助 ob
Flink 中的水印和触发器有什么区别？

我读到排序运算符必须缓冲它接收到的所有元素然后当它接收到水印时它可以对时间戳低于水印的所有元素进行排序并按排序顺序发出它们这是正确因为水印表明不能有更多元素到达并与已排序元素混合 https cwiki apache org
Flink：处理数据早于应用程序水印的键控流

我正在使用带有运动源和事件时间键控窗口的 F link 该应用程序将监听实时数据流窗口事件时间窗口并处理每个键控流我有另一个用例我还需要能够支持某些关键流的旧数据的回填这些将是事件时间鉴于我正在使用水印这会成为一个问题因为
flink kafka生产者在检查点恢复时以一次模式发送重复消息

我正在写一个案例来测试 flink 两步提交下面是概述 sink kafka曾经是kafka生产者 sink stepmysql接收器是否扩展two step commit sink comparemysql接收器是否扩展two step
Apache Flink 环境中的 AWS SDK 冲突

我正在尝试将我的作业部署到 Flink 环境但总是收到错误 java lang NoSuchMethodError com amazonaws AmazonWebServiceRequest putCustomQueryParameter
Apache Flink、JDBC 和 fat jar 是否存在类加载问题？

使用 Apache Flink 1 8 并尝试运行RichAsyncFunction 我得到No Suitable Driver Found初始化 Hikari 池时出错RichAsyncFunction open 在 IDE 中它运行得很
在 Flink 中，我可以在同一个槽中拥有一个算子的多个子任务吗？

探索Apache Flink几天了对Task Slot的概念有些疑惑虽然有人问了几个问题但有一点我不明白我正在使用一个玩具应用程序进行测试运行本地集群我已禁用运算符链接我从文档中知道插槽允许内存隔离而不是 CPU 隔离阅读文
在 Flink 流中使用静态 DataSet 丰富 DataStream

我正在编写一个 Flink 流程序其中我需要使用一些静态数据集信息库 IB 来丰富用户事件的数据流对于例如假设我们有一个买家的静态数据集并且有一个传入的事件点击流对于每个事件我们希望添加一个布尔标志来指示事件的执行者是否是买家
Flink 的简单 hello world 示例

我正在寻找 Apache flink 的 hello world 体验的最简单的示例假设我刚刚在一个干净的盒子上安装了 flink 那么为了让它做某事我需要做的最低限度是什么我意识到这很模糊这里有一些例子来自终端的三个 pyth
Flink 流顺序

Flink 能保证流的执行顺序吗我有两个 Kafka 主题每个主题都有一个分区流 1 和流 2 并使用keyBy 流由一个处理coprocess功能在我的测试过程中我可以看到两个流的内容并不总是按顺序执行我可以将并行度设置为 1
Apache Flink - 如何使用 AWS Kinesis 发送和使用 POJO

我想使用 Flink 来使用来自 Kinesis 的 POJO 是否有关于如何正确发送和反序列化消息的标准 Thanks 我用以下方法解决了它 DataStream
对 Parquet 批量格式使用压缩

从 Apache Flink 1 15 版本开始您可以使用压缩功能将多个文件合并为一个 https nightlies apache org flink flink docs master docs connectors datastre
Flink中为什么DataStream不支持聚合

我是 Flink 的新手有时我想在 DataStream 上进行聚合而不需要先执行 keyBy 为什么 Flink 不支持 DataStream 上的聚合 sum min max 等谢谢你艾哈迈德 Flink 支持非 keyed
Flink 窗口：聚合并输出到接收器

我们有一个数据流其中每个元素都是这种类型 id String type Type amount Integer 我们想要聚合这个流并输出总和amount每周一次目前的解决方案 Flink 管道示例如下所示 stream keyBy ty
Apache Flink 中的并行度

我可以为 Flink 程序中任务的不同部分设置不同的并行度吗例如 Flink 如何解释以下示例代码两个自定义实践者MyPartitioner1 MyPartitioner2 将输入数据划分为两个4和2个分区 partitionedDat
《使用 Apache Flink 进行流处理》如何从 IntelliJ 运行书籍代码？

如中所述这个帖子 https stackoverflow com questions 61043860 how to run first example of apache flink我无法成功运行使用 Apache Flink 进行流处
我想使用 Flink 的 Streaming File Sink 写入 ORC 文件，但它无法正确写入文件

我正在从 Kafka 读取数据并尝试将其以 ORC 格式写入 HDFS 文件系统我使用了他们官方网站上的以下链接参考但我可以看到Flink为所有数据写入完全相同的内容并生成这么多文件并且所有文件都可以103KB https ci apa

随机推荐

通过交换多个字母来修改字符串

假设我有一个很长的字符串例如 ABCEEEEEEDEDAAA 但它仅由五个字母组成说我全部都要 A to be D 反之亦然同样 B and C 一个例子是 DNA 中的核苷酸修改后的示例将是 DCBEEEEEEAEADDD 我意识
Response.Redirect 从 Visual Studio 中的一个 Web 项目到另一个 Web 项目

我正在尝试将项目集成到现有的解决方案中解决方案中的启动项目名为 Foo 它被写入虚拟路径 csweb 当该项目启动时它会加载 csweb Default aspx 这是当前未修改的主页我正在尝试重定向到不同项目中的不同主页我向名为
解析推送通知异常：“未经授权：需要主密钥”

我想使用 Parse API 和 GCM 发送推送通知我已经在服务器上成功完成配置并通过从解析终端发送推送通知并在 Android 设备上接收进行测试但是当我以编程方式发送推送时出现异常未经授权需要主密钥我使用以下代码 Pars
如何将字符串列表数据绑定到 WPF/WP7 中的列表框？

我试图将字符串值列表绑定到列表框以便它们的值逐行列出现在我用这个
如何确定 Perl 警告的位置 - 插入后在哈希上使用each()

我有一个相当大的 Perl 程序用 PAR Packer 打包成可执行文件它使用了相当多的模块通常当 perl 给我一个警告时比如使用未定义的值它会打印错误的位置然后很容易更深入地调试它然而我现在面临一个错误我认为是在
如何缩放嵌入
标签的顽固 SVG？
我有一些指定的 SVG 文件width and height也viewbox像这样

Scala 正则表达式 IP 地址模式匹配

我不明白为什么这段代码返回 false val reg d 1 3 d 1 3 d 1 3 d 1 3 r ttt20 30 4 140ttt match case reg one two three four gt if host one

如何更改浮动元素的顺序？

我几乎不使用float right在我的 css 中现在我做了并遇到了一个恼人的问题我将菜单项浮动到右侧 my HTMl ul li a href Home a li li a href Feedback a li li a href

如何将 CsvHelper.CsvWriter 与 F# 选项类型一起使用？

我正在尝试使用 Net CsvHelper 库将 F 记录集合保存到 csv 文件问题在于选项类型未正确转换为字符串 r nuget CsvHelper open System IO open System Globalization o

JQuery - $ 未定义

我有一个简单的 jquery 点击事件以及 site master 中定义的 jquery 引用 Scripts jquery 1 3 2 js gt type text javascript gt 我已经检查了脚本是否被正确解析我能够

分页大结果集的最佳方法是什么 - Java

我正在寻找从性能角度来看的最佳方法在网页上部分显示结果集比如说每页 10 个项目如果用户想查看更多结果他可以按下一个 btn 我认为可能是错误的按下下一步按钮时应该向服务器发出新请求目前我正在尝试学习Java GWT 谢

如何防止回到之前的活动？

当按下手机上的返回按钮时我想防止特定活动返回到上一个活动具体来说我有登录和注册屏幕两者都启动一个名为的新活动HomeScreen当成功登录注册时主屏幕启动后我想阻止用户通过按返回键返回登录或注册屏幕我尝试使用Inte

使用 TPACKET_V2 时，Vlan id 设置为 0

我对这个 TPACKET V2 的使用有疑问我的问题是在套接字上设置这种类型的数据包后当我尝试接收一些数据包时我无法从数据包中读取 vlan id 当然是从数据包的标头 vlan tci 始终为 0 现在我正在使用 open sus

NSString *string = @"someString" vs NSString *string = [[NSString alloc] initWithFormat@"%@", string]

如果我有一个方法 void myMethod NSString string Object anothermethodWithString string 我打电话给 Object myMethod this is a string with

如何将未知的参数列表映射到 elisp 中的启动进程？

我终于尝试学习 elisp 但还没有集中精力如何将未知的参数列表动态映射到变量这是一个工作函数它将最多三个参数传递给启动进程但我想将无限数量的参数传递给该函数 defun create drush buffer command res

C++ 空括号成员初始化 - 将内存清零？

我最初写了一些这样的代码 class Foo public Foo m buffer private char m buffer 1024 比我聪明的人说使用 m buffer 初始化器会将内存清零我的目的是让内存保持未初始化状态我没有

将 Unicode 转义符转换为希伯来语文本

我的 json 文件中有以下文本 u00d7 u0090 u00d7 u0097 u00d7 u0095 u00d7 u0096 u00d7 u00aa u00d7 u00a4 u00d7 u0095 u00d7 u009c u00d7 u

将大量 CSV 文件导入 Matlab

我有一个 1 6 GB 大的 CSV 文件需要将其输入到 matlab 中我必须经常这样做并且需要它快速运行该文件的格式为 20111205 00 00 2 99 18 6 E 20111205 00 00 2 99 18 5 E

通过 iPhone 应用程序拨打电话号码

嗨 iPhone 开发者我想在我的 iPhone 应用程序中添加一个功能它们是拨打我的应用程序中的电话号码通话结束后重新启动之前的应用程序我知道它在 iphone OS 3 2 中不可能 iOS 4 中可以吗我需要你的帮助你

流中记录的排序

以下是我的一些疑问我有两个不同的流stream1 and stream2其中元素是有序的 1 现在当我这样做时keyBy在每个流上顺序会保持不变吗因为这里的每个组都只会发送给一个任务管理器我的理解是记录将按小组顺序排列请在这里纠正
热门标签

系统启动

多媒体系统

聊天软件压力测试

无感停车场解决方案

3D视觉扫描

Linux系统开挖

★商务智能

Redis源码分析

Redis源码

以太网硬件

ccasm

linux c语言

windows逆向

生活中有用的小技巧

scrum看板工具

敏捷开发工具

植物大战僵尸

安装程序

SDK开发
Powered by Hwhale

流中记录的排序

关于订购保证

流中记录的排序 的相关文章

随机推荐

热门标签

流中记录的排序的相关文章