Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
Flink - 无法从检查点恢复
我使用一个作业管理器和两个任务管理器在 kubernetes 上运行集群 我通过在作业运行时杀死一个任务管理器 Pod 来测试检查点机制 我在作业管理器和重新启动的任务管理器上遇到以下异常 工作经理例外 java lang Exceptio
apacheflink
rocksdb
streamprocessing
了解Kafka流groupBy和window
我无法理解 kafka 流中的 groupBy groupById 和窗口的概念 我的目标是聚合一段时间内 例如 5 秒 的流数据 我的流数据看起来像 value 0 time 1533875665509 value 10 time 153
Java
ApacheKafka
apachekafkastreams
streamprocessing
jq Streaming - 过滤嵌套列表并保留全局结构
在一个大型 json 文件中 我想从嵌套列表中删除一些元素 但保留文档的整体结构 我的示例将其输入为 但真实的输入足够大以要求流式传输 keep untouched keep this this list filter this keep
json
Bigdata
jq
streamprocessing
在实践中(而非理论上),小批量与实时流有什么区别?
在实践中 而非理论上 小批量与实时流有什么区别 从理论上讲 我理解迷你批次是在给定时间范围内进行批处理的东西 而实时流更像是在数据到达时执行某些操作 但我最大的问题是为什么不使用带有 epsilon 时间范围 例如一毫秒 的迷你批次或者我想
kappa架构和lambda架构有什么区别
如果 Kappa 架构直接对流进行分析 而不是将数据分成两个流 那么在像 Kafka 这样的消息系统中 数据存储在哪里 或者可以在数据库中进行重新计算吗 单独的批处理层是否比使用流处理引擎重新计算进行批处理分析更快 需要考虑的一个非常简单的
为什么 Apache Flink 需要 Watermarks 进行事件时间处理?
有人可以正确解释事件时间戳和水印吗 我从文档中理解了它 但不是那么清楚 现实生活中的例子或外行定义会有所帮助 另外 如果可能的话请给出一个示例 以及一些可以解释它的代码片段 提前致谢 这是一个示例 说明了为什么我们需要水印以及它们的工作原理
apacheflink
streamprocessing