如何将自定义 StateStore 添加到 Kafka Streams DSL 处理器？

2023-11-24

对于我的 Kafka 流应用程序之一，我需要使用 DSL 和处理器 API 的功能。我的流媒体应用程序流程是

source -> selectKey -> filter -> aggregate (on a window) -> sink

聚合后，我需要向接收器发送一条聚合消息。所以我定义我的拓扑如下

KStreamBuilder builder = new KStreamBuilder();
KStream<String, String> source = builder.stream(source_stream);
source.selectKey(new MyKeyValueMapper())
      .filterNot((k,v) -> k.equals("UnknownGroup"))
      .process(() -> new MyProcessor());

我定义一个自定义StateStore并将其注册到我的处理器，如下所示

public class MyProcessor implements Processor<String, String> {

    private ProcessorContext context = null;
    Serde<HashMapStore> invSerde = Serdes.serdeFrom(invJsonSerializer, invJsonDeserializer);


    KeyValueStore<String, HashMapStore> invStore = (KeyValueStore) Stores.create("invStore")
        .withKeys(Serdes.String())
        .withValues(invSerde)
        .persistent()
        .build()
        .get();

    public MyProcessor() {
    }

    @Override
    public void init(ProcessorContext context) {
        this.context = context;
        this.context.register(invStore, false, null); // register the store
        this.context.schedule(10 * 60 * 1000L);
    }

    @Override
    public void process(String partitionKey, String message) {
        try {
            MessageModel smb = new MessageModel(message);
            HashMapStore oldStore = invStore.get(partitionKey);
            if (oldStore == null) {
                oldStore = new HashMapStore();
            }
            oldStore.addSmb(smb);
            invStore.put(partitionKey, oldStore);
        } catch (Exception e) {
           e.printStackTrace();
        }
    }

    @Override
    public void punctuate(long timestamp) {
       // processes all the messages in the state store and sends single aggregate message
    }


    @Override
    public void close() {
        invStore.close();
    }
}

当我运行该应用程序时，我得到java.lang.NullPointerException

线程“StreamThread-18”中的异常 java.lang.NullPointerException 在 org.apache.kafka.streams.state.internals.MeteredKeyValueStore.flush(MeteredKeyValueStore.java:167) 在 org.apache.kafka.streams.processor.internals.ProcessorStateManager.flush(ProcessorStateManager.java:332) 在org.apache.kafka.streams.processor.internals.StreamTask.commit（StreamTask.java:252）在 org.apache.kafka.streams.processor.internals.StreamThread.commitOne(StreamThread.java:446) 在 org.apache.kafka.streams.processor.internals.StreamThread.commitAll(StreamThread.java:434) 在 org.apache.kafka.streams.processor.internals.StreamThread.maybeCommit(StreamThread.java:422) 在 org.apache.kafka.streams.processor.internals.StreamThread.runLoop(StreamThread.java:340) 在 org.apache.kafka.streams.processor.internals.StreamThread.run(StreamThread.java:218)

知道这里出了什么问题吗？

您需要注册您的商店outside您的处理器使用StreamsBuilder (or KStreamBuilder在旧版本中）。首先您创建商店，然后将其注册到StreamsBuilder (KStreamBuilder），并且当您添加处理器时，您提供商店名称以连接处理器和商店。

StreamsBuilder builder = new StreamsBuilder();

// create store
StoreBuilder storeBuilder = Stores.keyValueStoreBuilder(
    Stores.persistentKeyValueStore("invStore"),
    Serdes.String(),
    invSerde));
// register store
builder.addStateStore(storeBuilder);

KStream<String, String> source = builder.stream(source_stream);
source.selectKey(new MyKeyValueMapper())
        .filterNot((k,v) -> k.equals("UnknownGroup"))
        .process(() -> new MyProcessor(), "invStore"); // connect store to processor by providing store name


// older API:

KStreamBuilder builder = new KStreamBuilder();

// create store
StateStoreSupplier storeSupplier = (KeyValueStore)Stores.create("invStore")
    .withKeys(Serdes.String())
    .withValues(invSerde)
    .persistent()
    .build();
// register store
builder.addStateStore(storeSupplier);

KStream<String, String> source = builder.stream(source_stream);
source.selectKey(new MyKeyValueMapper())
        .filterNot((k,v) -> k.equals("UnknownGroup"))
        .process(() -> new MyProcessor(), "invStore"); // connect store to processor by providing store name

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apachekafkastreams

如何将自定义 StateStore 添加到 Kafka Streams DSL 处理器？的相关文章

KafkaStreams：获取窗口最终结果

是否可以得到窗口最终结果在 Kafka Streams 中通过抑制中间结果我无法实现这个目标我的代码有什么问题吗 val builder StreamsBuilder builder stream
使用 Apache Kafka Streaming 解析 JSON 数据

我有一个从 Kafka 主题读取 JSON 数据的场景通过使用 Kafka 0 11 版本我需要编写 Java 代码来流式传输 Kafka 主题中存在的 JSON 数据我的输入是包含字典数组的 Json 数据现在我的要求是获取文本
Kafka 比较键的连续值

我们正在构建一个应用程序来从传感器获取数据数据被传输到 Kafka 消费者将其发布到不同的数据存储每个数据点将具有代表传感器状态的多个属性在其中一个消费者中我们希望仅当值发生变化时才将数据发布到数据存储例如如果有温度传感器每 10
KafkaStreams serde异常

我正在使用 Kafka 和流技术我为 KStream 创建了一个自定义序列化器和反序列化器我将使用它来接收来自给定主题的消息现在的问题是我正在以这种方式创建一个 serde JsonSerializer
与 KafkaStreams 的窗口结束外连接

我有一个 Kafka 主题我希望消息具有两种不同的密钥类型旧的和新的 IE 1 new 1 old 2 new 2 old 密钥是唯一的但有些可能会丢失现在使用 Kotlin 和 KafkaStreams API 我可以记录具有相
Kafka Stream groupBy 行为：聚合的许多中间输出/更新

我正在尝试使用 Kafka Stream 来聚合人们的某些属性我有一个像这样的卡夫卡流测试 new ConsumerRecordFactory Array Byte Character input new ByteArraySeriali
新建的 KTable 不返回任何内容

我正在尝试使用 KTable 来消费来自 Kafka 主题的事件但是它什么也没返回当我使用 KStream 时它返回并打印对象这实在是太奇怪了生产者和消费者可以在这里找到 https github com pavankjadda
如何实现通用 Kafka Streams 反序列化器

我喜欢 Kafka 但讨厌编写大量序列化器反序列化器所以我尝试创建一个GenericDeserializer
升级到 kafka-streams:5.5.0-css (Apache Kafka 2.5.0) 后获取 GlobalKTable 的存储崩溃 [已解决]

我有一个使用 GlobalKTable 的 Spring Boot 应用程序它工作正常直到从 5 3 2 css 更新到 kafka streams 5 5 0 css 与 Apache Kafka 2 5 0 兼容的 Confluen
如果一个代理关闭，流应用程序中的 KafkaStream EXACTLY_ONCE 会导致重新平衡失败

我有一个 Kafka 流应用程序其中 kafka streams 和 kafka clients 均为 2 4 0 具有以下配置 properties put StreamsConfig BOOTSTRAP SERVERS CONFIG
如何配置 Spring Boot Kafka 客户端使其不尝试连接

这与Spring Boot Kafka 客户端有断路器吗 https stackoverflow com q 69914621 2886891 但我仍然认为这是一个不同的问题我们需要配置 Spring Boot Kafka 客户端以
Kafka Streams.allMetadata() 方法返回空列表

所以我正在尝试使用 Kafka 流进行交互式查询我有 Zookeeper 和 Kafka 在本地运行在 Windows 上我使用 C temp 作为 Zookeeper 和 Kafka 的存储文件夹我已经设置了这样的主题 kafka
现有内部主题具有无效分区

当在只有一个 Kafka 代理的测试设置中启动我们的 Kafka Streams 应用程序时我们大约在 15 次运行中看到以下错误 org apache kafka streams errors StreamsException Exis
有什么办法可以让kafka流暂停一段时间然后再恢复吗？

我们有一个要求即使用 Kafka Streams 从 Kafka 主题读取数据然后通过会话池通过网络发送数据然而有时网络调用有点慢我们需要经常暂停流以确保网络不会过载目前我们将数据捕获到流中并将其加载到执行器服务然后通过
Kafka Streams 在 HDFS 上查找数据

我正在使用 Kafka Streams v0 10 0 1 编写一个应用程序并希望通过查找数据来丰富我正在处理的记录该数据带时间戳的文件每天或每天 2 3 次写入 HDFS 目录我怎样才能将其加载到Kafka Streams应
即使没有消费者，消费者群体仍陷入“再平衡”

我正在使用kafka版本2 4 1 最近从2 2 0升级到2 4 1 并注意到一个奇怪的问题即使应用程序 kafka Streams 已关闭没有正在运行的应用程序但消费者组命令返回状态为重新平衡我们的应用程序作为 kubernete
KafkaStreams 同一应用程序中的多个流

我正在尝试根据 KafkaStreams 的惯例和合理性做出实用的设计决策假设我想将两个不同的事件放入其中KTables 我有一个制作人将这些消息发送给KStream那就是听那个话题据我所知我不能对消息使用条件转发KafkaStrea
有没有办法重新分区 Kafka 流中的输入主题？

我有一个由 byte 键控的主题我想对其进行重新分区并通过消息正文中字段中的另一个键处理该主题我发现有KGroupedStream and groupby功能但它需要一个聚合函数来转换为 KTable KStream 我不需要聚合我
TopologyTestDriver 在 KTable 聚合上发送错误消息

我有一个聚合在 KTable 上的拓扑这是我创建的通用方法用于根据我拥有的不同主题构建此拓扑 public static
Spring Kafka - 为任何主题的分区消耗最后 N 条消息

我正在尝试读取请求的卡夫卡消息数对于非事务性消息我们将从 endoffset N 对于 M 个分区开始轮询并收集当前偏移量小于每个分区的结束偏移量的消息对于幂等事务消息我们必须考虑事务标记重复消息这意味着偏移量将不连续在这

随机推荐

Spark如何处理对象

为了测试 Spark 中的序列化异常我用两种方式编写了一个任务第一种方式 package examples import org apache spark SparkConf import org apache spark SparkC
通过 Service Fabric 项目进行调试时未使用环境变量

创建 ASP NET Core 应用程序时环境变量名为ASPNETCORE ENVIRONMENT Development将为您设置调试时您将看到IHostingEnvironment被设定为Development 问题是当我在为 S
R 中字符的对象大小 - R 全局字符串池如何工作？

我正在阅读 Hadley 的高级 R 编程当它讨论字符的内存大小时它是这样说的 R 有一个全局字符串池这意味着每个唯一的字符串仅存储在一个地方因此字符向量占用更少记忆力超出您的预期书上给出的例子是这样的 library pry
如果我第一次获取属性，实体框架只会将相关实体属性设置为“null”

Edit这似乎发生在any在一个方向引用另一个实体的实体属性换句话说对于下面的例子事实是Bar覆盖平等似乎是无关紧要的假设我有以下课程 public class Foo public int Id get set public vi
使用 openapi-generator 生成客户端时如何覆盖服务器 -> url (basepath)？

我有一个 OpenAPI 规范文档我不控制其中包含以下代码片段 servers url http www someservice com api 我正在使用此 OpenAPI 文档来生成我在 Angular SPA 中使用的 types
是否可以在 Sprite Kit 中使用圆形（SKShapeNode）作为遮罩？

我正在尝试在 Sprite Kit 项目中创建圆形蒙版我像这样创建圆圈将其放置在屏幕中心 SKCropNode cropNode SKCropNode alloc init SKShapeNode circleMask SKShapeN
dplyr group by，将前一组的值结转到下一组

好的这是我试图通过 dplyr 实现的目标的总体视图我使用 dplyr 进行计算以形成新列 initial capital x long shares x end value x net profit new initial capit
MySQL：@变量与变量。有什么不同？

在我发布的另一个问题中有人告诉我以下两者之间存在区别 variable and variable 在 MySQL 中他还提到 MSSQL 如何具有批处理范围 MySQL 如何具有会话范围有人可以为我详细解释一下吗 MySQL有一个概
重新定义 PHP 函数？

如果我有一个函数 function this a return a 如果我想重新定义函数是不是就重写那么简单呢 function this a b New this function return a b 不这会引发错误 Fatal e
当前本地键盘映射的 Emacs 名称？

我正在编写一个 elisp 函数它将给定的键永久绑定到当前主要模式的键盘映射中的给定命令例如 define key python mode map C f1 python describe symbol 命令和按键序列是从用户处交互收集
如何解决 Nginx“proxy_pass 502 Bad Gateway”错误

我尝试在 nginx conf 文件中添加 proxy set header 当我尝试添加 proxy pass 并调用 URL 时它会抛出 502 Bad Gateway nginx 1 11 1 错误不确定如何解决此错误 upstr
使用载波获取 gif 中的第一张图像

我使用载波上传 gif 效果很好当我尝试生成拇指版本并将 gif 转换为 jpeg 仅将 gif 中的第一个图像作为拇指时问题出现了我收到错误 LocalJumpError in ImagesController create no
Elasticsearch 中的意外（不区分大小写）字符串排序

我有一个控制台平台列表正在 Elasticsearch 中进行排序以下是名称字段的映射 name type multi field fields name type string index analyzed sort name t
如何在 HTML 页面中添加带有标题的图像？

如何添加页面的图像或徽标以及该页面的标题并在 chrome firefox 或其他浏览器中显示该标题取自什么是 Favicon ico 以及如何为您的网站创建 Favicon 图标如何创建 Favicon ico 文件 1 创建尺寸为
从通过 ssh 访问的远程计算机进行 git Push 会出现“权限被拒绝（公钥）”错误

为了解释我的情况假设我有 PC1 和 PC2 我在 PC2 中有一个 git 存储库并且设置了一个 ssh 密钥这样在执行 git Push 时就不必输入我的凭据无论如何当我从 PC2 git Push 时它工作得很好现在如
快速检查失败时的退出状态以及阴谋集团整合

我试图了解如何将一些快速检查测试与 cabal 集成这gist建议quickCheck函数在失败时返回非零状态但我没有得到这种行为所以使用 cabalexitcode stdio 1 0测试套件类型似乎不适合我除非我想打电话erro
如何在 Android TextView 上使用图像（设备存储的图像）和文本？

我正在创建聊天应用程序在其中我得到EMOJI来自服务器图像 URL 我正在使用此图像表情符号网址和我的文本TextView通过下面的代码行 String stringWithHtml Sample string with an im
Android Retrofit 2 简单 XML 转换器

我正在使用改造2 1 0和改造 SimpleXML 转换器2 1 0 我使用 addConverterFactory 方法添加了 simplexmlconverter 来改造实例 XML 如下
如何使用 Messagebox 在 Windows 7 任务计划程序中启动 VBS 脚本？

我使用的是 Win7 x64 Professional 并尝试使用 Windows 任务计划程序运行 VBS 脚本我的问题是该脚本的行为与直接启动的脚本完全不同即使我以高权限启动它并使用相同的用户我注意到的一件事是例如不可能在屏
如何将自定义 StateStore 添加到 Kafka Streams DSL 处理器？

对于我的 Kafka 流应用程序之一我需要使用 DSL 和处理器 API 的功能我的流媒体应用程序流程是 source gt selectKey gt filter gt aggregate on a window gt sink 聚合

如何将自定义 StateStore 添加到 Kafka Streams DSL 处理器？

如何将自定义 StateStore 添加到 Kafka Streams DSL 处理器？ 的相关文章

随机推荐

热门标签

如何将自定义 StateStore 添加到 Kafka Streams DSL 处理器？的相关文章