Kafka 连接可以使用批量模式的自定义查询吗？

2024-02-07

我正在尝试发送 7 天前的每行记录。这是我正在研究的配置，但它即使查询在数据库服务器上生成记录也不起作用。

{
    "connector.class": "io.confluent.connect.jdbc.JdbcSourceConnector",
    "tasks.max": 1,
    "mode": "bulk",
    "connection.url": "jdbc:mysql://mysql:3300/test_db?user=root&password=password",
    "query": "SELECT * FROM test_table WHERE DATEDIFF(CURDATE(), test_table.modified) = 7;",
    "topic.prefix": "test-jdbc-",
    "poll.interval.ms": 10000
}

JDBC源连接器通过JDBC驱动程序将数据从关系数据库导入到Apache Kafka主题中。数据定期加载，或者基于时间戳增量加载，或者批量加载。最初，无论模式是增量还是批量，当您创建 JDBC 连接器时，它都会将所有数据加载到主题中，然后仅加载时间戳列上的新行或修改行。

Bulk:这种模式是未经过滤的，因此根本不是增量的。它将在每次迭代时加载表中的所有行。如果您想定期转储整个表，其中条目最终被删除并且下游系统可以安全地处理重复项，那么这可能很有用。这意味着您无法使用批量模式增量加载最近 7 天的数据

时间戳列：在此模式下，包含修改时间戳的单个列用于跟踪上次处理数据的时间，并仅查询自该时间以来已修改的行。在这里您可以加载增量数据。但是它是如何工作的，当您第一次创建时，它将加载数据库表中的所有可用数据，因为对于 JDBC 连接器来说，这些都是新数据。稍后它只会加载新的或修改的数据。

现在，根据您的要求，您似乎正在尝试以某个时间间隔加载所有数据，该时间间隔将配置为“poll.interval.ms”：10000。我看到您的 JDBC 连接设置是按照定义的，而查询可能无法正常工作，请尝试使用查询如下。似乎 JDBC 连接器将查询包装为一个表，如果您添加案例，则该表不起作用。

"query": "select * from (select * from test_table where  modified > now() - interval '7' day) o",

尝试以下设置

{
  "name": "application_name",
  "connector.class": "io.confluent.connect.jdbc.JdbcSourceConnector",
  "key.converter": "org.apache.kafka.connect.json.JsonConverter",
  "value.converter": "org.apache.kafka.connect.json.JsonConverter",
  "connection.url": "jdbc:mysql://mysql:3300/test_db",
  "connection.user": "root",
  "connection.password": "password",
  "connection.attempts": "1",
  "mode": "bulk",
  "validate.non.null": false,
  "query": "select * from (select * from test_table where  modified > now() - interval '7' day) o",
  "table.types": "TABLE",
  "topic.prefix": "test-jdbc-",
 "poll.interval.ms": 10000
  "schema.ignore": true,
  "key.converter.schemas.enable": "false",
  "value.converter.schemas.enable": "false"
  
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ApacheKafka

apachekafkaconnect

Kafka 连接可以使用批量模式的自定义查询吗？的相关文章

在spark-kafka中使用schema将ConsumerRecord值转换为Dataframe

我正在使用 Spark 2 0 2 和 Kafka 0 11 0 并且我正在尝试在火花流中使用来自卡夫卡的消息以下是代码 val topics notes val kafkaParams Map String Object bootst
Apache Kafka Streams 将 KTable 物化到主题似乎很慢

我正在使用 kafka 流并试图将 KTable 具体化为一个主题它有效但似乎每 30 秒左右完成一次 Kafka Stream 如何何时决定将 KTable 的当前状态具体化为主题有没有什么办法可以缩短这个时间让其更加实时
KafkaConsumer.commitAsync() 行为的偏移量比以前更低

kafka 将如何处理调用 KafkaConsumer commitAsync Map
kafka ProducerRecord 和 KeyedMessage 有什么区别

我正在衡量卡夫卡生产者生产者的表现目前我遇到了两个配置和用法略有不同的客户 Common def buildKafkaConfig hosts String port Int Properties val props new Proper
Kafka Streams - 如何扩展 Kafka 存储生成的变更日志主题

我有多个冗余应用程序实例它们想要使用主题的所有事件并独立存储它们以进行磁盘查找通过rocksdb 为了便于论证我们假设这些冗余消费者正在服务无状态 http 请求因此负载不是使用 kafka 共享的而是使用 kafka 将数据从
我的 Kafka 流应用程序刚刚退出，代码为 0，什么也不做

为了尝试 Kafka 流我这样做了 public static void main String args final StreamsBuilder builder new StreamsBuilder final Properties
了解Kafka流groupBy和window

我无法理解 kafka 流中的 groupBy groupById 和窗口的概念我的目标是聚合一段时间内例如 5 秒的流数据我的流数据看起来像 value 0 time 1533875665509 value 10 time 153
当我们在 Apache Spark 中使用时，无法找到 Set([TOPIC NAME,0])) 的领导者

我们使用 Apache Spark 1 5 1 和 kafka 2 10 0 8 2 1 以及 Kafka DirectStream API 通过 Spark 从 Kafka 获取数据我们使用以下设置在 Kafka 中创建了主题复制因子
当我重新运行 Flink 消费者时，Kafka 再次消费最新消息

我在用 Scala 编写的 Apache Flink API 中创建了一个 Kafka 消费者每当我从某个主题传递一些消息时它就会及时接收它们但是当我重新启动使用者时它不会接收新的或未使用的消息而是使用发送到该主题的最新消息这
有没有办法使用 .NET 中的 Kafka Ksql Push 查询

我目前正在 NET 中使用 Kafka 消费者处理大量 Kafka 消息我的处理过程的第一步是解析 JSON 并根据 JSON 中特定字段的值丢弃许多消息我不想首先处理特别是不下载那些不需要的消息看起来 kSql 查询写为推送查
未能在kafka-storm中将偏移量数据写入zookeeper

我正在设置一个风暴集群来计算实时趋势和其他统计数据但是我在将恢复功能引入到这个项目中时遇到了一些问题方法是允许上次读取的偏移量kafka spout 源代码为kafka spout来自https github com apache
Spring Kafka Acknowledgement.acknowledge 线程安全吗？

我正在实现一个基于卡夫卡的应用程序我想在其中手动确认传入消息架构迫使我在单独的线程中完成它问题是在与消费者不同的线程中执行 Acknowledgement acknowledge 是否可能且安全是的只要你使用MANUAL并不是M
Kafka中如何同时实现分布式处理和高可用？

我有一个由 n 个分区组成的主题为了进行分布式处理我创建了两个在不同机器上运行的进程他们使用相同的 groupd id 订阅主题并分配 n 2 个线程每个线程处理单个流每个进程 n 2 个分区这样我就可以实现负载分配但现在如果
Mesos DCOS 未安装 Kafka

我正在尝试在 Mesos 上安装 Kafka 看来安装已经成功了 vagrant DevNode dcos dcos package install kafka This will install Apache Kafka DCOS Ser
Kafka 0.10 Java 客户端超时异常：包含 1 条记录的批次已过期

我有一个单节点多 3 个代理 Zookeeper Kafka 设置我正在使用 Kafka 0 10 Java 客户端我编写了以下简单的远程在与 Kafka 不同的服务器上生产者在代码中我用 MYIP 替换了我的公共 IP 地址
Windows下Kafka托管在Docker中删除主题时出现异常

我在 Windows 的 Docker 中托管 Kafka 威斯迈斯特卡夫卡 https hub docker com r wurstmeister kafka 使用 docker 镜像 Kafka 数据存储在本地 Windows 文件夹
是否有任何模拟器/工具可以生成流式传输消息？

出于测试目的我需要模拟客户端每秒生成 100 000 条消息并将它们发送到 kafka 主题有没有任何工具或方法可以帮助我生成这些随机消息有一个用于生成虚拟负载的内置工具位于bin kafka producer perf test
如何在kafka中定义多个序列化器？

比如说我发布和使用不同类型的 java 对象对于每个对象我必须定义自己的序列化器实现我们如何在 serializer class 属性下提供kafka消费者生产者属性文件中的所有实现我们有一个类似的设置不同主题中的不同对象但
如何删除 Apache Kafka 中的多个主题

假设我有许多具有相同前缀的主题例如 giorgos topic1 giorgos topic2 giorgos topic3 用于删除单个主题的命令例如giorgos topic1 如下 bin kafka topics sh zook
KafkaConsumer Java API subscribe() 与 allocate()

我是 Kafka Java API 的新手我正在研究使用来自特定 Kafka 主题的记录我明白我可以使用方法subscribe 开始从主题轮询记录 Kafka还提供了方法assign 如果我想开始从主题的选定分区轮询记录我想了解这是否

随机推荐

waitForSelector 找不到相关部分

我使用以下代码与 Puppeteer 来检查相关部分是否已加载但它总是返回加载错误这可能是什么原因缺少哪一部分我不明白我正在使用下面的代码 async function getResults lnk const results co
aleagpu 引发的 TypeInitializationException

我正在尝试使用 aleagpu 但出现 System TypeInitializationException 我尝试用谷歌搜索问题所在但找不到任何解决方案所以请帮忙该程序是最简单的 class Klazz private const
如何在nx服务之前执行nx构建？

好奇执行的正确方法是什么nx build命令作为先决条件nx serve 例如在我的workspace json 的示例中 foo root apps foo sourceRoot apps foo src projectType app
Facebook iOS 应用内浏览器中的音频标签

我有一个带有音频标签的网页它在移动 Safari 中运行良好但是当我从 iOS 上的 Facebook 应用程序打开链接时它会在应用程序内浏览器中打开此处音频拒绝播放如果显示控件但没有音频它将表明它正在播放视频似乎工作正常
nodeJS v19 放弃了对 --es-module-specifier-resolution=node 的支持，这使得运行转译的 TypeScript 变得更加困难 [重复]

这个问题在这里已经有答案了 Typescript 被转换为 JavaScript 因此是一个模块routes ts被转换成routes js在目录中tsc说如果另一个模块从模块导入名称例如路由器我们会省略后缀如下所示 import
为什么“None is None is None”返回 True？ [复制]

这个问题在这里已经有答案了今天在一次采访中 CTO 问了我一个看起来很简单的问题这个语句返回什么 None is None is None 我以为Python执行了第一个操作None is None并会返回True 之后就会比较Tru
iOS 11 中的 UIRefreshControl() 故障效果

每次我拉动刷新 TableView 时 UIRefreshControl 都会出现故障下面是我正在使用的代码有任何想法吗在应用程序委托中 UINavigationBar appearance isTranslucent false U
Swift flatMap 在与可选数组一起使用时给出意外的结果

我们有一个 Person 对象数组每个对象都有另一个 String 数组这是可选的我们想要我们社会中的汽车名称的综合列表 struct Person let name String let address String let age
我可以关闭隐式 Python unicode 转换来查找混合字符串错误吗？

在分析我们的代码时我惊讶地发现数百万次调用C Python26 lib encodings utf 8 py 15 解码我开始调试发现我们的代码库中存在许多小错误通常是将字符串与 unicode 进行比较或者添加字符串和 unic
SlickGrid 2.0 无法更改奇数索引中的行背景颜色

我正在尝试使用以下代码更改背景颜色 data getItemMetadata function index if index 5 return cssClasses Unverified 只要索引是偶数它就可以完美工作但对于奇数索引它
如何强制/允许用户下载多个文件？（客户端）

输入是可变数量的 URL 远程所有链接图像资源希望允许用户允许批量下载所有这些 URL 由于我们讨论的是 1000 2000 个图像资源要求用户为每个 URL 单击另存为是不可行的我最初的尝试是将所有图像下载到一个 blob 中
删除 SwiftUI 中后退按钮的文本

简而言之我想要do this https stackoverflow com questions 33025239 remove text from back button keeping the icon 但是使用 SwiftUI Ho
增强子图和捆绑属性

我正在使用捆绑属性和 adjacency list 并且想使用子图类 struct Vertex int index int seed struct Edge bool visted double weight typedef adjace
从应用程序打开系统设置的特定部分

我的应用程序有一个快捷方式可以打开系统设置的存储部分效果很好但是如果设置应用程序已经在运行并且最后离开了显示设置则您不会被定向到存储设置但按快捷键时显示设置在尝试启动存储之前有没有办法强制打开存储设置或者关闭如果未关闭
在真实Apple Watch上调试：应用程序验证失败

今天我尝试在真正的 Apple Watch 上调试我的 WatchKit 应用程序在 Xcode 中点击调试按钮后 iPhone 主应用程序已正确安装但 Apple Watch 只显示消息安装xxx失败错误应用程序验证失败 Wa
为什么CPU负载的变化不会超过百分之几？

我正在运行这个命令 grep cpu proc stat awk usage 2 4 100 2 4 5 END print usage 但它只输出 0 99xxxx 之类的东西如果我进行 apt get 升级或任何过程我想它会超过 1
在网页中嵌入视频后如何删除 YouTube 品牌？

我在用这将删除右侧底部的 Youtube 徽标并且还删除了悬停时出现的标题栏但在这个问题中当我将鼠标悬停在视频上时然后在右侧底部 Youtube 缩略图后面文本出现当我移开鼠标时它就会消失当我使用 autohide 1
恢复在 HBase 中的工作原理

我想实际观察 HBase 中的恢复是如何工作的我使用了以下代码片段 Put p new Put Bytes toBytes name10 p setWriteAheadLog true p add Bytes toBytes cf Byt
ASP.NET Web API 2：ExceptionLogger 和异常处理程序

我正在尝试在 Web api 中实现全局异常日志记录并向用户发送一条带有该错误 ID 的友好消息这样他就可以带着错误 ID 回到我们这里以便我们可以修复它我正在实施两者 System Web Http ExceptionHandli
Kafka 连接可以使用批量模式的自定义查询吗？

我正在尝试发送 7 天前的每行记录这是我正在研究的配置但它即使查询在数据库服务器上生成记录也不起作用 connector class io confluent connect jdbc JdbcSourceConnector task

Kafka 连接可以使用批量模式的自定义查询吗？

Kafka 连接可以使用批量模式的自定义查询吗？ 的相关文章

随机推荐

热门标签

Kafka 连接可以使用批量模式的自定义查询吗？的相关文章