如果leader没有死但是无法接收Kafka中的消息会发生什么？单点故障？

2024-03-23

我有 3 个经纪人，3 个分区。每个代理都是一个分区的领导者和所有分区的 ISR。假设我已经在端口上运行了代理19092,29092,39092分别。

19092 - partition 0
29092 - partition 1
39092 - partition 2

半经纪人测试：

我想这样命名！因为它只允许 OUTPUT 而不允许 INPUT

现在，我添加了以下 iptables 规则：

iptables -A INPUT -p tcp --dport 29092 -j DROP

并在生产者中：

bin/kafka-console-producer --broker-list 10.54.8.172:19092 --topic ftest

上述 iptables 规则会阻止 INPUT 访问，但不会限制代理通过 Zookeeper 更新其活动状态。所以zookeeper不会认为它已经死了，因此不会为分区1进行领导者选举。

但是，由于规则的原因，生产者无法连接到它，因此会抛出错误。

org.apache.kafka.common.errors.TimeoutException: Expiring 1 record(s) for ftest-1: 1778 ms has passed since batch creation plus linger time

我已手动完成此操作，但可能还有其他原因导致 INPUT 访问被阻止（某些恶意软件、DDoS 或其他任何原因）。

在 iptables 规则之前：

Metadata for ftest (from broker 1: 10.54.8.172:19092/1):

 3 brokers:

  broker 2 at 10.54.8.172:29092

  broker 1 at 10.54.8.172:19092

  broker 3 at 10.54.8.172:39092

 1 topics:

  topic "ftest" with 3 partitions:

    partition 2, leader 3, replicas: 3,1,2, isrs: 3,1,2

    partition 1, leader 2, replicas: 2,3,1, isrs: 2,3,1

    partition 0, leader 1, replicas: 1,2,3, isrs: 1,2,3

iptables 规则之后：

Metadata for ftest (from broker 1: 10.54.8.172:19092/1):

 3 brokers:

  broker 2 at 10.54.8.172:29092

  broker 1 at 10.54.8.172:19092

  broker 3 at 10.54.8.172:39092

 1 topics:

  topic "ftest" with 3 partitions:

    partition 2, leader 3, replicas: 3,1,2, isrs: 3,1,2

    partition 1, leader 2, replicas: 2,3,1, isrs: 2

    partition 0, leader 1, replicas: 1,2,3, isrs: 1,2,3

因为，只有一位领导者，而且是dead（从某种意义上说，它无法接收任何消息），不是单点故障?

我认为，理想情况下 Zookeeper 之间必须有 2 种方式的通信和卡夫卡经纪人。不是吗？卡夫卡允许吗？如果是这样，怎么办？

此外，当 29092 被阻止输入访问时，其 ISR 会缩小至 1。

可能是因为无法接收任何消息（心跳）来自其他 2 个经纪人。

如果它可以连接（输出已启用），那么它可以写入它们并且为了使复制得到确认，它需要 INPUT 访问权限。

所以 INPUT 和 OUTPUT 也应该在这里。

经纪人29092在这里就没什么用了。让系统处于不可恢复的状态！

您的问题可能最好通过了解 Kafka 如何利用 Zookeeper 原语来维护和组织集群状态来回答。

在 Kafka 中，领导选举是由充当控制器的经纪人之一精心策划的。只有一个控制器，它是使用zookeeper从代理中选举出来的。

现在，每个代理将自己注册为 Zookeeper 中的“临时节点”。因此，发起 zK 会话的代理通过使用定期心跳（zK 术语中的刻度）来维护成员资格。如果代理未能在超时间隔内勾选，zookeeper 会删除该节点和已注册以接收该事件通知的 Kafka 控制器（通过zK手表 https://zookeeper.apache.org/doc/r3.4.0/zookeeperProgrammers.html#ch_zkWatches) 收到通知。如果失败的代理是分区的领导者，这将触发新的领导者选举。控制器处理领导者选举并通知所有经纪人。

所以，是的，Kafka 和 zK 之间存在双向通信 - 但就分区领导者选举而言，这并不是每个代理和 zK 之间的直接双向通信。有一个中间人作为控制者。

在您的测试中，由于控制器永远不会收到代理 2 发生故障的通知，因此该代理仍然是分区 1 的领导者。

从现在开始，我推测

输入被阻止的代理 2 无法接收元数据更新，因此它通过将 ISR 缩小到自身来保护自己。这有可能help https://cwiki.apache.org/confluence/display/KAFKA/KIP-343%3A+Add+a+Controller+Heartbeat+Mechanism#KIP-343以及。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ApacheKafka

distributedcomputing

如果leader没有死但是无法接收Kafka中的消息会发生什么？单点故障？的相关文章

编辑 Kafka Listener Spring 应用程序以更改阶段/目标

我可以利用另一个运行 Kafka 应用程序代码库的团队来使用相同的数据将其加载到我们的新暂存表中而不是他们的他们在 Messages 文件夹中有许多不同的 kafka 侦听器适配器 java 文件每个文件消耗不同类型的数据每个
YARN UNHEALTHY 节点

在我们的 YARN 集群已满 80 的情况下我们看到一些纱线节点管理器被标记为不健康在深入研究日志后我发现这是因为数据目录的磁盘空间已满 90 出现以下错误 2015 02 21 08 33 51 590 INFO org apach
无法找到任何实现 Connector 且名称与 io.debezium.connector.mysql.MySqlConnector 匹配的类，可用的连接器有

使用 Kafka MySQL 和 Debezium 设置数据流管道我是这个版本的 Kafka 3 4 0 MySQL 8 Debezium 2 2 1 Java 11 目标我想从 MySQL 捕获所有 CDC 并将数据流式传输到 Kaf
使用 kafka java api 的 Avro 序列化器和反序列化器

Kafka Avro 序列化器和反序列化器无法工作我尝试使用 kafka 控制台消费者消费消息我可以看到发布的消息 public class AvroProducer
Spark shell (spark 3.0.0) 添加包 confluence kafka 5.5.1 javax.ws.rs-api 问题

我本地的win10 WSL回到ubuntu 在ubuntu上我安装了spark3 0 0 confluence平台5 5 1 手动下载当我尝试运行spark shell或spark submit时下面是shell示例 spark sh
为每个键使用主题中的最新值

我有一个 Kafka 生产者它正在以高速率生成消息消息键是用户名值是他在游戏中的当前分数 Kafka消费者处理消费消息的速度相对较慢在这里我的要求是显示最新的分数并避免显示陈旧的数据但代价是某些分数可能永远不会显示本质上对于
kafka消费者群体正在重新平衡

我正在使用 Kafka 9 和新的 java 消费者我正在循环内进行轮询当代码尝试执行 Consumer commitSycn 时由于组重新平衡我收到 commitfailedexcption 请注意我将 session time
有没有办法使用 .NET 中的 Kafka Ksql Push 查询

我目前正在 NET 中使用 Kafka 消费者处理大量 Kafka 消息我的处理过程的第一步是解析 JSON 并根据 JSON 中特定字段的值丢弃许多消息我不想首先处理特别是不下载那些不需要的消息看起来 kSql 查询写为推送查
Spring Kafka - 为任何主题的分区消耗最后 N 条消息

我正在尝试读取请求的卡夫卡消息数对于非事务性消息我们将从 endoffset N 对于 M 个分区开始轮询并收集当前偏移量小于每个分区的结束偏移量的消息对于幂等事务消息我们必须考虑事务标记重复消息这意味着偏移量将不连续在这
创建 Kafka 主题导致没有领导者

我正在使用 Kafka v0 9 0 1 Scala v2 11 和com 101tec zkclientv0 7 我正在尝试使用AdminUtils创建一个kafka主题我的代码如下 String zkServers node1 218
Zookeeper + Kafka - 无法创建数据目录

我在单节点中使用zookeeper 3 4 8并尝试使用kafka 当我运行这个命令时 zookeeper server start sh usr local kafka 2 9 2 0 8 2 2 config zookeeper pro
Kafka中如何同时实现分布式处理和高可用？

我有一个由 n 个分区组成的主题为了进行分布式处理我创建了两个在不同机器上运行的进程他们使用相同的 groupd id 订阅主题并分配 n 2 个线程每个线程处理单个流每个进程 n 2 个分区这样我就可以实现负载分配但现在如果
Mesos DCOS 未安装 Kafka

我正在尝试在 Mesos 上安装 Kafka 看来安装已经成功了 vagrant DevNode dcos dcos package install kafka This will install Apache Kafka DCOS Ser
Kafka JDBC Sink Connector，批量插入值

我每秒收到很多消息通过 http 协议 50000 100000 并希望将它们保存到 PostgreSql 我决定使用 Kafka JDBC Sink 来实现此目的消息以一条记录保存到数据库而不是批量保存我想在 PostgreSQL
内存缓存 VS。分布式系统中的集中式缓存

我们目前正在寻找最合适的解决方案来访问分布式系统上的关键数据并且我们正在考虑是否使用内存缓存而不是集中式缓存有关我们希望存储访问的数据的一些信息数据量非常小数据很冷这意味着它几乎不会改变并且只有当人们改变我们后台系统中的某些内
将 Kafka 输入流动态连接到多个输出流

Kafka Streams 中是否内置了允许将单个输入流动态连接到多个输出流的功能 KStream branch允许基于真假谓词进行分支但这并不是我想要的我希望每个传入的日志都确定它将在运行时流式传输到的主题例如日志 date 20
如何使用PySpark结构流+Kafka

我尝试将 Spark 结构流与 kafka 一起使用并且在使用 Spark 提交时遇到问题消费者仍然从生产中接收数据但 Spark 结构出错请帮我找到我的代码的问题这是我在 test py 中的代码 from kafka impo
获取：导入 Spark 模块时出错：没有名为“pyspark.streaming.kafka”的模块

我需要将从 pyspark 脚本创建的日志推送到 kafka 我正在做 POC 所以在 Windows 机器上使用 Kafka 二进制文件我的版本是 kafka 2 4 0 spark 3 0 和 python 3 8 1 我正在使用 p
卡夫卡监听器中的钩子

kafka 监听消息之前之后是否有任何类型的钩子可用使用案例必须设置MDC关联id才能进行日志溯源我在寻找什么之前之后回调方法以便可以在进入时设置 MDC 关联 ID 并最终在退出时清除 MDC 编辑后的场景我将关联 id
如何在kafka中定义多个序列化器？

比如说我发布和使用不同类型的 java 对象对于每个对象我必须定义自己的序列化器实现我们如何在 serializer class 属性下提供kafka消费者生产者属性文件中的所有实现我们有一个类似的设置不同主题中的不同对象但

随机推荐

如何使 Int 符合 BinaryFloatingPoint 或 Double/CGFloat 符合 BinaryInteger？

我有一个函数接受符合以下条件的值Numeric协议在某些时候我想将其转换为Int Double or CGFloat 来自 xCode 的错误 Initializer init requires that T conform to Bin
Flex JSON 无法正确序列化/反序列化 LinkedHashMap

我尝试序列化和反序列化 LinkedHashMap 数据如下所示 LinkedHashMap
强制 Java 调用我的 C++ 析构函数 (JNI)

我以为这个问题以前有人问过但我在这里找不到我使用 SWIG 围绕 C 类创建 JNI 包装器一切都很好只是 Java 似乎从不调用类的 Finalize 因此反过来我的类的析构函数永远不会被调用该类的析构函数执行一些最终文件
如何在 Windows 中重新启动 Jenkins

无法手动重新启动 Jenkins 已经尝试过以下所有方法 http localhost 8080 safeRestart错误消息 Jenkins 无法按照当前配置自行重新启动管理 Jenkins 安全重启插件错误消息 Jenkins 无
搭建角度应用程序时出现错误

我使用 yeoman 作为脚手架工具但出现以下错误有人可以帮我解决这个问题吗我使用的是windows 8环境 email protected cdn cgi l email protection node modules karma
如何在Android Studio中正确设置异常断点？

几个月来我一直在尝试让调试器打破我自己的代码但没有成功每个未捕获的异常都会在 ZygoteInit run 方法中中断这是我已采取的行动的列表 Added debug debuggable true 到我的应用程序模块的 build
如何在 Windows 桌面上运行 localhost 的移动设备上运行我的 Angular 网站 [重复]

这个问题在这里已经有答案了我从超级用户的这个问题和答案中知道在 Android 设备上无法访问桌面上本地主机上运行的网站 https superuser com questions 1193168 site running on loca
如何删除多个文件中的第一个空白行？

我有数千个第一行为空的文本文件是否可以一次性删除所有文件中的这一行你需要一个像这样的bat脚本 echo off for i in txt do more 1 fi gt gt temp del fi ren temp nxi 将上面的
使用键合并两个多维数组并添加值

我想使用键 product id 合并两个数组并添加该值用法 Array 1 Array 0 gt Array name gt Reschedule A Service usage gt 1 product id gt 8 1 gt Ar
如何使用 Jboss Tools Eclipse 插件在 Jboss 中“热”部署 war 依赖项？

我正在使用 Jboss 工具 3 0 0 alpha 在 Eclipse 3 4 上在 Jboss 4 2 3 上热部署我的战争我的战争取决于我正在从事的另一个项目装在一个罐子里但是当我在这个项目 jar项目中保存文件时 Jbo
VS2015 ASP.NET MVC 名称“模型”在当前上下文中不存在

我正在 VS2013 中开发 ASP NET MVC 4 一切都很好然后我卸载了 2013 并安装了 2015 我能够打开该项目构建它甚至运行一切正常运行调试问题是我的所有观点都被错误覆盖 the name model Scri
停止 UITableView 消耗触摸事件，以便父视图中的滑动菜单可以检测水平滑动

试图实现如此简单的事情我几乎要绝望了我有一个带有菜单的视图当通过水平滑动手势进行操作时使用 touchEvents 从左侧滑动我不使用手势识别器我只是使用touchesBegan touchesMoved等并跟踪起始触摸位置
如何在git中查找空分支和标签

我已经迁移了一个包含数百个分支和标签的大型 svn 存储库将它们拆分为多个存储库现在我想检查这些存储库中是否有任何空分支标签应在推送迁移之前将其删除有没有比必须去每个存储库并签出每个分支更快的方法来找到它就本问题而言空分支
如何在 Emacs 中创建目录？

究竟如何使用 Emacs 创建新目录我使用什么命令如果可以的话请举个例子创建目录dir to create type M x make directory RET dir to create RET 创建目录dir parent1 n
Dart C 互操作性。将整数数组传递给 C 函数

我现在正在学习 Dart 并且正在研究 Dart 与 C 的互操作性我能够使用带有两个 int 参数的 C 方法代码如下你好 dart import dart ffi as ffi typedef sum func ffi Int32
为什么“排序文件 > 文件”会产生空文件？ [复制]

这个问题在这里已经有答案了当您尝试使用以下命令对文件进行就地排序时 sort afile gt afile 你默默地结束了afile是一个空文件这是为什么我预计要么是错误要么是原始内容但已排序我没有测试过其他外壳对确实执行预期
java.lang.RuntimeException：无法实例化 org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient

我在 ubuntu 14 0 上安装了 Hadoop 2 7 1 和 apache hive 1 2 1 版本为什么会出现这个错误是否需要安装任何元存储当我们在终端上输入 hive 命令时 xml 的内部是如何调用的这些 xml 的
Process.Start(/* pdf 路径 */) 不适用于 Windows 8 上的 Adobe Reader

我可以在 C WPF 应用程序中创建 PDF 并使用以下命令运行它们 Process Start pathToPDFFile 这适用于 Adob e Acrobat 但不适用于 Adob e Reader 安装 Adob e Reader
MySQL 连接查询（可能有两个内部连接）

我目前有以下内容表镇 id name region 桌子供应商 id name town id 以下查询返回每个城镇的供应商数量 SELECT t id t name count s id as NumSupplier FROM Town
如果leader没有死但是无法接收Kafka中的消息会发生什么？单点故障？

我有 3 个经纪人 3 个分区每个代理都是一个分区的领导者和所有分区的 ISR 假设我已经在端口上运行了代理19092 29092 39092分别 19092 partition 0 29092 partition 1 39092 par

如果leader没有死但是无法接收Kafka中的消息会发生什么？单点故障？

半经纪人测试：

如果leader没有死但是无法接收Kafka中的消息会发生什么？单点故障？ 的相关文章

随机推荐

热门标签

如果leader没有死但是无法接收Kafka中的消息会发生什么？单点故障？的相关文章