Kafka——集群

2023-11-18

文章目录

集群

集群

对于kafka来说，一个单独的broker意味着kafka集群中只有一个节点。要想增加kafka集群中的节点数量，只需要多启动几个broker实例即可，为了有更好的理解，现在我们在一台机器上同时启动三个broker实例。

1. 搭建个集群

建立好2个broker的配置文件：

cp config/server.properties config/server-1.properties
cp config/server.properties config/server-2.properties

针对配置文件进行修改：
server-1.properties

#broker.id属性在kafka集群中必须要是唯一
broker.id=1
#kafka部署的机器ip和提供服务的端口号
listeners=PLAINTEXT://192.168.65.60:9093   
log.dir=/usr/local/data/kafka-logs-1
#kafka连接zookeeper的地址，要把多个kafka实例组成集群，对应连接的zookeeper必须相同
zookeeper.connect=192.168.65.60:2181

config/server-2.properties:

broker.id=2
listeners=PLAINTEXT://192.168.65.60:9094
log.dir=/usr/local/data/kafka-logs-2
zookeeper.connect=192.168.65.60:2181

确定这两个实例：

bin/kafka-server-start.sh -daemon config/server-1.properties
bin/kafka-server-start.sh -daemon config/server-2.properties

现在我们创建一个新的topic，副本数设置为3，分区数设置为2：

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 3 --partitions 2 --topic my-replicated-topic

查看一下topic的情况：

bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic my-replicated-topic

在这里插入图片描述

leader节点负责给定partition 的所有读写请求，同一个topic不同分区的leader副本一般不一样（为了容灾）。比如图上一共有两个分区，分区1的leader在broker11，分区0的leader在broker0。
replicas 表示某个partition在哪几个broker上存在备份。不管这几个点是不是“leader”，甚至这个节点挂了，也会列出。
isr 是replicas的一个子集，它只列出当前还存活着的，并且已同步备份了该partition的节点。

2. 集群发送消息

现在我们向新建的 my-replicated-topic 中发生了一些message，kafka集群可以加上所有kafka节点：

./kafka-console-producer.sh --broker-list localhost:9092,localhost:9093,localhost:9094 --topic my-replicated-topic

现在我们向新建的 my-replicated-topic 中发送一些message，kafka集群可以加上所有kafka节点：

./kafka-console-consumer.sh --bootstrap-server localhost:9092,localhost:9093,localhost:9094 --from-beginning --topic my-replicated-topic

现在我们来测试我们容错性，因为broker1目前是my-replicated-topic的分区0的leader，所以我们要将其kill：

ps -ef | grep server.properties ## 找到broker进程。
kill 48028 ## 杀死掉

现在执行命令：

bin/kafka-topics.sh --describe --zookeeper localhost:9092 --topic my-replicated-topic

在这里插入图片描述
我们可以看到，分区0的leader节点已经变成了broker0.要注意的是，在isr中，已经没有1号节点，leader的选举也是从ISR（in-sync replica）中进行的。
此时，我们依然可以消费消息：

bin/kafka-console-consumer.sh --bootstrap-server localhost:9092,localhost:9093,localhost:9094 --from-beginning --topic my-replicated-topic
my test msg 1
my test msg 2

查看主题分区对应的leader信息：
在这里插入图片描述
kafka将很多集群关键信息记录在zookeeper里，保证自己的无状态，从而在水平扩容时非常方便。

3. 集群消费

log的partitions分布在kafka集群中不同的broker上，每个broker可以请求备份其他broker上partition上的数据。kafka集群支持配置一个partition备份的数量。
针对每个partition，都有一个broker起到“leader”作用，0个或多个其他的broker作为“follwers”的作用。leader处理所有的针对这个partition的读写请求，而followers被动复制leader的结果，不提供读写（主要是为了保证多副本数据与消费的一致性）。如果这个leader失效了，其中的一个follower将会自动的变成新的leader。

3.1 Procuder

生产者将消息发送到topic中去，通知负责选择message发送到topic的哪一个partition中。通过round-robin做简单的负载均衡。也可以根据消息中的某个关键字来进行区分。通常第二种方式使用的更多。

3.2 Consumer

传统的消息传递模式有2中：队列（queue）和（publish-subscribe）

queue模式：多个consumer从服务器中读取数据，消息只会到达一个consumer。
publish-subscribe模式：消息会被广播给所有的consumer。

kafka基于这2中模式提供了一种consumer的抽象概念：consumer-group

queue模式：所有的consumer都位于同一个consumer group 下
publish-subscribe模式：所有的consumer都有着自己唯一的consumer group

上图说明：由2个broker组成的kafka集群，某个主题总共有4个partition（P0-P3），分别位于不同的broker上。这个集群由2个consumer group消费，A有2个consumer instances，B有4个。
通常一个topic 会有几个consumer group。每个consumer group 都是一个逻辑上的订阅者（logical subscriber）。每个consumer group 有多个consumer instance组成，从而达到可扩展和容灾的功能。

4. 消费顺序

一个partition同一时刻在一个consumer group 中只能有一个consumer instance消费，从而保证消费顺序。
consumer group 中的consumer instance 的数量不能比一个Topic中的partition的数量多，否则，多出来的consumer消费不到消息。
Kafka只能在partition 的范围内保证消息消费的局部顺序性，不能在同一个topic中的多个partition中保证总的顺序性。
如果有在总体上保证消费顺序的需求，那么我们可以通过将topic的partition数量设置为1，将consumer group 中的consumer instance的数量也设置为1，但是这样会影响性能，所以kafka的顺序消费很少用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

kafka

Kafka——集群的相关文章

Kafka Producer 发送数据

Kafka Producer 发送数据 1 生产者概览 1 不同的应用场景对消息有不同的需求即是否允许消息丢失重复延迟以及吞吐量的要求不同场景对Kafka生产者的API使用和配置会有直接的影响 2 Kafka发送消息的主要步骤消息
librdkafka的使用和介绍

librdkafka的使用介绍 librdkafka是kafka的c语言接口下面简单的介绍一下其接口 1 rd kafka conf set设置全局配置 2 rd kafka topic conf set设置topic配置 3 rd ka
Redis Streams做股票行情MQ？

redis作为内存数据库大多时候都是作为缓存来使用但是因为有pub sub的存在所以也可以做MQ来使用做为MQ 它有两个严重的问题 1 无法持久化 2 没有ack机制 redis pub sub是一个要即时消费的MQ 如果消费晚了
kafka创建话题遇到的错误

确定Kafka安装和启动正确 ZooKeeper可以查到所有的Brokers 但执行 kafka topics sh create zookeeper localhost 2181 replication factor 3 partitio
flink连接kafka报：org.apache.kafka.common.errors.TimeoutException: Timeout expired while fetching topic

报错信息 Caused by org apache flink runtime JobException Recovery is suppressed by NoRestartBackoffTimeStrategy at org apach
Kafka3.0.0版本——消费者（消费者组案例）

目录一消费者组案例 1 1 案例需求 1 2 案例代码 1 2 1 消费者1代码 1 2 2 消费者2代码 1 2 3 消费者3代码 1 2 4 生产者代码 1 3 测试一消费者组案例 1 1 案例需求测试同一个主题的分区数据只
《消息队列高手课》缓存策略：如何使用缓存来减少磁盘IO？

现代的消息队列都使用磁盘文件来存储消息因为磁盘是一个持久化的存储即使服务器掉电也不会丢失数据绝大多数用于生产系统的服务器都会使用多块儿磁盘组成磁盘阵列这样不仅服务器掉电不会丢失数据即使其中的一块儿磁盘发生故障也可以把数据从其
kafka详解及集群环境搭建

一 kafka详解安装包下载地址 https download csdn net download weixin 45894220 87020758 1 1Kafka是什么 1 Kafka是一个开源消息系统由Scala写成是由Apac
kafka中partition数量与消费者对应关系

kafka是由Apache软件基金会开发的一个开源流处理平台 kafka是一种高吞吐量的分布式发布订阅消息系统它可以处理消费者在网站中的所有动作流数据 kafka中partition类似数据库中的分表数据可以起到水平扩展数据的目的比如
python 自建kafka消息生成和消费小工具

要将 Kafka 的消息生产和消费转换为 API 接口我们可以使用 Python 的 Web 框架其中 Flask 是一个轻量级且易于使用的选择下面是一个简单的例子使用 Flask 创建 API 来生成和消费 Kafka 消息 1
Kafka原理分析

在基础篇中我们介绍MQ的一些基础原理这篇文章我们针对kafka进行较深入的分析上篇文章中我们提到了kafka中一个名词broker 其实broker可以理解成为一台kafa服务器 kafka的特性和功能在kafka设计之初是为了实时
Kafka剖析（一）：Kafka背景及架构介绍

转载自 http www infoq com cn articles kafka analysis part 1 Kafka 是由 LinkedIn 开发的一个分布式的消息系统使用 Scala 编写它以可水平扩展和高吞吐率而被广泛使用
Flink消费kafka出现空指针异常

文章目录出现场景表现问题解决 tombstone Kafka中提供了一个墓碑消息 tombstone 的概念如果一条消息的key不为null 但是其value为null 那么此消息就是墓碑消息出现场景双流join时采用的是l
kafka消费者客户端线程安全以及多线程实现并发读取消息

kafka的生产者客户端Producer是线程安全的但是消费者客户端是非线程安全的每次操作时都会调用accqure方法用来确定当前只有一个线程操作如果有多个线程在操作会抛出CME异常针对这种情况为了能够多线程更快速的读取消息可
Kafka : KafkaProducer Closing the kafka producer with timeoutMillis

1 美图 2 背景一段kafka写入程序不晓得为啥突然发现很多奇怪的日志 kafka 多线程发送数据然后在本地是可以的在服务器上是偶现的我写了一个本地程序多线程生产数据发现是没有问题的 Test public void mult
ELK配置记录（filebeat+kafka+Logstash+Elasticsearch+Kibana）

一简介 elk日志平台日志收集分析和展示的解决方案满足用户对志的查询排序统计需求 elk架构 filebeat 采集 kafka Logstash 管道 Elasticsearch 存储搜索 Kibana 日志应用各组件功
kafka问题解决：org.apache.kafka.common.errors.TimeoutException

记录使用kafka遇到的问题 1 Caused by java nio channels UnresolvedAddressException null 2 org apache kafka common errors TimeoutExc
Kafka性能保证和延时队列实现原理

数据不丢不漏不重不错一不丢生产写入消息不丢失数据组织形式首先从数据组织形式来说 kafka有三层形式 kafka有多个主题 topic 每个主题有多个分区分区分为主分区和副本分区每个分区又有多条消息而每个分区可以分布到不
【flink番外篇】9、Flink Table API 支持的操作示例（1）-完整版

Flink 系列文章一 Flink 专栏 Flink 专栏系统介绍某一知识点并辅以具体的示例进行说明 1 Flink 部署系列本部分介绍Flink的部署配置相关基础内容 2 Flink基础系列本部分介绍Flink 的基础部分比
阿里技术官亲笔力作：Kafka限量笔记，一本书助你掌握Kafka的精髓

前言分布式堪称程序员江湖中的一把利器无论面试还是职场皆是不可或缺的技能而Kafka 这款分布式发布订阅消息队列的璀璨明珠其魅力之强大无与伦比对于Kafka的奥秘我们仍需继续探索要论对Kafka的熟悉程度恐怕阿里的大佬们

随机推荐

Object.entries()方法使用详解

一概述对象的数据处理方法我们熟知的有很多比如Object keys Object values for in等本文将其与其它常见使用方法进行对比详细解析其特性二对比 for in Object entries 方法的优势 1
Python计算过去周末的方法

在Python中我们可以使用datetime模块来计算过去的周末数量 datetime模块提供了各种日期和时间相关的函数和类使我们可以轻松地处理日期和时间首先我们需要导入datetime模块 import datetime 然后我
Vue自定义指令「干货」

在 Vue 除了核心功能默认内置的指令 v model 和 v show Vue 也允许注册自定义指令它的作用价值在于当开发人员在某些场景下需要对普通 DOM 元素进行操作 Vue 自定义指令有全局注册和局部注册两种方式先来看看注册全局
springboot修改端口号的两种方式

前言 springboot默认的端口号为8080 端口号的配置有两种方式一种是在配置文件application properties中另一种是在配置文件application yml中 1 第一种方式修改配置文件application
最短路径-Dijkstra算法与Floyd算法

最短路径 Dijkstra算法与Floyd算法原文 https www cnblogs com smile233 p 8303673 html 一最短路径在非网图中最短路径是指两顶点之间经历的边数最少的路径 AE 1 ADE 2 A
【ubuntu22.04 安装优麒麟wine封装版微信】

选择该版本原因目前使用体验来说优于deepin封装版 1 到优麒麟软件下载页面找到微信 wine 下载Wine环境包和微信 wine 包 2 终端输入 sudo apt get install f y ukylin wine 70 6
linux 环境下 openssl 生成ecdsa公、私钥

我的个人博客逐步前行STEP 1 生成ecdsa私钥 openssl ecparam name prime256v1 genkey noout out prime256v1 key pem 2 从ecdsa私钥提取公钥 openssl p
windows下anaconda3安装MySQLdb

本文转自Windows下python3 6 安装MySQLdb 首先需要下载windows版本的mysqlclient 原作者给出了其中一个版本的下载链接下载之后放到合适的文件目录中然后打开anaconda自带的Anaconda Pr
java使用switch语句完成输入1~12之间的整数，显示该月份的英语单词及这个月属第几季度。

1 程序代码如下 package java实训 import java util Scanner public class SJ4 public static void main String args Scanner input new
AI Cloud将百花齐放，青云科技已先走了一步

三年前国家超级计算济南中心济南超算悄悄干了一件大事投资数十亿元致力于打造一个融HPC超算传统云计算以CPU为主和智算以GPU为主为一体的多元算力中心这就需要一个统一的并且可以对外开放的运维和运营平台那时还在打磨阶段的青
python注释快捷键引号注释快捷键注释字体样式调整

python注释快捷键分为两种单行注释单行注释快捷键是CTRL list red green blue yellow white black print list 0 print list 1 print list 2 list red
VS E2996 错误过多，导致IntelliSense引擎无法正常工作。其中一些错误可能在编辑器中不可见。代码没有提示

一错误的问题描述二这个问题导致的后果后面程序中用到的很多都会显示找不到定义三说实话这个问题真的很坑由于我更换了我程序的工作电脑我在VS中属性管理器中重新配置了头文件和对应的库目录但是这里我犯了一个小错误就是我更换的时候
QT开发技巧之QTableWidget设置表头颜色字体

1 默认的表头和内容背景字体一样不好区别可以通过qss设置修改表头样式 2 修改后效果如下 qss代码表格头背景色 QHeaderView section background rgb 128 255 255 font family 宋
vue引入阿里图标 Module parse failed: Unexpected character '�' (1:0)

操作根据文章 https blog csdn net qq 32113629 article details 79740949 在自己跟着试了一下后报错 Module parse failed Unexpected character 1
c++享元模式

享元模式 1 享元模式简介享元模式在设计模式可复用面向对象软件的基础一书中是这样说的运用共享技术有效地支持大量细粒度的对象本质就是对大量细粒度的对象进行共享不是每个对象都要通过new的方式去创建而是通过区分对象的内部状态和外
波形图、频谱图和语谱图

波形图反映各质点在同一时刻不同位移的曲线叫做波的图像也叫做波形图波形图用于显示测量值为均匀采集的一条或多条曲线波形图仅绘制单值函数即在y f x 中各点沿x轴均匀分布例如一个随时间变化的波形波形图可显示包含任意个数据点的曲
消息通知之系统层事件发布相关流程

前言 Openharmony 3 1Release中存在消息通知的处理消息通知包括系统层事件发布消息订阅消息投递与处理为了开发者能够熟悉消息的处理流程本篇文章主要介绍系统层事件发布的相关流程整体流程代码流程发布消息 even
c++ queue用法入门必看超详细

1 queue的作用说到queue 大家一定会想到stack 同样是简单易用的数据结构之一 queue就是队列的意思像大家日常排队一样先排的人先用 stack则是相反的后来的先用这就有了queue先进先出 stack后进先出的说法
解决表情包乱码

问题描述在 Web 应用或移动App中我们经常需要显示表情符号但表情符号包含许多非ASCII字符不能直接在文本中传输所以通常会转换为HTML实体编码进行传输和存储如常见的微笑表情会编码为但是后续读取网络返回的文本内容时如果
Kafka——集群

文章目录集群 1 搭建个集群 2 集群发送消息 3 集群消费 3 1 Procuder 3 2 Consumer 4 消费顺序集群对于kafka来说一个单独的broker意味着kafka集群中只有一个节点要想增加kafka集群中的