kafka中partition数量与消费者对应关系以及Java实践

2023-10-27

kafka是由Apache软件基金会开发的一个开源流处理平台。kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者在网站中的所有动作流数据。

kafka中partition类似数据库中的分表数据，可以起到水平扩展数据的目的，比如有a,b,c,d,e,f 6个数据，某个topic有两个partition，一般情况下partition-0存储a,c,e3个数据，partition-1存储b,d，f另外3个数据。

消费者组数量的不同以及partition数量的不同对应着不同的消费情况，下面分别进行梳理之：

1、单播模式，只有一个消费者组

（1）topic只有1个partition,该组内有多个消费者时，此时同一个partition内的消息只能被该组中的一个consumer消费。当消费者数量多于partition数量时，多余的消费者是处于空闲状态的,如图1所示。topic，test只有一个partition，并且只有1个group，G1,该group内有多个consumer,只能被其中一个消费者消费，其他的处于空闲状态。

图1

（2）该topic有多个partition,该组内有多个消费者，比如test 有3个partition,该组内有2个消费者，那么可能就是C0对应消费p0，p1内的数据，c1对应消费p2的数据；如果有3个消费者，就是一个消费者对应消费一个partition内的数据了。图解分别如图2，图3.这种模式在集群模式下使用是非常普遍的，比如我们可以起3个服务，对应的topic设置3个partiition，这样就可以实现并行消费，大大提高处理消息的效率。

图2 图3

2、广播模式，多个消费者组

如果想实现广播的模式就需要设置多个消费者组，这样当一个消费者组消费完这个消息后，丝毫不影响其他组内的消费者进行消费，这就是广播的概念。

（1）多个消费者组，1个partition

该topic内的数据被多个消费者组同时消费，当某个消费者组有多个消费者时也只能被一个消费者消费，如图4所示：

图4

（2）多个消费者组，多个partition

该topic内的数据可被多个消费者组多次消费，在一个消费者组内，每个消费者又可对应该topic内的一个或者多个partition并行消费，如图5所示：

图5

3、Java实践

这里使用Java服务进行实践，模拟2个parition，然后同一个组内有2个消费者的情况：

首先创建一个发送消息的controller方法：

 @ApiOperation(value = "向具有kafka-2个partition的topic发送信息")
    @RequestMapping(value = "/testSendMessage2", method = RequestMethod.POST)
    public String testSendMessage(@RequestParam("msg") String msg) {
        KafkaTemplate.send(KafkaTopicEnum.TEST_TWO_PARTITION_MSG.code,msg);
        System.out.println("发送的消息是："+msg);
        return "2个partition的topic数据！--ok";
    }

然后再创建一个监听类监听该topic，这里的监听类即为消费者。

 /**
     * @date 2020-09-24
     * 两个partition的topic，同一个组的两个消费者就可以并行的消费了，需要kafka也是集群才行，单机版并不支持
     * @param consumerRecord
     * @param acknowledgment
     */
    @KafkaListener(topics = "two-partition-msg",groupId ="serverGroup1",containerFactory = "ackContainerFactory")
    public void receiveKafkaTwoParMsg(ConsumerRecord<?,?> consumerRecord, Acknowledgment acknowledgment){
        InetAddress address = null;
        try {
            address = InetAddress.getLocalHost();
        } catch (UnknownHostException e) {
            e.printStackTrace();
        }
        System.out.println("当前的IP地址是："+address.getHostAddress());
        System.out.println("监听服务A-收到的消息是::");
        System.out.println(consumerRecord.value().toString());
        System.out.println("=================== end =================");
//        ack 提交掉，避免服务重启再次拉取到消息
        acknowledgment.acknowledge();
    }

然后我们给该服务起2个实例，即模拟该组内serverGroup1内的2个消费者，然后我们使用测试方法进行测试，向该topic内发送多个消息，观察2个实例的输出日志：

     实例1：    
     发送的消息是：111
      当前的IP地址是：10.244.3.114
      监听服务A-收到的消息是::
      "111"
      =================== end =================
      发送的消息是：222
      发送的消息是：333
      当前的IP地址是：10.244.3.114
      监听服务A-收到的消息是::
      "333"
      =================== end =================
      发送的消息是：444
      发送的消息是：555
      当前的IP地址是：10.244.3.114
      监听服务A-收到的消息是::
      "555"
      =================== end =================
      发送的消息是：666
      发送的消息是：777
      当前的IP地址是：10.244.3.114
      监听服务A-收到的消息是::
      "777"
      =================== end =================
      发送的消息是：888
      发送的消息是：999
      当前的IP地址是：10.244.3.114
      监听服务A-收到的消息是::
      "999"
	 实例2：
     当前的IP地址是：10.244.0.237
      监听服务A-收到的消息是::
      "222"
      =================== end =================
      当前的IP地址是：10.244.0.237
      监听服务A-收到的消息是::
      "444"
      =================== end =================
      当前的IP地址是：10.244.0.237
      监听服务A-收到的消息是::
      "666"
      =================== end =================
      当前的IP地址是：10.244.0.237
      监听服务A-收到的消息是::
      "888"

发现该组内的一个消费者消费到了111,333,555,777,999 ，另外一个消费者消费到了222,444,666,888，起到了均衡消费的效果。

所以在微服务的集群中，我们可以通过给topic设置多个partition，然后让每一个实例对应消费1个partition的数据，从而实现并行的处理数据，可以显著地提高处理消息的速度。

4、使用kafkaManager为topic增加partition数量

1）首先点击 Add Partitions 增加partition的数量，然后点击Generate Partition Assignments ，此时系统自动会为每个分区下的副本分配broker, 最后点击 Reassign Partitions，可以平衡集群的负载

想了解更多关于kafka、docker、k8s等云原生以及Java干货，欢迎关注下方公众号：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

kafka

kafka中partition数量与消费者对应关系以及Java实践的相关文章

如何让Spring RabbitMQ创建一个新的队列？

根据我对rabbit mq的有限经验如果您为尚不存在的队列创建新的侦听器则会自动创建该队列我正在尝试将 Spring AMQP 项目与rabbit mq 一起使用来设置侦听器但出现错误这是我的 xml 配置
如何在Java 8中实现Elvis运算符？

我有一个经典的 Elvis 运算符案例其中我调用每个可能返回 null 的方法并将它们链接在一起 thing nullableMethod1 a nullableMethod2 b nullableMethod3 在 Java 8 中
Javadoc 1.5 和 1.6 中缺少 enum.valueOf(String name)

这可能是一个愚蠢的问题但我正在使用该方法enum valueOf String name 那里没问题只是当我检查 javadoc 以了解有关此方法的更多信息时我找不到它有javadoc用于valueOf Class
@OneToMany 与 @JoinTable 错误

我试图理解 OneToMany with JoinTable 对于这样的场景我正在使用 JPA 2 1 Hibernate 5 0 4 和 Oracle 11 XE 当我打电话时userDao save user 下面的代码我有 jav
初级 Java 计数器代码

我的教授希望我这样做使用下面的 Counter 接口写入多个可互换计数器 public interface Counter Current value of this counter int value Increment this co
正确使用 JDBC 连接池 (Glassfish)

我需要在 Java Web 服务中作为会话 bean 实现数据库连接但我不确定我这样做是否正确我创建了一个类 public final class SQLUtils private static DataSource m ds null
如何将自定义日志处理程序添加到 Google App Engine？

我正在尝试向我的 java 应用程序添加自定义日志处理程序我已经实现了一个扩展 java util Logging Handler 类的 InnerLogger 类在我的logging properties中声明为处理程序 handle
BlackBerry SQLite：将一个 SQLite 数据库连接到另一个

我正在尝试使用 SQLite 将一个 SQLite 数据库附加到 BlackBerry 上的另一个数据库附加数据库 http www sqlite org lang attach html命令 Database d1 d2 Statemen
从 sbt 程序集运行 uber jar 会导致错误：无法找到或加载主类

我有一个使用 sbt 程序集插件打包为 uber jar 的 Spark 作业这build sbt指定一个可运行的 main 作为生成的 uber jar 的目标 mainClass in assembly Some com foo Ba
不要模拟值对象：过于通用的规则，没有解释

以下是 Mockito 单元测试框架的引用不要模拟值对象为什么有人会想要这样做呢因为实例化对象太痛苦了 gt 无效原因如果创造新的装置太困难那就是一个迹象代码可能需要一些认真的重构另一种方法是创建价值对象的构建者有一些工
在 eclipse 之外将 Spring MVC 应用程序部署到 tomcat 的幕后会发生什么？

我猜想使用像 eclipse 这样很棒的 IDE 的一个缺点是你会忽略应用程序幕后发生的事情我是一名 Ruby 开发人员所以不是一名 Java 老手所以我一直在用 java 编写一个项目并使用 spring 框架进行 IOC 和 M
如何从 Google Custom Search API 获取超过 100 个结果

我正在尝试使用 Google Custom Search API 在 Java 中进行研究因此我需要为每个查询提供一个大的结果集然而我似乎仅限于前 100 个结果这比我需要的要少得多我使用这样的列表方法 list setStar
抽象类或接口。哪种方式是正确的？

有两种方法可以选择抽象类或接口微软解决方案和Oracle解决方案微软设计指南请使用抽象在 Visual Basic 中为 MustInherit 类而不是接口来将协定与实现分离 http msdn microsoft com en
使用Java开发跨平台，不同平台字体缩放不同

我正在为我的大学制作一些软件需要一个 GUI 在它的第一个版本中我让它使用系统外观因此它看起来像 Linux Mac Windows 中的本机应用程序我发现这很麻烦因为我必须根据操作系统使所有 JLabel 具有不同的大小无论分
在Java中多次读取System.in会导致IOException？

我正在尝试创建一个小命令行游戏来强化我在过去几个月中在 Java 中学到的一些东西我正在尝试创建一个名为 readInput 的方法它返回一个我可以一次又一次调用的字符串第一次它工作正常但第二次它会导致 IO Exception 如
我们可以使用 for-each 循环来迭代 Iterator 类型的对象吗？ [复制]

这个问题在这里已经有答案了如果我们执行以下操作我们会收到错误 class FGH public static Iterator reverse List list Collections reverse list return list
我们可以有虚假中断吗？

我正在创建一个任务轮询器每分钟都会查找任务它看起来像这样 public class Poller private final ExecutorService e Executors newSingleThreadExecutor pub
无法映射 ftl 文件中的 jsonRequest 属性

我想在 FTL 文件中映射下面的 json 文件市场和子市场字段但是当我尝试下面的代码时它没有映射有人可以帮助我吗我从 2 天开始就无法映射它 Json请求 ProcessOrderRequest prevalidationMode
Google Place Api：来自此 Android 客户端应用程序 com.package.name 的请求被阻止

我在用PlaceAutocompleteFragment当我单击搜索字段 PlaceAutocompleteFragment 对话框消失时我收到此错误 errors domain global re ason forbidden mess
我找不到 IntelliJ 快捷方式

我使用 vim 一段时间我知道有一个 intellij vim 插件我很好奇内置的 IntelliJ 文本导航存在什么如何打开实时模板来创建模板如何查看以 tr 开头的现有模板列表如何进行全局搜索并在当前文档中进行搜索然后转到下

随机推荐

DRF---序列化组件

目录序列化器Serializer 序列化组件基本使用使用序列化类序列化多条数据使用序列化类序列化单条数据反序列化新增修改新增视图类序列化类视图类序列化类序列化类的常见字段类和常见参数常用字段类型选项参数通用
【Linux线程同步】生产者消费者模型

文章目录 1 peach 线程互斥中可能还会存在的问题 peach 2 peach 线程同步 peach 2 1 apple 同步概念与竞态条件 apple 2 2 apple 条件变量函数 apple lemon 初始化 lemon le
Qt5.15源码编译详解

1 请先参考 https blog csdn net weixin 60395515 article details 127284046 spm 1001 2014 3001 5501 2 有以下几个不同的地方需要修改 Qt5的mkspec
超详细解决困扰人的python典例：“有n个人围成一圈”式n里挑一

自学python No 2 引语题目案例实现 range 函数 append 函数 pop 函数完整代码引语记录学习路程抛砖引玉如有更好的算法或者出现错误欢迎指点题目有n个人围成一圈顺序排号从第一个人开始报数从1到
汽车之家各种车型参数爬虫

汽车之家各种车型参数爬虫结果如下本案例使用jupyter notebook 用到requests BeautifulSoup lxml urlencode pandas五个库爬取下来的数据如下图所示详细过程整个过程分成三个部分 1
ubuntu系统信息查询(主板,内存,硬盘,网卡)

1 主板型号主板支持最大内存单条内存的参数 sudo dmidecode t 2 查看主板信息 sudo dmidecode t 16 grep Maximum 查看主板支持最大内存 sudo dmidecode t memory 查看
JDBC、连接步骤(4步)、需要导入的第三方jar包、开发步骤

1 JDBC Java Database Connectivity java连接数据库的工具 1 1 什么是JDBC 他是java提供的一组API 用来提供连接数据库中需要用到的类和接口他是一组规范为不同数据库封装相同接口的一组规范让
基于 Web 的 LDAP 认证，访问资源就是这么安全

轻量级目录访问协议即 LDAP 协议是微软 Active Directory AD 和 OpenLDAP 等传统身份管理解决方案中的核心身份认证协议然而 IT 环境的不断发展暴露了传统方案的问题基于本地部署的设计逻辑无法适应新兴的云
Unity2D游戏无限刷新地图

关于Unity2D游戏如何无限刷新地图的问题首先在Unity中创建多个大小相同的物体当做刷新的地图对象然后在创建一个名称为Endless cs的脚本然后添加如下代码 public float distance void OnBecam
cmake(三十五)Cmake之include指令

一 CMakeLists txt和cmake脚本的联系和区别 cmake脚本 1 cmake文件里面通常是什么信息 information cmake文件里包含了一些公共复用的 cmake命令和一些宏函数当CMakeLis
java开发团队认知_一个优秀的研发团队应该具备什么特征

1 计划执行计划安排得当不要老加班不要老是现实和计划不匹配不要做到哪儿计划就推后到哪儿 2 研发成果成功产出几个重影响力级别的完整成块的有成就感自豪感的产品或项目 3 团队氛围这个团队每个人都相处的很融洽 4 团队协作每个
Pytorch 的 LSTM 模型的简单示例

1 代码完整的源代码 import torch from torch import nn 定义一个LSTM模型 class LSTM nn Module def init self input size hidden size num l
C. Doremy‘s IQ（二分/贪心）

题目题意给定n个任务和艾米的智商q 艾米要按顺序处理这n个任务每个任务有难度值a i 对于每个任务艾米可以选择处理也可以选择不处理如果艾米当前的智商q大于等于任务a i 则艾米可以直接处理该任务智商不受任何影响如果艾米当前的
SpringCloud——微服务

微服务技术栈在之前的开发过程中我们将所有的服务都部署在一台服务器中当我们的服务开始越来越多业务越来越复杂当一台服务器不能承担我们的业务的时候就需要将不同的业务分开部署在不同的服务器上这每一个单独分离的服务就是微服务这些搭载
数据结构常见的八大数据结构汇总为什么要学习数据结构？解读数据结构！进阶必看！

文章目录什么是数据结构概念解释为什么要学习数据结构常见的数据结构 0 数组 1 链表 2 栈 3 队列 4 树 5 散列表又叫哈希表 6 堆 7 图思维导图横向纵向什么是数据结构数据结构 Data Structure 是
使用Arduino开发ESP32：串口（Serial port） HardwareSerial库使用说明

HardwareSerial库使用使用演示上图中通过HardwareSerial库实现了对串口1的使用具体说明见下文详细说明使用HardwareSerial库需要先声明一个对象例如上文图中的HardwareSerial mySe
MySQL基本操作（三）

MySQL基本操作三看过MySQL基本操作二的应该已经体会到mysql数据库下user表的妙用了我相信你也已经做过一些尝试了比如自建用户名无需密码登录自建任意主机登录等等这样的尝试会增加你对mysql的兴趣 Ok 你第一次登
VC得到当前目录与得到应用程序目录的一个应用

得到当前目录的函数 GetCurrentDirectory 得到应用程序目录的函数是 GetModuleFileName 用法都很简单不知道就看MSDN吧我先用这2个函数分别写一个实现同一个功能的函数以下是代码片段函数名 Rea
Candy算法--理解

Canny边缘检测算子的目标是找到一个最优的边缘检测算法最优边缘检测的含义是好的检测算法能够尽可能多地标识出图像中的实际边缘好的定位标识出的边缘要与实际图像中的实际边缘尽可能接近边缘过粗难以精确定位最小响应图像中的边缘只能
kafka中partition数量与消费者对应关系以及Java实践

kafka是由Apache软件基金会开发的一个开源流处理平台 kafka是一种高吞吐量的分布式发布订阅消息系统它可以处理消费者在网站中的所有动作流数据 kafka中partition类似数据库中的分表数据可以起到水平扩展数据的目的比如

kafka中partition数量与消费者对应关系以及Java实践

kafka中partition数量与消费者对应关系以及Java实践 的相关文章

随机推荐

热门标签

kafka中partition数量与消费者对应关系以及Java实践的相关文章