kafka学习（1）

2023-05-16

kafka是什么？

为什么要用kafka

kafka的特点

kafka结构

Kafka Producer的Ack机制

kafka是什么？

收集nginx日志，将nginx日志的关键字段进行分析，将日志分析清洗后的数据再存入mysql数据库

典型的生产者消费者模型

为什么要用kafka

统一收集日志到kafka可以快速定位故障；方便部署边缘程序，后续需要日

kafka的特点

业务解耦，减少业务的耦合性，尽量模块化业务，更加灵活

流量削峰，把kafka当作缓冲区，缓解数据库流量

消息中间体，两种通讯模式：点对点通讯，发布订阅

kafka结构

broker：

kafka的节点

topic：

主题，消息的分类比如nginx和mysql日志给不同的主题，就是不同的类型

parition：

分区，提高吞吐量，提高并发，多个partition

会造成顺讯混乱，如果对消息顺讯有要求，就只要设计一个partition就可以了

replice：

备份，备份partition，但是不能备份到同一个broker中，交错分布

实现kafka里面的高可用

leader和follower：

有备份实现里partitoin的高可用，但是多个partiyoin之间如何工作呢？

选一个作为leader（主）其他作为follower

如何保障leader和follower的数据一致性呢？

ISR

用ISR集合列表：比如说有五个副本，选一个作为leader其他为follower，一个follower挂掉了，就从列表中删除这个follower，其他继续同步，如果leader挂了，就选一个follower当leader继续进行同步

Kafka Producer的Ack机制

Kafka的Ack机制指producer的消息发送确认机制，其影响kafka集群的吞吐量和消息可靠性。

Ack=0，相当于异步发送，意味着producer不等待broker同步完成，消息发送完毕继续发送下一批信息。提供了最低延迟，但持久性最弱，当服务器发生故障时很可能发生数据丢失。如果leader死亡，producer继续发送消息，broker接收不到数据就会造成数据丢失。

Ack=1，producer要等待leader成功收到消息并确认，才发送下一条message。提供较低的延迟性以及较好的持久性。但是如果partition下的leader死亡，而follower尚未复制数据，数据就会丢失。

Ack=-1，leader收到所有消息，且follower同步完数据，才发送下一条数据。延迟性最差，持久性最好（即可靠性最好）。

三种参数设置性能递减，可靠性递增。

同时，Ack默认值为1，此时吞吐量与可靠性折中。实际生产中可以根据实际需求进行调整。

zookeeper:

旧版本的kafka需要配置zookeeper，现在最新版本的kafka已经脱离zookeeper。

是一个分布式的，开放源码的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组服务等。

ZooKeeper的目标就是封装好复杂易出错的关键服务，将简单易用的接口和性能高效、功能稳定的系统提供给用户。

图有点乱^^

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

kafka

kafka学习（1）的相关文章

Zookeeper的常见面试题

1 Zookeeper 1 1 Zookeeper基本概念 Zookeeper作为一个优秀高效且可靠的分布式协调框架 ZooKeeper 在解决分布式数据一致性问题时并没有直接使用Paxos算法而是专门定制了一致性协议叫做 ZAB Zoo
kafka创建话题遇到的错误

确定Kafka安装和启动正确 ZooKeeper可以查到所有的Brokers 但执行 kafka topics sh create zookeeper localhost 2181 replication factor 3 partitio
kafka处理快速的原因

生产者分析生产者 producer 是负责向Kafka提交数据的我们先分析这一部分 Kafka会把收到的消息都写入到硬盘中它绝对不会丢失数据为了优化写入速度Kafka采用了两个技术顺序写入和 MMFile 顺序写入因为硬盘是机
Kafka3.0.0版本——消费者（消费者组案例）

目录一消费者组案例 1 1 案例需求 1 2 案例代码 1 2 1 消费者1代码 1 2 2 消费者2代码 1 2 3 消费者3代码 1 2 4 生产者代码 1 3 测试一消费者组案例 1 1 案例需求测试同一个主题的分区数据只
springboot本机启动elasticjob抛出异常HostException(ip is null)

1 使用的elasticjob版本为3 0 1 2 本机的IPV4在校验isReachable 返回false 可能是使用无线网导致ip验证问题 3 最后引入Groovy解决引入包
Kafka：主题创建、分区修改查看、生产者、消费者

文章目录 Kafka后台操作 1 主题 2 分区 3 生产者 4 消费者组 Kafka后台操作 1 主题 1 创建主题 bin kafka topics sh create bootstrap server hadoop102 9092 r
Linux 下搭建 Kafka 环境

安装步骤准备软件目录 mkdir datalake 上传之前下载好的安装包到 datalake 目录下 jdk 8u181 linux x64 gz kafka 2 11 2 1 0 tgz zookeeper 3 4 5 tar gz
Kafka剖析（一）：Kafka背景及架构介绍

转载自 http www infoq com cn articles kafka analysis part 1 Kafka 是由 LinkedIn 开发的一个分布式的消息系统使用 Scala 编写它以可水平扩展和高吞吐率而被广泛使用
kafka学习笔记（一）简介

这是对我找到的学习资料的整理非手打参考 https kafka apachecn org intro html https blog csdn net weixin 39468305 article details 106346280
Kafka 顺序消费方案

Kafka 顺序消费方案前言 1 问题引入 2 解决思路 3 实现方案前言本文针对解决Kafka不同Topic之间存在一定的数据关联时的顺序消费问题如存在Topic insert和Topic update分别是对数据的插入和更新当
win10系统下安装Kafka 的详细步骤

Win10 系统下要使用Kafka需要经过以下三个步骤 1 安装JDK 需要安装依赖java JDK 2 安装zookeeper 资源协调分配管理 3 安装Kafka 一安装 Java SE Development Kit 13 0 1
附录：kafka源码启动

本文以源码2 8为例准备如下 idea 2019 1 4 jdk 1 8 scala 2 12 8 gradle 6 8 1 zookeeper 3 4 10 kafka2 8源码注意以下安装都需要装在没有空格的路径上比如D Pro
explain查看sql语句执行计划

explain sql 执行结果字段描述 id select唯一标识 select type select类型 table 表名称 type 连接类型 possible keys 可能的索引选择 key 实际用到的索引 key len 实际
[分布式] zookeeper集群与kafka集群

目录一 Zookeeper 概述 1 1 Zookeeper定义 1 2 Zookeeper 工作机制 1 3 Zookeeper 特点 1 4 Zookeeper 数据结构 1 5 Zookeeper 应用场景 1 6 Zookeepe
公司实战 ElasticSearch+Kafka+Redis+MySQL

一需求前一段时间公司要进行数据转移将我们ES数据库中的数据转移到客户的服务器上并且使用定时将新增的数据同步在这过程中学到了很多在此记录一下二技术栈 Mysql Redis ElasticSearch Kafka 三方案为
【Docker安装部署Kafka+Zookeeper详细教程】

Docker安装部署Kafka Zookeeper Docker拉取镜像 Docker拉取zookeeper的镜像 docker pull zookeeper Docker拉取kafka的镜像 docker pull wurstmeiste
MQ - KAFKA 基础篇

1 KAFKA的核心组件 API Producer API 它允许应用程序向一个或多个 topics 上发送消息记录 Consumer API 允许应用程序订阅一个或多个 topics 并处理为其生成的记录流 Streams API 它允许
Kafka基础—3、Kafka 消费者API

一 Kafka消费者API 1 消息消费当我们谈论 Kafka 消费者 API 中的消息消费时我们指的是消费者如何从 Kafka 主题中拉取消息并对这些消息进行处理的过程消费者是 Kafka 中的消息接收端它从指定的主题中获取消息
从 MySQL 到 DolphinDB，Debezium + Kafka 数据同步实战

Debezium 是一个开源的分布式平台用于实时捕获和发布数据库更改事件它可以将关系型数据库如 MySQL PostgreSQL Oracle 等的变更事件转化为可观察的流数据以供其他应用程序实时消费和处理本文中我们将采用 De
Kafka速度之谜：高性能的幕后秘密大揭秘

提示文章写完后目录可以自动生成如何生成可参考右边的帮助文档文章目录前言一 kafka高性能的原因 Page Cache ZeroCopy 零拷贝前言 Kafka的介绍 kafka是linkedIn开源的分布式消息系统归给Ap

随机推荐

QML地图绘制虚线

QML提供了MapPolyline用于在地图上绘制线段 xff0c 该线段是实线 xff0c 因此我使用Canvas自定义绘制的方式在地图上绘制线段 xff0c 如图 xff1a 鼠标在地图上点击后 xff0c 在点击位置添加图标 xff0
QML无边框最大化窗口时遮住了任务栏，程序默认置顶的问题

在QML窗口使用无边框 xff0c 并且默认程序最大化显示后 xff0c 此时程序显示默认自动变成了全屏显示 xff0c 程序自动遮挡住了系统任务栏当使用多屏幕显示时 xff0c 切换不同程序 xff0c 该QML程序的界面显示错误使用
用VScode写C/C++，从下载安装到配置使用

介绍编程的过程大致分为编写代码代码编译代码执行三步 xff0c vscode可以完成代码编写 xff0c 但是不能进行编译也就是将代码翻译为计算机可以听懂的话 xff0c MinGW可以完成这个任务 xff0c 二者配合可以实现在v
深度学习训练降低显存指南

一小模块API参数inplace设置为True xff08 省一点点 xff09 比如 xff1a Relu 有一个默认参数inplace xff0c 默认设置为False xff0c 当设置为True时 xff0c 计算时的得到的新值不
C++工程师学习内容

C 43 43 是最贴近底层编程语言在性能方面上 xff0c 有着无可替代的优势特别是对于很多游戏开发公司来说 xff0c C 43 43 尤其适合作为后端服务的开发语言在一些对于并发性能要求较高的业务上 xff0c C 43 43 也
Ubuntu 更新apt出错

输入sudo apt get update后出现 Err 1 http us archive ubuntu com ubuntu xenial InRelease Temporary failure resolving 39 us arch
使用OpenWrt开发嵌入式Linux（二）：先让系统跑起来(使用initramfs)

安装相关工具推荐使用ubuntu 16及以上版本 sudo apt install gcc binutils bzip2 flex python perl make diffutils unzip gawk subversion zlib
使用kubeadm从0到1搭建kubernete集群

目录概述安装前提示安装docker 安装kubeadm 安装kubernete集群master节点安装 kubeadm kubectl kubelet组件安装kubernete master节点安装CNI网络插件部署集群wor
shell基础之变量（2）：变量有哪些种类、怎么定义/赋值/取值、不同种类变量的作用域

通过本文能对shell变量有一个系统性的了解 xff0c 具体的包括 xff1a 变量的种类 xff1a 局部全局环境变量变量的定义和操作 xff1a 赋值取值取消变量变量的作用域文章目录一变量的种类1 全局变量2 局部变量
java 泛型全解 - 绝对最详细

背景对于java的泛型我一直属于一知半解的 xff0c 平常真心用的不多直到阅读 Effect Java 看到很多平常不了解的用法 xff0c 才下定决心 xff0c 需要系统的学习 xff0c 并且记录下来 1 泛型的概述 xff1a
Zookeeper数据同步流程

在服务器启动阶段 xff0c 会进行磁盘数据的恢复 xff0c 完成数据恢复后就会进行Leader选举一旦选举产生Leader服务器后 xff0c 就立即开始进行集群间的数据同步 xff0c 在整个过程中 xff0c Zookeeper都
JS中Ajax的方法和应用

XMLHttpRequest对象 Ajax技术的核心是XMLHttpRequest对象 xff08 简称XHR xff09 这是有微软率先引入的一个特性 xff0c 其他浏览器提供商后来都提供了相同的实现但因为IE的兼容性问题 xff0c
node.js安装及环境配置

一下载nodejs的安装包 xff1a 下载地址 xff1a https nodejs org zh cn download 根据自己电脑系统及位数选择 xff0c 一般都选择windows64位 msi格式安装包网站上提供的安装包版本
6个常用的React组件库

Ant Design 项目链接 xff1a Ant Design 包大小 xff08 来自 BundlePhobia xff09 xff1a 缩小后 1 2mB xff0c 缩小 43 gzip 压缩后 349 2kB xff0c 通过摇树
大数据培训课程数据清洗案例实操-简单解析版

数据清洗 xff08 ETL xff09 在运行核心业务MapReduce程序之前 xff0c 往往要先对数据进行清洗 xff0c 清理掉不符合用户要求的数据清理的过程往往只需要运行Mapper程序 xff0c 不需要运行Reduce程序
宋红康2023版Java视频发布

1500万 43 播放量见证经典 xff0c 尚硅谷宋红康老师的Java入门视频堪称神作 xff0c 如今经典再次超级进化 xff0c 新版Java视频教程震撼来袭 xff01 开发环境全新升级 xff1a JDK17 43 IDEA202
Java消息队列：消息在什么时候会变成Dead Letter？

在较为重要的业务队列中 xff0c 确保未被正确消费的消息不被丢弃 xff0c 通过配置死信队列 xff0c 可以让未正确处理的消息暂存到另一个队列中 xff0c 待后续排查清楚问题后 xff0c 编写相应的处理代码来处理死信消息一什么
Vue2和Vue3数据双向绑定原理的区别及优缺点（下篇）

上篇我们讲到了Vue2的数据双向绑定原理 xff0c 如果你没有阅读上篇 xff0c 建议先阅读一下上篇中的内容 Vue2和Vue3数据双向绑定原理的区别及优缺点 xff08 上篇 xff09 在上篇中我们抛出了一个问题 xff1a 是不是
FlinkTable时间属性

像窗口 xff08 在 Table API 和 SQL xff09 这种基于时间的操作 xff0c 需要有时间信息因此 xff0c Table API 中的表就需要提供逻辑时间属性来表示时间 xff0c 以及支持时间相关的操作一处理时
kafka学习（1）

目录 kafka是什么 xff1f 为什么要用kafka kafka的特点 kafka结构 Kafka Producer的Ack机制 kafka是什么 xff1f 收集nginx日志 xff0c 将nginx日志的关键字段进行分析 xff0

kafka学习（1）

kafka是什么？

为什么要用kafka

kafka的特点

kafka结构

Kafka Producer的Ack机制

zookeeper:

kafka学习（1） 的相关文章

随机推荐

热门标签

kafka学习（1）的相关文章