IM群聊消息如此复杂,如何保证不丢不重?

2023-10-27

1、前言


群聊已经成为主流IM软件的基本功能,不管是QQ群、还是微信群,一个群友在群内发了一条消息,那么对于IM服务器来说需要保证:

  • 在线的群友能第一时间收到消息;
  • 离线的群友能在登陆后收到消息。

由于“消息风暴扩散系数”的存在( 概念详见《 IM单聊和群聊中的在线状态同步应该用“推”还是“拉”? ),群消息的复杂度要远高于一对一的单聊消息。群消息的实时性、可达性、离线消息是今天将要讨论的核心话题。

2、IM开发干货系列文章


本文是系列文章中的第5篇,总目录如下:


另外,如果您是IM开发初学者,强烈建议首先阅读《 新手入门一篇就够:从零开发移动端IM 》。

3、常见的群消息流程


开始讲群消息投递流程之前,先介绍两个群业务的核心数据结构:
1
2
3
4
群成员表:用来描述一个群里有多少成员
t_group_users(group_id, user_id)
群离线消息表:用来描述一个群成员的离线消息
t_offine_msgs(user_id, group_id, sender_id, time , msg_id, msg_detail)

业务场景举例:

  • 1)一个群中有x,A,B,C,D共5个成员,成员x发了一个消息;
  • 2)成员A与B在线,期望实时收到消息;
  • 3)成员C与D离线,期望未来拉取到离线消息。

系统架构简介:

  • 1)客户端:x,A,B,C,D共5个客户端用户;
  • 2)服务端:
      2.1)所有模块与服务抽象为server;
      2.2)所有用户在线状态抽象存储在高可用cache里;
      2.3)所有数据信息,例如群成员、群离线消息抽象存储在db里。


IM群聊消息如此复杂,如何保证不丢不重?_1.jpg 

典型群消息投递流程,如上图步骤1-4所述:

  • 步骤1:群消息发送者x向server发出群消息;
  • 步骤2:server去db中查询群中有多少用户(x,A,B,C,D);
  • 步骤3:server去cache中查询这些用户的在线状态;
  • 步骤4:对于群中在线的用户A与B,群消息server进行实时推送;
  • 步骤5:对于群中离线的用户C与D,群消息server进行离线存储。

IM群聊消息如此复杂,如何保证不丢不重?_2.jpg 

典型的群离线消息拉取流程,如上图步骤1-3所述:

  • 步骤1:离线消息拉取者C向server拉取群离线消息;
  • 步骤2:server从db中拉取离线消息并返回群用户C;
  • 步骤3:server从db中删除群用户C的群离线消息。

存在的问题:
上述流程是最容易想,也最容易理解的,存在的问题也最显而易见:对于同一份群消息的内容,多个离线用户存储了很多份。假设群中有200个用户离线,离线消息则冗余了200份,这极大的增加了数据库的存储压力。

4、群消息优化1:减少存储量


为了减少离线消息的冗余度,增加一个群消息表,用来存储所有群消息的内容,离线消息表只存储用户的群离线消息msg_id,就能大大的降低数据库的冗余存储量,思路如下。
1
2
3
4
群消息表:用来存储一个群中所有的消息内容
t_group_msgs(group_id, sender_id, time ,msg_id, msg_detail)
群离线消息表:优化后只存储msg_id
t_offine_msgs(user_id, group_id, msg_id)

IM群聊消息如此复杂,如何保证不丢不重?_3.jpg 

这样优化后,群在线消息发送就做了一些修改:

  • 步骤3:每次发送在线群消息之前,要先存储群消息的内容;
  • 步骤6:每次存储离线消息时,只存储msg_id,而不用为每个用户存储msg_detail。

IM群聊消息如此复杂,如何保证不丢不重?_4.jpg 

拉取离线消息时也做了响应的修改:

  • 步骤1:先拉取所有的离线消息msg_id;
  • 步骤3:再根据msg_id拉取msg_detail;
  • 步骤5:删除离线msg_id。

存在的问题(如同单对单消息的发送一样):
  • 1)在线消息的投递可能出现消息丢失,例如服务器重启,路由器丢包,客户端crash;
  • 2)离线消息的拉取也可能出现消息丢失,原因同上。

需要和单对单消息的可靠投递一样,加入应用层的ACK,才能保证群消息一定到达。

5、群消息优化2:应用层ACK


IM群聊消息如此复杂,如何保证不丢不重?_5.jpg 

应用层ACK优化后,群在线消息发送又发生了一些变化:

  • 步骤3:在消息msg_detail存储到群消息表后,不管用户是否在线,都先将msg_id存储到离线消息表里;
  • 步骤6:在线的用户A和B收到群消息后,需要增加一个应用层ACK,来标识消息到达;
  • 步骤7:在线的用户A和B在应用层ACK后,将他们的离线消息msg_id删除掉。

IM群聊消息如此复杂,如何保证不丢不重?_6.jpg 

对应到群离线消息的拉取也一样:

  • 步骤1:先拉取msg_id;
  • 步骤3:再拉取msg_detail;
  • 步骤5:最后应用层ACK;
  • 步骤6:server收到应用层ACK才能删除离线消息表里的msg_id。

存在的问题:

  • 1)如果拉取了消息,却没来得及应用层ACK,会收到重复的消息么?
      答案是肯定的,不过可以在客户端去重,对于重复的msg_id,对用户不展现,从而不影响用户体验
  • 2)对于离线的每一条消息,虽然只存储了msg_id,但是每个用户的每一条离线消息都将在数据库中保存一条记录,有没有办法减少离线消息的记录数呢?

6、群消息优化3:离线消息表


其实,对于一个群用户,在ta登出后的离线期间内,肯定是所有的群消息都没有收到的,完全不用对所有的每一条离线消息存储一个离线msg_id,而只需要存储最近一条拉取到的离线消息的time(或者msg_id),下次登录时拉取在那之后的所有群消息即可,而完全没有必要存储每个人未拉取到的离线消息msg_id。
1
2
3
4
5
群成员表:用来描述一个群里有多少成员,以及每个成员最后一条ack的群消息的msg_id(或者 time
t_group_users(group_id, user_id, last_ack_msg_id(last_ack_msg_time))
群消息表:用来存储一个群中所有的消息内容,不变
t_group_msgs(group_id, sender_id, time ,msg_id, msg_detail)
群离线消息表:不再需要了

IM群聊消息如此复杂,如何保证不丢不重?_7.jpg 

离线消息表优化后,群在线消息的投递流程:

  • 步骤3:在消息msg_detail存储到群消息表后,不再需要操作离线消息表(优化前需要将msg_id插入离线消息表);
  • 步骤7:在线的用户A和B在应用层ACK后,将last_ack_msg_id更新即可(优化前需要将msg_id从离线消息表删除)。

IM群聊消息如此复杂,如何保证不丢不重?_8.jpg 

群离线消息的拉取流程也类似:

  • 步骤1:拉取离线消息;
  • 步骤3:ACK离线消息;
  • 步骤4:更新last_ack_msg_id。

存在的问题:
由于“消息风暴扩散系数”的存在,假设1个群有500个用户,“每条”群消息都会变为500个应用层ACK,将对服务器造成巨大的冲击,有没有办法减少ACK请求量呢?

7、群消息优化4:批量ACK


由于“消息风暴扩散系数”的存在,如果每条群消息都ACK,会给服务器造成巨大的冲击,为了减少ACK请求量,很容易想到的方法是批量ACK。

批量ACK的方式又有两种:

  • 1)每收到N条群消息ACK一次,这样请求量就降低为原来的1/N了;
  • 2)每隔时间间隔T进行一次群消息ACK,也能达到类似的效果。

新的问题: 批量ACK有可能导致:还没有来得及ACK群消息,用户就退出了,这样下次登录会拉取到重复的离线消息。
解决方案: msg_id去重,不对用户展现,保证良好的用户体验。

还可能存在的问题: 群离线消息过多:拉取过慢。
解决方案: 分页拉取(按需拉取),分页拉取的细节在《 IM消息送达保证机制实现(下篇):保证离线消息的可靠投递 》一章中有详细叙述,此处不再展开。

8、本文小结


群消息还是非常有意思的,可达性、实时性、离线消息、消息风暴扩散等等等等,做个总结:

  • 1)不管是群在线消息,还是群离线消息,应用层的ACK是可达性的保障;
  • 2)群消息只存一份,不用为每个用户存储离线群msg_id,只需存储一个最近ack的群消息id/time;
  • 3)为了减少消息风暴,可以批量ACK;
  • 4)如果收到重复消息,需要msg_id去重,让用户无感知;
  • 5)离线消息过多,可以分页拉取(按需拉取)优化。


http://www.52im.net/thread-753-1-1.html


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

IM群聊消息如此复杂,如何保证不丢不重? 的相关文章

  • 【id:120】【25分】B. 虚拟电话(构造与析构)

    时间限制 1s 内存限制 128MB 题目描述 虚拟电话包含属性 电话号 状态 机主姓名 1 电话号是一个类 它包含号码和类型 其中号码是整数类型 类型用单个字母表示用户类别 A表示政府 B表示企业 C表示个人 类操作包括构造 属性的获取和

随机推荐

  • 【WiFi】WIFI芯片的研发

    目录 1 硬件设计 2 软件开发 3 集成和测试 4 认证和合规性 5 量产和供应链管理 6 总结说明 1 硬件设计 首先 您需要进行WiFi芯片的硬件设计 这包括选择适当的射频 RF 芯片 基带处理器 调制解调器等组件 并进行电路设计和布
  • Unity C# The type or namespace name could not be found 解决办法

    在使用Unity写脚本的时候有可能需要用到外部的库 这个时候如果直接用VS里的NuGet安装包 安装完之后可以运行 但是重启Unity之后就会出现 CS0246 C The type or namespace name could not
  • Numpy-基础数据结构

    Numpy是python中一个运行速度非常快的的数学库 主要用于数组计算 包含 一个强大的N维数组对象 ndarray 广播功能函数 线性代数 傅里叶变换 随机数生成等功能 接下来 我会系列介绍Numpy的知识点 包含其基础数据结构 通用函
  • 【OpenGL学习】光源

    光源 本节中 LearnOpenGL 教程中的标题为投光物 表示将光线投射到物体的光源 事实上这些投光物都可以称之为光源 包括平行光 点光源 聚光灯等 不同类型的光源可以给场景带来不同的光照效果 本节主要学习定向光 Directional
  • Tinymce富文本编辑器在vue项目中的使用;引入第三方插件和上传视频、图片等

    先放张效果图 第一步 安装依赖 npm install tinymce 5 0 12 第二步 在项目中的public文件夹中新建tinymce文件夹 因为我的项目是脚手架创建的 所以公共文件夹是public 在node modules中找到
  • chrome 安装axure 插件

    一般使用chrome查看axure原型文件时 会提示安装插件 但是又连不上google扩展安装 这里提供一个简便的方式安装 1 静态原型页面路径resources chrome axure chrome extension crx 找到文件
  • RTThread中HardFault_Handler分析

    以Cortex M3为例 RTThread在运行过程如果产生fault 会进人HardFault Handler中断 RTThread对HardFault Handler进行了重定义 HardFault Handler函数在context
  • vue2+three.js实现宇宙(进阶版)

    2023 9 12今天我学习了vue2 three js实现一个好看的动态效果 首先是安装 npm install three 相关代码如下
  • SSL是什么?SSL怎么用?

    SSL是什么 SSL Secure Sockets Layer 安全套接层 及其继任者传输层安全 Transport Layer Security TLS 是为网络通信提供安全及数据完整性的一种安全协议 如今被广泛使用 如网页 电子邮件 互
  • STM32F103基于HAL工程TIM4多通道PWM固定占空比输出

    STM32F103基于HAL工程TIM4多通道PWM固定占空比输出 在测试过程中发现配置的2路PWM总是只有一个固定的通道有输出 于是复用到其他引脚 输出波形有 确定是芯片引脚的问题 后面换了一块板测试 确定是芯片引脚确实有问题 刚开始一直
  • 史上最全Elasticsearch学习

    文章目录 Elasticsearch 一 Elasticsearch简介 安装 1 1 Elasticsearch是什么 1 2 全文搜索引擎 1 3 Elasticsearch的应用案例 1 4 Elasticsearch的下载 安装 运
  • python异常处理

    Python3 错误和异常 作为 Python 初学者 在刚学习 Python 编程时 经常会看到一些报错信息 在前面我们没有提及 这章节我们会专门介绍 Python 有两种错误很容易辨认 语法错误和异常 Python assert 断言
  • 【计算机科学与技术】信息论笔记(6):微分熵

    200803本篇是学习信息论的入门笔记 希望能与各位分享进步 这是第六章 微分熵 文章目录 6 微分熵 6 1 定义 6 2 连续随机变量的AEP 6 3 微分熵与离散的关系 6 4 联合微分熵与条件微分熵 6 5 相对熵与互信息 6 6
  • ubuntu 12.04安装jdk

    分类 LINUX 在安装之前 系统没有任何jdk软件 也就是说在终端执行 java version 将会输出如下内容 root haiyang Aspire java version 程序 java 已包含在下列软件包中 default j
  • 解决linux下图形界面卡死不能操作的问题

    由于linux系统bug很多 所以有时候用着用这就会发生图形界面卡死不能操作的情况 具体解决方法如下 1 按住ctrl alt f2 然后进入了一个黑色的shell界面 注 linux下共有六个虚拟控台 f2 f6 分别对应这不同的权限 2
  • 小程序仿微信支付键盘实现

    先上图 2 实现过程 键盘放在了vant weapp组件的弹窗框popup中 并且默认进入页面自动弹出键盘 index wxml
  • java -- Math、BigInteger、BigDecimal类和基本类型的包装类、正则表达式

    Math java lang Math 类包含用于执行基本数学运算的方法 如初等指数 对数 平方根和三角函数 类似这样的工具类 其所有方法均为静态方法 并且不会创建对象 调用起来非常简单 Math PI 静态常量 public static
  • AD器件飞出可视区域如何推拽回来

    步骤1 选择器件 步骤2 摆放器件 先说摆放器件 如下图 三个器件 加入我们需要摆放右侧的两个器件到指定区域 先选择要摆放的器件 操作如下 绘制需要摆放的区域 器件已经被移动过来了 完成 上述方法可以对大量器件进行整体移动 利用上述方法可以
  • 基于改进YOLO的玉米病害识别系统(部署教程&源码)

    1 研究背景与意义 近年来 农业科技的快速发展为农作物的种植和管理带来了许多便利 然而 农作物病害的防治仍然是一个全球性的挑战 玉米作为世界上最重要的粮食作物之一 受到了许多病害的威胁 如玉米灰斑病 玉米穗腐病等 这些病害不仅会导致玉米产量
  • IM群聊消息如此复杂,如何保证不丢不重?

    1 前言 群聊已经成为主流IM软件的基本功能 不管是QQ群 还是微信群 一个群友在群内发了一条消息 那么对于IM服务器来说需要保证 在线的群友能第一时间收到消息 离线的群友能在登陆后收到消息 由于 消息风暴扩散系数 的存在 概念详见 IM单