聊点技术｜数据爆炸性增长，Bonree ONE存储如何做到稳如泰山

2023-12-04

背景

新一代的Bonree ONE主要体现在轻盈、有序、精准三个亮点，而这三个方向都离不开一个稳定、可靠、高效的数据存储底座。目前，Bonree ONE基于Clickhouse进行存储，容纳了包括APM、RUM、LOG、会话、用户行为分析等多个业务模块的场景数据。

存储的难点

Bonree ONE容纳模块较多，数据使用场景复杂多变，对于底层数据存储，主要难点如下：

· 数据写入量大，数据量级要可以扩展到PB级别的数据摄入；

· 业务流量存在波峰和波谷，而且波峰和波谷的差距较大，存在突发超高峰写入的场景；

· 查询场景复杂，有olap分析、明细数据查询以及复杂的多字段排序场景；

· 查询稳定性要求较高，对于告警、重要指标要做到ms级别响应；

· 集群维护场景复杂度高，要应对集群扩缩容、数据均衡以及数据重分布等场景；

围绕Clickhouse的优化

针对以上难点，我们需要在写入、读取、多租户以及failover机制的策略响应上进行优化，满足Bonree ONE应对超大数据量应用场景的需求。

写入优化

· 按表攒批

Clickhouse是擅长按批写入数据的，批次的数据越大，吞吐量越高。为应对多场景数据涉入的状况和减少业务端对数据存储感知的需求，我们通过消费节点来完成攒批逻辑，根据每个表的个性化定制策略，实现攒批效果的最大化，这既能满足业务效率的要求，又能实现Clickhouse数据摄入的最大吞吐量。

· 限流

在有限存储资源的情况下，Clickhouse集群支持的摄入量是有限的，过大的数据写入主要有两个维度的原因，一个是写入的数据量过多，另一个是写入的峰值过高。前者会通过告警功能送达运维团队，通过扩容或者数据裁剪的操作来解决问题。后者则通过限流来保证存储集群的稳定性。目前，在consumer节点，我们增加了窗口逻辑来满足限流操作策略介入的需要，比如每秒写入次数、写入时间间隔等。

读取优化

为支持多业务有更稳定的数据使用效率，在数据查询上，高频查询的响应效率务必高效，我们主要从以下角度着手优化：

· 查询加速

· orderBy 和 primaryKey的高效使用：orderBy相关字段是表数据的排序设置，它对高频查询的效率有重要。一般orderBy的设置要尽量覆盖当前表业务的高频查询，从低基数到高基数进行排序设置。primaryKey默认与orderBy一致，如果filter条件没有覆盖所有的orderBy字段，则可以提取部分字段作为 primaryKey ，但是primaryKey 必须是 orderBy字段的前缀。

· 索引：针对等值过滤使用BF索引，针对范围查询使用minmax索引，针对全文检索，使用tokenbf索引。

· 物化视图：针对固定优化查询场景，使用物化视图，满足数据一致性的同时，大大提高查询效率。

· projection：针对部分预聚合场景，使用projection的效率更高，而且有更友好的自动路由，减少业务侵入。

· 压缩和编码

Clickhouse提供了多种编码以及多种编解码器，极大提高数据的压缩效率，节省IO、存储等资源。Clickhouse支持的压缩算法如下：

·NONE : No Compression.

·LZ4 : Applies LZ4 fast compression.

·LZ4HC[(level)] : LZ4 HC (high compression) algorithm with configurable level.

·ZSTD[(level)] : ZSTD compression algorithm with configurable level.

经过测试对比，ZSTD的压缩效率是LZ4的5~~6倍。

若想要更高的压缩效率，数据的存储编码是一种更好的优化手段。Clickhouse提供的编码算法如下：

·Delta : This approach stores the difference between 2 neighbor values. It can be combined with LZ4 and ZSTD.

·DoubleDelta : This approach stores the difference between 2 neighbor delta values (delta of deltas). Suitable for time series data.

·Gorilla : Calculates XOR between current and previous value. Suitable for slowly changing floating numbers.

·T64 : It crops unused high bits of values in integer data types(include Enum, Date, DateTime) and puts them into a 64×64 bit matrix.

·FPC : Used in floating point values. XOR between the actual value and the predicted value.

针对以上编码算法的特性，时间字段我们选择基于DoubleDelta编码的ZSTD(1)压缩算法，String类型使用ZSTD(1)的压缩算法。

· 字段类型精细化

Clickhouse提供了非常精细的数据字段进行压缩，比如整数就支持int8、int16、int32、int64，Clickhouse之所以这么细化数据类型，是为了高效的存储和计算，所以在业务使用端，也要做到精确化管理。

· 低基数的String使用 LowCardinality(String)。

· 能用更少位数的数据存储，就选择最少位数的数据存储，比如优先使用int8，而不是默认使用int64。

· 半结构化数据优先使用Map结构，其次是JSON结构。

多租户

Clickhouse为了保障多业务稳定查询，支持了多租户，减少业务之间的影响。我们基于Clickhouse的多租户能力，给予每条产品线单独的租户，实现租户资源个性化配置，满足不同业务不同优先级的诉求。

系统是根据各个租户的业务重要程度与场景响应需求来制定对应的租户资源显示的。目前Clickhouse支持了多租户，但是对于Clickhouse内部的资源隔离其实是不具备的，在这一点上，我们是通过完整的监控告警链路来跟进，减少资源冲突带来的不稳定性，支持租户资源的快速释放，从而快速解决某些应急场景。

failover策略

数据的摄入和读取需要高可用机制来满足需求，比如写入端某个consumer节点异常，或者某个clickhouse节点异常等情况，我们如何保证集群的稳定性。

当consumer节点或者clickhouse节点遇到异常时，ch-manager节点能够感知到节点异常进行流量调度，使异常节点不影响数据正常摄入和查询，同时调整流量写入策略，保证consumer节点写入的稳定性，避免发生级联雪崩状况。

效果

· 写入效率：Bonree ONE最新版本的写入效率较春季版本提高3-5倍，且稳定性更强，能够从容应对超预期的流量写入。

· 读取效率：目前Bonree ONE公有云生产环境Clickhouse集群的读取效率，TP99在S级以内。

· 稳定性：Clickhouse集群支持任意单节点服务掉线，而不影响集群整体的写入和查询，consumer任意单节点掉线，也不影响集群整体写入。

最后

在Bonree ONE应用场景愈发复杂的情况下，系统对数据存储的要求会越来越高，我们会在资源管理、实时性等方向上继续深入研究，让Bonree ONE在轻盈、有序、精准的方向上走得更远更稳，同时我们也会积极分享我们的改进方案，跟大家一起学习探讨。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

聊点技术｜数据爆炸性增长，Bonree ONE存储如何做到稳如泰山的相关文章

Java 中等效的并行扩展

我在 Net 开发中使用并行扩展有一些经验但我正在考虑在 Java 中做一些工作这些工作将受益于易于使用的并行库 JVM 是否提供任何与并行扩展类似的工具您应该熟悉java util concurrent http java sun
如何为最终用户方便地启动Java GUI程序

用户想要从以下位置启动 Java GUI 应用程序Windows 以及一些额外的 JVM 参数例如 javaw Djava util logging config file logging properties jar MyGUI jar
如何使用 Java 和 Selenium WebDriver 在 C 目录中创建文件夹并需要将屏幕截图保存在该目录中？

目前正在与硒网络驱动程序和代码Java 我有一种情况我需要在 C 目录中创建一个文件夹并在该文件夹中创建我通过 selenium Web 驱动程序代码拍摄的屏幕截图它需要存储在带有时间戳的文件夹中如果我每天按计划运行脚本所有屏幕截
Spring Batch 多线程 - 如何使每个线程读取唯一的记录？

这个问题在很多论坛上都被问过很多次了但我没有看到适合我的答案我正在尝试在我的 Spring Batch 实现中实现多线程步骤有一个包含 100k 条记录的临时表想要在 10 个线程中处理它每个线程的提交间隔为 300 因此在任何时
如何默认将 Maven 插件附加到阶段？

我有一个 Maven 插件应该在编译阶段运行所以在项目中consumes我的插件我必须做这样的事情
如何在 Play java 中创建数据库线程池并使用该池进行数据库查询

我目前正在使用 play java 并使用默认线程池进行数据库查询但了解使用数据库线程池进行数据库查询可以使我的系统更加高效目前我的代码是 import play libs Akka import scala concurrent Ex
在 java 类和 android 活动之间传输时音频不清晰

我有一个android活动它连接到一个java类并以套接字的形式向它发送数据包该类接收声音数据包并将它们扔到 PC 扬声器该代码运行良好但在 PC 扬声器中播放声音时会出现持续的抖动中断安卓活动 public class Sen
INSERT..RETURNING 在 JOOQ 中不起作用

我有一个 MariaDB 数据库我正在尝试在表中插入一行users 它有一个生成的id我想在插入后得到它我见过this http www jooq org doc 3 8 manual sql building sql statemen
斯坦福 NLP - 处理文件列表时 OpenIE 内存不足

我正在尝试使用斯坦福 CoreNLP 中的 OpenIE 工具从多个文件中提取信息当多个文件而不是一个传递到输入时它会给出内存不足错误 All files have been queued awaiting termination
十进制到八进制的转换[重复]

这个问题在这里已经有答案了可能的重复十进制转换错误 https stackoverflow com questions 13142977 decimal conversion error 我正在为一个类编写一个程序并且在计算如何将八进
在两个活动之间传输数据[重复]

这个问题在这里已经有答案了我正在尝试在两个不同的活动之间发送和接收数据我在这个网站上看到了一些其他问题但没有任何问题涉及保留头等舱的状态例如如果我想从 A 类发送一个整数 X 到 B 类然后对整数 X 进行一些操作然后将其发送
getResourceAsStream() 可以找到 jar 文件之外的文件吗？

我正在开发一个应用程序该应用程序使用一个加载配置文件的库 InputStream in getClass getResourceAsStream resource 然后我的应用程序打包在一个 jar文件如果resource是在里面 ja
总是使用 Final？

我读过将某些东西做成最终的然后在循环中使用它会带来更好的性能但这对一切都有好处吗我有很多地方没有循环但我将 Final 添加到局部变量中它会使速度变慢还是仍然很好还有一些地方我有一个全局变量final 例如android Pa
如何在 javadoc 中使用“<”和“>”而不进行格式化？

如果我写
玩！框架：运行“h2-browser”可以运行，但网页不可用

当我运行命令时activator h2 browser它会使用以下 url 打开浏览器 192 168 1 17 8082 但我得到使用 Chrome 此网页无法使用奇怪的是它以前确实有效从那时起我唯一改变的是JAVA OPTS以启用
simpleframework，将空元素反序列化为空字符串而不是 null

我使用简单框架 http simple sourceforge net http simple sourceforge net 在一个项目中满足我的序列化反序列化需求但在处理空空字符串值时它不能按预期工作好吧至少不是我所期望的如
获取 JVM 上所有引导类的列表？

有一种方法叫做findBootstrapClass对于一个类加载器如果它是引导的则返回一个类有没有办法找到类已经加载了您可以尝试首先通过例如获取引导类加载器呼叫 ClassLoader bootstrapLoader ClassLo
捕获的图像分辨率太大

我在做什么我允许用户捕获图像将其存储到 SD 卡中并上传到服务器但捕获图像的分辨率为宽度 4608 像素和高度 2592 像素现在我想要什么如何在不影响质量的情况下获得小分辨率图像例如我可以获取或设置捕获的图像分辨率为原始图像分
java.lang.IllegalStateException：驱动程序可执行文件的路径必须由 webdriver.chrome.driver 系统属性设置 - Similiar 不回答

尝试学习 Selenium 我打开了类似的问题但似乎没有任何帮助我的代码 package seleniumPractice import org openqa selenium WebDriver import org openqa s
将 List 转换为 JSON

Hi guys 有人可以帮助我如何将我的 HQL 查询结果转换为带有对象列表的 JSON 并通过休息服务获取它这是我的服务方法它返回查询结果列表 Override public List

随机推荐

淘宝天猫商品评论采集，用rpa机器人轻松解决！

电商行业是目前发展非常迅速的行业淘宝天猫作为国内最大的电商平台之一商品评论对于商家来说非常重要商品评论可以反映出产品的好坏和用户的购买体验是用户决策的重要参考因素商品评论的采集对于商家来说非常重要然而手动采集大量评论数据耗时耗
钛氧物种与钴相互作用-科学指南针

中科院与上海交通大学合作在碳化物作为载体的钴基费托合成研究中取得新进展借助透射电子显微镜等技术揭示了还原过程中碳化钛表面的钛氧物种到金属钴表面的原位迁移现象这种增强的金属载体的相互作用促进了费托合成反应活性通过透射电子显微镜可以
人工智能与大数据专业毕设选题汇总最新版

目录前言毕设选题选题迷茫选题的重要性更多选题指导最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生
cuda 在 torch神经网络中哪些地方可以用？

简言之 3部分 1 数据data可以放在GPU上 2 网络net可以放在GPU上 3 损失函数loss可以放在GPU上 CUDA可以用于在torch神经网络中进行GPU加速计算包括模型的训练和推理过程具体来说可以使用CUDA加速以下操
一个简单的参数帮助框架，c实现

文章目录具体实现如下 include
RUM增强APP端快照配置全量会话回放与自定义协议网络请求采集功能

一直以来博睿数据秉承着让每一款软件运行更完美的产品理念注重用户体验和反馈以持续的技术创新为广大用户提供轻盈有序精准的IT运维一体化智能可观测平台降低运维成本近期博睿数据根据一体化智能可观测平台 Bonree ONE 产
牛掰！《鸿蒙零基础入门学习指南》重磅来袭

前言不久前华为开发者大会2023 宣布不再兼容安卓同时宣布了鸿飞计划余承东承诺再投入超百亿元以扶持和打造鸿蒙生态鸿蒙不再兼容安卓欲与iOS 安卓在市场三分天下这对中国国产操作系统而言具有划时代的意义近期美团网易微
Windows下环境配置Cmake、MinGW、OpenCV

一安装Cmake 1 选择自己需要下载的版本下载地址 gt https github com Kitware CMake releases download v3 26 5 cmake 3 26 5 windows x86 64 msi
前阿里P6花七天时间整理地方软件测试基础知识，高手请绕道

可以说软件测试所学习的知识都是在循序渐进的从更基础的知识逐渐延伸到困难的知识由此可以看出基础知识是这些重难点知识延伸的基础想要升职加薪基础知识必须牢靠一软件测试概述 1 软件缺陷软件缺陷又称之为 Bug 即计算机软件或程序
制造业如何做生产设备管理、分析生产数据？

本文将为大家讲解 1 设备管理的现状与问题 2 设备管理系统功能 3 制造业企业如何做生产设备管理分析生产数据 4 制造业设备管理的价值想要管理好设备设备档案管理巡检报修保养分析预警等问题都是必须要考虑的我们公司正是使用了设
介绍kfold.split(）的详细用法

KFold 是交叉验证中的一种方法其可以将数据集划分为 K 份然后使用其中一份作为验证集剩下的 K 1 份作为训练集这个过程可以重复 K 次以便每个子集都被用作验证集 KFold split 是 KFold 类中的一个方法用于将
黑马一站制造数仓实战1

1 项目目标一站制造企业中项目开发的落地代码开发代码开发 SQL DSL SQL SparkCore SparkSQL 数仓的一些实际应用分层体系建模实现 2 内容目标项目业务介绍背景需求项目技术架构选型架构项目环
科技改变生活智能化让生活更便捷

在科技迅猛发展的时代我们正处于信息化和智能化的浪潮中如何善用科技让生活更加便捷成为了当代人们共同关心的问题本文将围绕这一主题深入探讨科技如何改变我们的日常生活让生活更智能更方便 1 科技便捷生活智能引领未来这个强调了科技
Docker容器安装部署

阿里云网站 mirrors aliyun com 一安装步骤 yum源的配置最好用环境干净的虚拟机进行安装部署 1 在 etc yum repos d中配置 docker repo 并直接配置centos源以免出现依赖性问题 2 直接列
electron 应用图标修改

修改窗口图标更换Electron应用程序的桌面图标准备好你想要作为图标的图片文件可以是PNG格式安装一个可以转换图片格式为ICO的工具例如在线转换工具在线转换icon图标工具将你的PNG图片文件上传并转换为ICO格式将转换得
LANG、LC_CTYPE、LC_ALL环境变量

修改编码格式 export LANG zh CN UTF 8 修改所有的编码格式优先级高 export LC ALL zh CN UTF 8 locale是根据计算机用户所使用的语言所在国家或者地区以及当地的文化传统所定义的一个软件运
零束科技：博睿数据是智能化路上的可靠“守护者”

近年来汽车市场环境的复杂性上升全球各类不稳定因素增加造车新势力挑战不断车企借助云容器化微服务等技术加速自身数字化变革已经成为面向未来发展的主要趋势但随着数字化程度不断深入自有系统的稳定性性能瓶颈以及由故障所带来的各类影
两步解决opencsv 设置@CsvBindByPosition(position = 0)导致@CsvBindByName(column = “批次号“) 标题头不写入的问题

获取实体类中的所有column private static
详细介绍torch中的from torch.utils.data.sampler相关知识

PyTorch中的 torch utils data sampler 模块提供了一些用于数据采样的类和函数这些类和函数可以用于控制如何从数据集中选择样本下面是一些常用的 Sampler 类和函数的介绍 Sampler 基类 Sample
聊点技术｜数据爆炸性增长，Bonree ONE存储如何做到稳如泰山

背景新一代的Bonree ONE主要体现在轻盈有序精准三个亮点而这三个方向都离不开一个稳定可靠高效的数据存储底座目前 Bonree ONE基于Clickhouse进行存储容纳了包括APM RUM LOG 会话用户行为分析等

聊点技术｜数据爆炸性增长，Bonree ONE存储如何做到稳如泰山

聊点技术｜数据爆炸性增长，Bonree ONE存储如何做到稳如泰山 的相关文章

随机推荐

热门标签

聊点技术｜数据爆炸性增长，Bonree ONE存储如何做到稳如泰山的相关文章