选择哪个数据库（Cassandra、MongoDB？）来存储和查询事件/日志/指标数据？

2024-01-20

用 SQL 术语来说，我们存储这样的数据：

table events (
  id
  timestamp
  dimension1
  dimension2
  dimension3
  etc.
)

所有维度值均为整数。这张桌子变得非常大。

我们希望像这样的查询能够快速读取：

SELECT dimension1, dimension2, COUNT(*) 
FROM   events
WHERE  dimension8 = 'foo'
AND    dimension9 = 'bar'
GROUP BY 1, 2

我们想要快速写入，而不关心事务和一致性。我们关心最终的可用性和分区容错性。

我正在寻找“NoSQL”替代方案。 Casandra 可以做我正在寻找的那种查询吗？通过阅读他们的文档，这一点并不是显而易见的......如果它可以做到这一点，那么它对于这些类型的查询的性能如何？

我也在研究 MongoDB，但据我所知，他们的“group()”函数有严重的限制（最多 10,000 行）。

您是否有使用这些数据库的经验，您是否会推荐它作为上述问题的解决方案？

我应该考虑是否有其他数据库可以快速执行此类查询？

干杯，吉米

“分组依据”和“愚蠢的快速”不能并存。这就是那头野兽的本性……因此，Mongo 的团体运作受到了限制； Cassandra 甚至本身不支持它（尽管它支持通过 Hadoop 进行 Hive 或 Pig 查询......但它们的目的并不是要快得愚蠢）。

Twitter 的 Rainbird（使用 Cassandra）等进行实时分析的系统通过非规范化/预计算计数来实现：http://www.slideshare.net/kevinweil/rainbird-realtime-analytics-at-twitter-strata-2011 http://www.slideshare.net/kevinweil/rainbird-realtime-analytics-at-twitter-strata-2011

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

选择哪个数据库（Cassandra、MongoDB？）来存储和查询事件/日志/指标数据？的相关文章

Mongoose 多个连接

目前我的连接有这个代码猫鼬 js var mongoose require mongoose var uriUtil require mongodb uri var mongodbUri mongodb localhost db name
MongoDB：如何使用单个命令更新多个文档？

我惊讶地发现以下示例代码仅更新单个文档 gt db test save id 1 foo bar gt db test save id 2 foo bar gt db test update foo bar set test success
mongodb在windows下无法启动？

当我尝试在命令行上使用命令 mongod exe 启动 mongodb 时它会抛出以下错误 C mongodb win32 x86 64 2 0 6 bin gt mongod exe mongod exe help for help a
Cassandra cqlsh“无法连接到任何服务器”

在命令行上执行 cqlsh bat 时收到以下消息 Connection error Unable to connect to any servers 127 0 0 1 ProtocolError cql version 3 3 0 is
如何获取 bson 文档的大小（以字节为单位）

bson文档的size 函数返回的int值是字节数吗无法找到此 API 的详细信息如何获取 bson 文档的大小以字节为单位这是我的代码 import org bson Document MongoDatabase db Mongo
Cassandra：在 session.execute() 期间“无法完成对任何主机的操作”

卡桑德拉版本 1 2 2Thrift API 版本 19 35 0CQL支持的版本 2 0 0 3 0 1 默认 3 0 1 适用于 python 3 4 的 cassandra 驱动程序使用 sudo 运行 cassandra bin c
Redis AOF fsync（始终）与 LSM 树

我对日志结构化合并树 LSM 树的理解是它利用了附加到磁盘非常快因为它不需要查找这一事实只需将更新附加到预写日志并返回到客户端即可我的理解是这仍然提供了立即的持久性同时仍然非常快我不认为 Redis 使用 LSM 树它似
为什么 NoSQL 比 RDBMS 更擅长“横向扩展”？

我在a中读过以下文字技术博客 http tekedia com 12083 nosql database advantages and disadvantages 讨论NoSQL的优缺点多年来为了提高数据库服务器的性能数据库管理员不得
如何在Mongodb java驱动程序中编写多个group by id字段

在下面的查询中 group id success success responseCode responseCode label label max timeStamp timeStamp 1 count responseCode sum
Cassandra LWT 读取

据我了解 LWT 插入始终以 SERIAL 一致性级别完成如果为 true 这是否意味着读取作为 LWT 插入的行可以安全地以 ANY 一致性级别读取换句话说我假设 LWT 插入是完全一致的使得任何后续读取也完全一致无论一致性级别
Mongodb 通过查询和分组查找

简单收集 id 123 name FooBar zone Bas id 456 name Alice zone Bas id 789 name FooBar zone Bas 首先我构建一个查询来按名称查找所有元素 db collecti
无法连接到服务器 127.0.0.1:27017 连接尝试失败 MongoDB

我正在使用 Ubuntu 操作系统 16 04 我正在使用命令启动 mongodb sudo service mongod start进而mongo 它为我生成了这个错误 MongoDB shell version v4 0 1 conne
Elasticsearch 聚合过滤器

因为我在谷歌上找不到任何东西是否可以在elasticsearch中过滤聚合我正在考虑这样的事情获取 SOME object X gt 100 的所有对象提前致谢编辑样本数据我有以下文档结构 docKey 1 value 2 d
如何使用 Stripe 在一次操作中创建客户和卡片？

我正在尝试第一次初始化客户我有一个表格他们可以在那里注册和填写所有内容然后他们提交在客户端上会发生以下情况 var cardValues AutoForm getFormValues credit card form insert
Apache Cassandra 中的复合索引

我正在尝试设置一个 cassandra 列族其中一些列上有二级索引在读回数据时我需要进行过滤在我最初的测试中当我一起使用多个索引时速度会变慢这是我当前的配置方式通过 cassandra cli update column fa
Node.js 检测两个猫鼬查找何时完成

我正在尝试使用自动完成功能初始化两个输入library https www devbridge com sourcery components jquery autocomplete 当我加载页面时我将触发 Ajax 来初始化两个输入文本
在 MongoDB 聚合的“addField”操作中使用“$count”

我正在尝试找到聚合运算符的正确组合以将标题为 totalCount 的字段添加到我的 mongoDB 视图中这将为我提供聚合管道特定阶段的计数并将其输出为每个文档的计数结果 count count 但最终我得到了一个具有此结果的文档
Cassandra java驱动程序协议版本和连接限制不匹配

我使用的java驱动程序版本 2 1 4卡桑德拉版本 dsc cassandra 2 1 10cql 的输出给出以下内容 cqlsh 5 0 1 Cassandra 2 1 10 CQL spec 3 2 1 Native protocol
PHP MongoDb 驱动程序：如何设置执行代码的超时

我有以下代码它在 MongoDb 端执行一段代码 mongoCode new MongoCode Some JS code db gt execute mongoCode array socketTimeoutMS gt 1000000
是否可以提高 Mongoexport 速度？

我有一个 1 3 亿行的 MongoDB 3 6 2 0 集合它有几个简单的字段和 2 个带有嵌套 JSON 文档的字段数据以压缩格式 zlib 存储我需要尽快将其中一个嵌入字段导出为 JSON 格式然而 mongoexport 需

随机推荐

加载后获取 Highcharts 系列数据

我试图在调用 Highcharts 图表并将其加载到页面后获取系列数据到目前为止我只成功地获得了一堆字符串这显然不是我想要的不知道是否有人可以帮助我解决这个问题 jQuery 代码 success function chartDat
Spring AOP 创建额外的 bean

我正在玩Spring AOP 这是一个简单的类 public class CModel extends Car private double torqueMeasure 1 public CModel System out println
如何使用 kubernetes python 客户端排空节点？

我正在尝试使用官方的 kubernetes 工作节点自动化kubernetes python 客户端 https github com kubernetes incubator client python 我目前正在寻找一种方法安全地将所有
Jena Fuseki 服务器命令未找到

我是 Jena Fuseki 服务器的新手根据链接http jena apache org documentation serving data index html http jena apache org documentation
如何在 jenkins 上使用 ant 从 .product 构建 eclipse rcp 应用程序

我想构建一个 Eclipse RCP 应用程序我有一个产品配置文件和一个带有许多第三方插件的目标平台从 Eclipse IDE 的导出工作完美无缺但这很难说是专业的所以我也想让它在詹金斯上工作构建服务器从 SVN 获取文件没有
matlab/octave - 广义矩阵乘法

我想做一个函数来概括矩阵乘法基本上它应该能够执行标准矩阵乘法但它应该允许通过任何其他函数更改两个二元运算符的乘积和目标是在 CPU 和内存方面尽可能高效当然它的效率总是低于 A B 但操作员的灵活性是这里的重点这是我阅读后可
`this.some_property` 在匿名回调函数中变为未定义

所以我不太明白为什么这个变量这个任务在我的目标对象内部的添加事件侦听器中变得未定义我有一种感觉它可能与异步编程有关我仍然不完全理解抱歉我有点 JS 菜鸟但是如果你们能向我解释我做错了什么以及什么可能是更好的解决方案那就太棒了
使用 Azure AD 多租户进行 Azure AD B2C 身份验证

我已按照本文配置了 Azure AD 多租户身份验证 https learn microsoft com en us azure active directory b2c identity provider azure ad multi t
如何刷新 iframe url？

我正在使用 ionic 创建一个应用程序其中使用 iframe 显示 URL 这是 HTML 代码这是角度js scope iframeHeight window innerHeight document getElementById
自适应卡 - 以字节为单位提供图像

我正在尝试将图像放入 Bot 框架中的自适应卡中如下所示 card Body Add new AdaptiveImage Type Image Url new Uri pictureUrl Size AdaptiveImageSize L
jQuery .val() 在更改选择框时返回未定义

我有一个带有一些日期的选择框我想在输入更改时获取所述日期的值我的价值总是变得不确定 date pick change function var values date pick selected val alert values Fid
在 C# 中直接在 DateTimePicker 上转到月份和年份

如果用户在我的中输入日期我该如何实现这一点DateTimePicker它会自动聚焦月份部分输入该月份部分后会转到年份部分因为我不希望他必须按右键才能聚焦有没有办法以编程方式执行此操作用户不可能已经单击月份或年份部分因为他使用键
构建管道的默认分支。这是什么意思？

在 Azure DevOps Services 的发布工作流程中在设置持续部署触发器时有一个选项构建管道的默认分支我不明白这意味着什么以及如何查看项目中不同管道的默认分支任何有关这方面的文档的参考也会有所帮助这也出现在管道中的其
如何将 DataFrame 的列名从字符串转换为整数

在下面的代码中我将一个字符串读入 DataFrame 但即使输入字符串的标头是数字它们也会作为字符串读入 1 2 有没有办法将它们作为数字读取或者随后将它们转换为数字 import pandas as pd from StringIO
java初学者：如何在哈希图中对键进行排序？

我是java新手正在学习哈希图的概念我很困惑哈希图中的键是如何排序的我知道它基于字符串长度但我很困惑当字符串长度相同时数据如何排序 import java util HashMap import java util Iterator
如何向后读取文件以有效地查找子字符串

我有一个巨大的这种结构的日志文件时间戳标识符值 1463403600 AA 74 42 1463403601 AA 29 55 1463403603 AA 24 78 1463403604 AA 8 46 1463403605 AA
jQuery 组合框/自动完成但可编辑

我正在使用 jQuery自动完成 http jqueryui com demos autocomplete combobox但我需要它是可编辑的我的意思是如果列表中没有某个值我需要捕获他们输入的值使用上面链接中的示例用户可能看不到
将本地分支从另一个本身经常重新基化的分支上进行 git rebase 是不是很糟糕？

假设我有来自 origin master 的本地分支 A 我不断地对分支 A 进行更改获取远程主服务器并重新设置基准然后我在 A 上建立了本地分支 B 我不断地对分支 B 进行更改并重新建立基础我是唯一在 A 和 B 分支工作的人
如何在 Django 中重写“get_queryset()”

我将使用 django 中的通用视图我定义了serializer class并重写了get queryset 方法但是有一个错误告诉我重写get queryset 方法我想知道我的覆盖方法是如何错误的以及我必须做什么来解决该错误这
选择哪个数据库（Cassandra、MongoDB？）来存储和查询事件/日志/指标数据？

用 SQL 术语来说我们存储这样的数据 table events id timestamp dimension1 dimension2 dimension3 etc 所有维度值均为整数这张桌子变得非常大我们希望像这样的查询能够快速读取

选择哪个数据库（Cassandra、MongoDB？）来存储和查询事件/日志/指标数据？

选择哪个数据库（Cassandra、MongoDB？）来存储和查询事件/日志/指标数据？ 的相关文章

随机推荐

热门标签

选择哪个数据库（Cassandra、MongoDB？）来存储和查询事件/日志/指标数据？的相关文章