选择哪个数据库(Cassandra、MongoDB?)来存储和查询事件/日志/指标数据?

2024-01-20

用 SQL 术语来说,我们存储这样的数据:

table events (
  id
  timestamp
  dimension1
  dimension2
  dimension3
  etc.
)

所有维度值均为整数。这张桌子变得非常大。

我们希望像这样的查询能够快速读取:

SELECT dimension1, dimension2, COUNT(*) 
FROM   events
WHERE  dimension8 = 'foo'
AND    dimension9 = 'bar'
GROUP BY 1, 2

我们想要快速写入,而不关心事务和一致性。我们关心最终的可用性和分区容错性。

我正在寻找“NoSQL”替代方案。 Casandra 可以做我正在寻找的那种查询吗?通过阅读他们的文档,这一点并不是显而易见的......如果它可以做到这一点,那么它对于这些类型的查询的性能如何?

我也在研究 MongoDB,但据我所知,他们的“group()”函数有严重的限制(最多 10,000 行)。

您是否有使用这些数据库的经验,您是否会推荐它作为上述问题的解决方案?

我应该考虑是否有其他数据库可以快速执行此类查询?

干杯, 吉米


“分组依据”和“愚蠢的快速”不能并存。这就是那头野兽的本性……因此,Mongo 的团体运作受到了限制; Cassandra 甚至本身不支持它(尽管它支持通过 Hadoop 进行 Hive 或 Pig 查询......但它们的目的并不是要快得愚蠢)。

Twitter 的 Rainbird(使用 Cassandra)等进行实时分析的系统通过非规范化/预计算计数来实现:http://www.slideshare.net/kevinweil/rainbird-realtime-analytics-at-twitter-strata-2011 http://www.slideshare.net/kevinweil/rainbird-realtime-analytics-at-twitter-strata-2011

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

选择哪个数据库(Cassandra、MongoDB?)来存储和查询事件/日志/指标数据? 的相关文章

随机推荐

  • 加载后获取 Highcharts 系列数据

    我试图在调用 Highcharts 图表并将其加载到页面后获取系列数据 到目前为止 我只成功地获得了一堆字符串 这显然不是我想要的 不知道是否有人可以帮助我解决这个问题 jQuery 代码 success function chartDat
  • Spring AOP 创建额外的 bean

    我正在玩Spring AOP 这是一个简单的类 public class CModel extends Car private double torqueMeasure 1 public CModel System out println
  • 如何使用 kubernetes python 客户端排空节点?

    我正在尝试使用官方的 kubernetes 工作节点自动化kubernetes python 客户端 https github com kubernetes incubator client python 我目前正在寻找一种方法安全地将所有
  • Jena Fuseki 服务器命令未找到

    我是 Jena Fuseki 服务器的新手 根据链接http jena apache org documentation serving data index html http jena apache org documentation
  • 如何在 jenkins 上使用 ant 从 .product 构建 eclipse rcp 应用程序

    我想构建一个 Eclipse RCP 应用程序 我有一个产品配置文件和一个带有许多第三方插件的目标平台 从 Eclipse IDE 的导出工作完美无缺 但这很难说是专业的 所以我也想让它在詹金斯上工作 构建服务器从 SVN 获取文件 没有
  • matlab/octave - 广义矩阵乘法

    我想做一个函数来概括矩阵乘法 基本上 它应该能够执行标准矩阵乘法 但它应该允许通过任何其他函数更改两个二元运算符的乘积 和 目标是在 CPU 和内存方面尽可能高效 当然 它的效率总是低于 A B 但操作员的灵活性是这里的重点 这是我阅读后可
  • `this.some_property` 在匿名回调函数中变为未定义

    所以我不太明白为什么这个变量这个任务在我的目标对象内部的添加事件侦听器中变得未定义 我有一种感觉 它可能与异步编程有关 我仍然不完全理解 抱歉 我有点 JS 菜鸟 但是如果你们能向我解释我做错了什么以及什么可能是更好的解决方案 那就太棒了
  • 使用 Azure AD 多租户进行 Azure AD B2C 身份验证

    我已按照本文配置了 Azure AD 多租户身份验证 https learn microsoft com en us azure active directory b2c identity provider azure ad multi t
  • 如何刷新 iframe url?

    我正在使用 ionic 创建一个应用程序 其中使用 iframe 显示 URL 这是 HTML 代码 这是角度js scope iframeHeight window innerHeight document getElementById
  • 自适应卡 - 以字节为单位提供图像

    我正在尝试将图像放入 Bot 框架中的自适应卡中 如下所示 card Body Add new AdaptiveImage Type Image Url new Uri pictureUrl Size AdaptiveImageSize L
  • jQuery .val() 在更改选择框时返回未定义

    我有一个带有一些日期的选择框 我想在输入更改时获取所述日期的值 我的价值总是变得不确定 date pick change function var values date pick selected val alert values Fid
  • 在 C# 中直接在 DateTimePicker 上转到月份和年份

    如果用户在我的中输入日期 我该如何实现这一点DateTimePicker它会自动聚焦月份部分 输入该月份部分后 会转到年份部分 因为我不希望他必须按右键才能聚焦 有没有办法以编程方式执行此操作 用户不可能已经单击月份或年份部分 因为他使用键
  • 构建管道的默认分支。这是什么意思?

    在 Azure DevOps Services 的发布工作流程中 在设置持续部署触发器时 有一个选项 构建管道的默认分支 我不明白这意味着什么以及如何查看项目中不同管道的默认分支 任何有关这方面的文档的参考也会有所帮助 这也出现在管道中的其
  • 如何将 DataFrame 的列名从字符串转换为整数

    在下面的代码中 我将一个字符串读入 DataFrame 但即使输入字符串的标头是数字 它们也会作为字符串读入 1 2 有没有办法将它们作为数字读取 或者随后将它们转换为数字 import pandas as pd from StringIO
  • java初学者:如何在哈希图中对键进行排序?

    我是java新手 正在学习哈希图的概念 我很困惑哈希图中的键是如何排序的 我知道它基于字符串长度 但我很困惑当字符串长度相同时数据如何排序 import java util HashMap import java util Iterator
  • 如何向后读取文件以有效地查找子字符串

    我有一个巨大的这种结构的日志文件 时间戳 标识符 值 1463403600 AA 74 42 1463403601 AA 29 55 1463403603 AA 24 78 1463403604 AA 8 46 1463403605 AA
  • jQuery 组合框/自动完成但可编辑

    我正在使用 jQuery自动完成 http jqueryui com demos autocomplete combobox但我需要它是可编辑的 我的意思是 如果列表中没有某个值 我需要捕获他们输入的值 使用上面链接中的示例 用户可能看不到
  • 将本地分支从另一个本身经常重新基化的分支上进行 git rebase 是不是很糟糕?

    假设我有来自 origin master 的本地分支 A 我不断地对分支 A 进行更改 获取远程主服务器 并重新设置基准 然后我在 A 上建立了本地分支 B 我不断地对分支 B 进行更改并重新建立基础 我是唯一在 A 和 B 分支工作的人
  • 如何在 Django 中重写“get_queryset()”

    我将使用 django 中的通用视图 我定义了serializer class并重写了get queryset 方法 但是有一个错误告诉我重写get queryset 方法 我想知道我的覆盖方法是如何错误的 以及我必须做什么来解决该错误 这
  • 选择哪个数据库(Cassandra、MongoDB?)来存储和查询事件/日志/指标数据?

    用 SQL 术语来说 我们存储这样的数据 table events id timestamp dimension1 dimension2 dimension3 etc 所有维度值均为整数 这张桌子变得非常大 我们希望像这样的查询能够快速读取