是否可以通过管道在 Mongo 中高效地进行排序、分组和限制？

2023-11-30

给定具有年龄索引的用户：

{ name: 'Bob',
  age:   21  }

{ name: 'Cathy,
  age:   21  }

{ name: 'Joe',
  age:   33  }

获取输出：

[ 
  { _id: 21,
    names: ['Bob, 'Cathy'] },
  { _id: 33,
    names: ['Joe'] }
]

是否可以按年龄排序、分组和限制？

db.users.aggregate(
   [  
      {
        $sort: { 
           age: 1 
        }
      },
      {
        $group : {
           _id : $age,
           names:{ $push: '$name' }
      },
      {
        $limit: 10
      }
  ]

我做了一些研究，但不清楚是否可以先排序然后分组。在我的测试中，该组失去了排序，但我不明白为什么。

如果组保留排序，那么排序和限制可以大大减少所需的处理。它只需要做足够的工作来“填满”10组的限制。

So,

组是否保留排序顺序？还是必须先分组然后排序？
是否可以进行排序、分组和限制，仅进行足够的处理来返回限制？还是需要处理整个集合然后进行限制？

回答你的第一个问题：$group does not保留订单。有一个开放的更改请求，这些更改也稍微突出了背景，但看起来不会更改产品以保留输入文档的顺序：

https://jira.mongodb.org/browse/SERVER-24799
https://jira.mongodb.org/browse/SERVER-4507
https://jira.mongodb.org/browse/SERVER-21022

一般可以说两件事：您通常希望先进行分组，然后再进行排序。原因是对较少的元素（分组通常产生的）进行排序将比对所有输入文档进行排序更快。

其次，MongoDB 将确保尽可能高效且尽可能少地进行排序。这文档 states:

当管道中 $sort 紧邻 $limit 之前时，$sort 操作仅在进行时保留前 n 个结果，其中 n 是指定的限制，MongoDB只需要存储n个项目记忆。当allowDiskUse为true并且 n 个项目超出了聚合内存限制。

所以这段代码可以完成您的情况：

collection.aggregate({
    $group: {
        _id: '$age',
        names: { $push: '$name' }
    }
}, {
    $sort: { 
        '_id': 1 
    }
}, {
    $limit: 10
})

EDIT根据您的评论：

我同意你说的。进一步考虑你的逻辑，我什至会说：如果$group足够聪明，可以使用索引，那么它甚至不需要$sort开始时的阶段。不幸的是，它不是（还可能不是）。就今天的情况来看，$group永远不会使用索引，也不会根据以下阶段走捷径（$limit在这种情况下）。另请参阅此link有人进行了一些基本测试。

聚合框架还很年轻，所以我想，为了使聚合管道更智能、更快速，还有很多工作要做。

StackOverflow 上有答案（例如here）人们建议使用预先$sort阶段以“强制”MongoDB 以某种方式使用索引。然而，这显着减慢了我的测试速度（使用不同随机分布的样本形状的 100 万条记录）。

当谈到聚合管道的性能时，$match开始的阶段才是真正有帮助的。如果您可以从一开始就限制需要通过管道的记录总量，那么这就是您最好的选择 - 显然......;）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MongoDB

aggregationframework

是否可以通过管道在 Mongo 中高效地进行排序、分组和限制？的相关文章

Mongodb简单前缀查询与正则表达式和排序很慢

我被这个简单的前缀查询困住了虽然蒙戈文档 http www mongodb org display DOCS Advanced Queries AdvancedQueries RegularExpressions声明您可以通过使用前缀正则
在节点中使用mongoosejs更新多条记录

我在使用 mongoosejs 和 Node js 更新多个记录时遇到问题由于某种原因即使有多个匹配我也只更新一条记录我还注意到回调在 update 之后不会触发我没有收到任何错误消息这里发生了什么 Page find stat
猫鼬模式创建

我刚刚开始使用猫鼬我有一个使用 mongoose 的创建脚本它使用示例数据创建模式和数据库现在我编写实际的应用程序我是否需要在每次应用程序运行时创建架构对象或者它是否已经以某种方式可用换句话说我是否需要在每个使用 mongoo
在 AWS EKS 集群中安装 mongodb 时出错 - “运行 PreBind 插件 VolumeBinding：绑定卷：超时 > 等待条件”

我尝试按照给定的链接在 EKS 集群中安装 mongodb 使用 mongodb kubernetes operator https github com mongodb mongodb kubernetes operator https
Mongodb聚合框架：$group是否使用索引？

我正在尝试使用聚合框架 match and group阶段做 group阶段使用索引数据我正在使用最新的可用 mongodb 版本 2 5 4 group不使用索引数据来自 mongoDBdocs http docs mongodb
使用 Homebrew 安装 mongodb 时遇到问题

我正在尝试让 Mongo 运行我安装了包管理器Homebrew https brew sh 然后我使用了 Mongo 站点上的命令 brew update brew install mongodb 这似乎安装正确我输入了mongo在新的
正则表达式 Spring 数据 mongodb 存储库

早上好我正在尝试使用查询注释将正则表达式与 Spring data mongodb 存储库结合起来我想要的是在我的 mongo 文档的一个字符串属性中搜索一个子字符串我一直在谷歌和这里寻找但我没有找到任何优雅的东西我想知道 Spr
Mongodb聚合，如何按间隔标准对文档进行计数？

我的 MongoDB 文档如下所示 StatCode LoadTime 例如数据可能如下所示 id StatCode LoadTime 1 200 0 345 2 200 0 234 3 200 0 396 4 200 1 234 5 2
如何决定使用哪种NoSQL技术？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案 MongoDB 基于文档 HBase 基于列和 Neo4j 对象图的优缺点是什么我特别有兴趣了解
节点 mongodb：错误：由于 parseError 连接已关闭

使用本机 mongodb npm 包我收到 Error connection closed due to parseError 进行非常基本的查询时 collections myCollection findOne id someID f
Mongodb upsert 嵌入文档

我每天每米有一份文件如果它不存在如何在数据数组中添加另一个子文档并创建整个文档 key 20120418 123456789 data Meter 123456789 Dt ISODate 2011 12 29T16 00 00 0Z
Mongoose 查询：删除“_id”属性，在结果中保留虚拟属性“id”

我正在运行 Express js 应用程序并且有以下设置模型 js var schemaOptions toJSON virtuals true toObject virtuals true var modelSchema new mo
如何在Mongodb java驱动程序中编写多个group by id字段

在下面的查询中 group id success success responseCode responseCode label label max timeStamp timeStamp 1 count responseCode sum
MongoDB $geoIntersects 不适用于包含负顶点的多边形

我已在数据库中存储了跨越 x 轴和 y 轴的多边形并且我想搜索包含给定点的多边形为此我使用 geoIntersects 运算符来指定一个点但是当多边形穿过轴时 MongoDB 不会返回任何多边形我可以对查询或架构进行任何小的更改
带有卷的 docker 中的 Mongo db 持久化

我正在尝试创建一个 mongo 数据库容器但无法使数据持久化这是我的 docker compose yml version 3 2 services mongodb image mongo 2 4 command smallfiles
如何在没有objectid字段的mongodb集合上查找上次更新/插入/删除操作时间

我在 MongoDb 数据库中有一些未使用的集合我必须找出对数据库中的集合执行 CRUD 操作的时间我们有自己的 id字段而不是mongo默认的object id 我们没有任何时间在集合中归档以找出修改时间有没有办法从元数据中找出m
无法连接到服务器 127.0.0.1:27017 连接尝试失败 MongoDB

我正在使用 Ubuntu 操作系统 16 04 我正在使用命令启动 mongodb sudo service mongod start进而mongo 它为我生成了这个错误 MongoDB shell version v4 0 1 conne
如何验证 ObjectID

使用 Joi 模式验证是否可以针对 MongoDB ObjectID 进行验证像这样的事情可能很棒 id Joi ObjectId required error errorParser 我发现如果我这样做 Joi object id J
MongoDB自增ID

MongodB 中自动生成的 ID 的大小为12 Bytes大整数的大小是8 bytes 我在 4 台运行 Ubuntu Server 的机器上有一个 mongodb 集群但我现在只是在测试插入只能通过一台服务器即 Nodejs 服务
使用填充方法在 sails mongo 中进行深层关联？

我是 sails js 的新手我正在使用 sails js 与 Mongodb 我在我的 sails 应用程序中使用 populate 进行深层关联时遇到问题我有这样的关系 Category has many to many relat

随机推荐

输入模式，至少 1 个非空白字符

我想将以下内容重写为 HTML 模式 if S test myString string is not empty and not just whitespace So
使用 jQuery 访问 css“:after”选择器[重复]

这个问题在这里已经有答案了我有以下CSS pageMenu active after content margin top 6px display inline block width 0px height 0px border top
类变量在Python中的所有实例之间共享？ [复制]

这个问题在这里已经有答案了我一周前开始用 python 编码这是我的错误我很快就开始使用 oops 类和对象进行编码我认为我的 C 熟练程度会有所帮助我被以下代码所困扰 class A var 0 list def init se
在 ASP.NET Core 的 Application Insights 中填写用户 ID 字段

我希望能够使用我的真实用户名数据填充 Application Insights 中的用户 ID 字段这是一个内部应用程序因此简单的用户名字段的隐私问题没有实际意义据我所知所有在线可用的解决方案都严格适用于 NET Framewor
Spring Kafka 支持多个消费者的要求

正如人们所期望的那样通常希望不同的消费者以不同的方式反序列化 Kafka 中的主题 Spring Boot 自动配置存在一个已知问题似乎一旦定义了其他工厂 Spring Kafka 或自动配置就会抱怨无法再找到合适的消费者工厂有人指出
在php中将数字等字母增加一定的值

在 php 中如果我写 c A c 它递增到 B 但如果我想将其递增 2 3 或更多例如 c 2 或 c 3 获取替代字母表 for column B column lt highestColumn column cell workshe
在函数之间传递 MutableLiveData

我在 ViewModel 中有一个函数 A 它从 firebase 检索数据并将值分配给MutableLiveData
Spring MVC 4 和 Thymeleaf - 防止页面刷新

我保证我已经用谷歌搜索过这个了我有一个 Spring MVC 4 应用程序它使用 Thymeleaf 收集表单数据并将其放入数据库中工作得很好除了我希望我的应用程序在用户点击提交按钮后将用户留在表单页面上以便他们可以继续编辑每
单应性到射影变换

我一直在试图弄清楚如何在两个平面之间获取单应性并将其转换为射影变换 Matlab 自动执行此操作但我一直在尝试弄清楚 matlab 如何实现转换你可以在toolbox images images maketform m中查看源代码至少
Javascript/jQuery - 浮点验证？

我有一个文本字段人们可以在其中输入价格 XX xx 有没有办法确保他们只输入小数点后不超过 2 位数字以下是主要的验证类型 document ready function for numeric integer only var num
使用 jQuery 对记录进行分页

我有一个包含大量记录的 JSON 结果我想显示第一个但有一个下一个按钮可以查看第二个依此类推我不希望页面刷新这就是为什么我希望 JavaScript jQuery 甚至第三方 AJAX 库的组合可以提供帮助有什么建议么希望这可
非类型模板参数

我在使用非类型 int 变量模板参数时遇到问题为什么我不能将常量 int 变量传递给函数并让函数实例化模板 template
R 从带有 csv 文件内容的内联字符串中读取 .csv 数据

这应该是一件微不足道的事情但我没有在谷歌上找到任何东西我的 csv 文件中有以下数据 test csv var1 var2 a 1 b 2 我用它读入 R d lt read csv test csv 我有办法在 R 代码中插入 csv
可以在带引号的 XML 属性值字符串中使用文字尖括号吗？

例如这是有效的 XML 吗
生成指数分布的随机数

include
如何在SQL中获取3天内的记录分组日期？

每 5 天对记录进行分组和显示变得越来越困难这是我的数据 FLIGHT DATE LANDINGS PILOTID COPILOTNAME MONT DPT 11 16 2013 1 A B 11 5 5 11 17 2013 1 A B
SSRS 2012 和 CSV 导出

我正在使用 SSRS 2012 尝试执行以下操作某些列应仅根据用户请求使用组合框可见列的可见性取决于组合上所选的列这看起来效果很好当我以不同于 csv 的任何格式导出输出时这些列保持不可见但是当导出到 csv 时会显示不可见
如何修改jenkins中可编辑电子邮件插件中的mime消息

我想修改从詹金斯发送的电子邮件我该怎么做我尝试使用 msg 变量并使用 msg setContent 这是我在电子邮件正文中想要的字符串设置内容但它失败了有任何想法吗我刚刚面临同样的任务 msg setContent Test
如何在应用程序制作工具中创建rest api？

有没有办法在应用程序制造商的服务器端脚本中创建 REST API 我需要从 iOS 应用程序调用服务器端函数传递一些参数并获得响应而无需转到应用程序中的页面我知道对于常规的谷歌应用程序脚本来说可以通过执行 API 来实现但我不知道
是否可以通过管道在 Mongo 中高效地进行排序、分组和限制？

给定具有年龄索引的用户 name Bob age 21 name Cathy age 21 name Joe age 33 获取输出 id 21 names Bob Cathy id 33 names Joe 是否可以按年龄排序分组和限制

是否可以通过管道在 Mongo 中高效地进行排序、分组和限制？

是否可以通过管道在 Mongo 中高效地进行排序、分组和限制？ 的相关文章

随机推荐

热门标签

是否可以通过管道在 Mongo 中高效地进行排序、分组和限制？的相关文章