为什么迭代大型 Django QuerySet 会消耗大量内存？

2023-11-29

该表包含大约一千万行。

for event in Event.objects.all():
    print event

这会导致内存使用量稳定增加到 4 GB 左右，此时行会快速打印。第一行打印之前的漫长延迟让我感到惊讶——我预计它几乎会立即打印。

我也尝试过Event.objects.iterator()其行为方式相同。

我不明白 Django 正在将什么加载到内存中，也不明白它为什么要这样做。我期望 Django 在数据库级别迭代结果，这意味着结果将以大致恒定的速率打印（而不是在漫长的等待后一次全部打印）。

我误解了什么？

（我不知道这是否相关，但我正在使用 PostgreSQL。）

Nate C 很接近，但还不够。

From the docs:

您可以通过以下方式评估 QuerySet：
迭代。 QuerySet 是可迭代的，并且它会在您第一次迭代它时执行其数据库查询。例如，这将打印数据库中所有条目的标题：
for e in Entry.objects.all():
    print e.headline

因此，当您第一次进入该循环并获取查询集的迭代形式时，会立即检索一千万行。您所经历的等待是 Django 加载数据库行并为每一行创建对象，然后返回您可以实际迭代的内容。然后你就将所有内容都记在了内存中，结果就会溢出来。

从我阅读文档来看，iterator()只是绕过 QuerySet 的内部缓存机制。我认为做一件一件的事情可能是有意义的，但这反过来需要对数据库进行一千万次单独的点击。也许并不是那么理想。

有效地迭代大型数据集是我们还没有完全正确的事情，但是您可能会发现一些对您的目的有用的片段：

内存高效的 Django QuerySet 迭代器
批量查询集
查询集foreach

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

django

postgresql

djangoorm

为什么迭代大型 Django QuerySet 会消耗大量内存？的相关文章

MySql 5.7 ORDER BY 子句不在 GROUP BY 子句中并且包含非聚合列

我试图在不禁用 my ini 中的 only full group by 的情况下弄清楚这是我的查询 SELECT p title COUNT t qty AS total FROM payments t LEFT JOIN produc
如何在 django admin 中使用自定义字段进行搜索

我有一个模型并已注册到管理员并且我已使用自定义字段在列表中显示 class ReportsAdmin admin ModelAdmin def investment self inst return models OrderDetail
Django 管理内联以实现深层关系

为直接关系创建内联非常容易但是如何为更深层次的关系创建内联假设情况是这样的 class A models Model class B models Model a models ForeignKey A class C models M
插入 Hive 表 - 非分区表到具有多个分区的分区表 - 无法插入目标表，因为列号/类型

当我尝试插入分区表时出现以下错误 SemanticException 错误 10044 第 1 23 行无法插入目标表因为列号类型不同表 insclause 0 有 6 列这 3 列已分区我们不需要任何必须从中转储存储的过滤器
在 Django 中删除特定用户的所有会话的最优化方法？

我正在运行 Django 1 3 使用会话中间件和身份验证中间件 settings py SESSION ENGINE django contrib sessions backends db Persist sessions to DB S
Django model.foreignKey 并返回 self.text 错误

所以我正在 Django 中处理 model py 但遇到了 2 个 pylint 错误我不明白为什么这是 pylint 的问题还是我在代码中做错了什么 E1120 No value for argument on delete in
串行类型的外键 - 确保始终手动填充

我有两个表国家和地区 CREATE TABLE Countries id SERIAL name VARCHAR 40 NOT NULL PRIMARY KEY id CREATE TABLE Regions id SERIAL coun
PostgreSQL 中的 Long 数据类型相当于什么？

我想知道相当于什么LongPostgreSQL 中的数据类型根据the docs http www postgresql org docs 7 4 interactive datatype html DATATYPE INT看起来像big
SQL 中基于下一条记录和上一条记录的复杂排序

这是一个后续问题根据 SQL 中的下一条记录和上一条记录进行排序 https stackoverflow com questions 30477803 sorting based on next and previous records i
SQL 查询用于计算每个客户的订单数量和总金额

我有两张桌子Order与列 OrderID OrderDate CID EmployeeID And OrderItem与列 OrderID ItemID Quantity SalePrice 我需要返回客户 ID CID 每个客户的订单数
SQL Server 2008R2 和创建 XML 文档

论坛上的第一篇文章因为我真的被这个问题困住了以下查询正确地将有效的 XML 文档分配给 xTempXML 变量类型为 xml 注文档的长度转换为varchar max 711 select xTempXML select Pres
升级到 1.8.1 后 Django 管理中断

我从 1 7 3 升级到 1 8 1 但我的管理员无法工作并且站点无法加载因为它在解析路径时失败例外 Enable django contrib auth context processors auth in your TEMPLAT
Mac OSX Lion Postgres 不接受 /tmp/.s.PGSQL.5432 上的连接

我在 Homebrew 安装 Postgres 时遇到常见的 Mac OSX 错误 No such file or directory Is the server running locally and accepting connecti
在 django 中处理图像上传表单：何时使用 save()、chunks() 和 clean_data？

我已经使用以下代码成功上传了图像 views py from django conf urls defaults import from django http import HttpResponse HttpResponseRedirec
Django User 模型，添加功能

我想向 Django 的默认用户模型添加一个新函数用于检索模型类型的相关列表这样的 Foo 模型 class Foo models Model owner models ForeignKey User related name owne
使用会话在 Django 中将文件从一个视图传递到另一个视图

我当前的工作项目要求我允许用户上传各种格式的文件目前仅处理 CSV 格式然后使用包含的数据来绘制图表Pandas http pandas pydata org 图书馆我决定将图形渲染到模板的最简单方法是为图形创建特定视图然后将图像从
如何搜索例程的内容/（SP-触发函数）

我需要在数据库内所有例程的例程主体存储过程函数触发器中搜索文本我该怎么做 Thanks SELECT OBJECT NAME object id FROM sys sql modules WHERE definition LIKE
将 Django 中的所有视图限制为经过身份验证的用户

我是 Django 新手我正在开发一个项目该项目有一个登录页面作为其索引和一个注册页面其余页面都必须仅限于登录用户如果未经身份验证的用户尝试访问这些页面则必须将他她重定向到登录页面我看到 login required装饰器会将
django-rest-framework - POST 请求返回“不允许使用方法\”GET\”。”

我已经按照安装教程设置了 django rest auth 但我无法使用登录 API 端点当我发送包含正确信息的 POST 请求时我收到 405 状态错误响应为不允许方法 GET 但是当我导航到实际 URL 并从在线表单发布它时
如何在 Django 中执行 SELECT MAX？

我有一个对象列表如何运行查询来给出字段的最大值我正在使用这段代码 def get best argument self try arg self argument set order by rating 0 details except

随机推荐

javascript RegExp：如何匹配多行和closetag

var ex
根据与该元素的精确匹配，将数据附加到元素

给定以下 XML 作为输入 table table
为 ImageView 实现 GestureDetector

早上好我的 Activity 中有一个 ImageView 我settedOntOuchListner 到我的 ImageView 这意味着我为我的 ImageView 实现了该接口如下所示 public class mapActivi
MVC 错误“属于“System.Int32”类型，但必须属于“IEnumerable”类型。”[重复]

这个问题在这里已经有答案了我有一个这样的模型 public int ID get set public string MidName get set public string FirstName get set public strin
使用 GCC 强制自动矢量化

这是我非常简单的问题有了 ICC 我知道可以使用 pragmaSIMD 强制对编译器选择不矢量化的循环进行矢量化 GCC 中有类似的东西吗或者有计划在未来的版本中添加此功能吗非常相关用 Graphite 强制矢量化怎么样只要允许
Laravel 中“格式错误的 UTF-8 字符，可能编码错误”

我正在使用 Laravel 一个 PHP 框架编写移动服务并将数据返回JSON格式在数据结果中有一些字段被编码为UTF 8 以下声明 return JsonResponse create data 返回以下错误 InvalidArgu
LIMIT 中带有占位符的 PDOexecute() 语句[重复]

这个问题在这里已经有答案了 pageMin page 10 10 reponse bdd gt prepare SELECT pseudo message FROM minichat ORDER BY id DESC LIMIT 10 re
Chrome 扩展：正确添加具有非持久背景页面的上下文菜单条目

我正在开发一个简单的链接共享扩展插板可读性美味等并且有一个关于如何正确处理上下文菜单项的问题在我的非持久后台页面中我调用chrome contextMenus create and chrome contextMenus onC
r 文章包在最近更新后停止编译

当我今年夏天提交一篇文章时以下代码运行良好但在最近的更新后不再运行 R 版本 4 2 2 2022 10 31 R Studio 2022 12 0 Build 353 文章 0 24 title test author name JB
HLS 视频无法在模拟器和真实设备上播放

我正在开发一个 iOS 应用程序它可以简单地播放实时流 HLS 视频我的问题是我已经使用 AVPlayer 和视图控制器来设置游乐场所有事情都工作正常视图控制器已启动播放器也已启动但流媒体未启动该流是一种 m3u8 类型在
运算符“==”不能应用于“方法组”和“字符串”类型的操作数

我在此代码的第三行收到运算符无法应用于类型为方法组和字符串的操作数错误我不知道为什么 where PRIORITiesItem Prioid null PRIORITiesItem Prioid Contains 1 SIT
使用 scriptlet 调用 onClick 函数

我想使用 scriptlet 编写单击执行测试按钮时调用的函数此代码不起作用这是我的jsp代码
django：根据对象计数计算百分比

我有以下型号 class Question models Model question models CharField max length 100 class Option models Model question models Fo
是否可以在多个 GAE 应用程序之间共享数据存储

我喜欢在其他 GAE 应用程序中使用一个 GAE 应用程序中保存的数据基本上在 Google App Engine Python 开发和生产中的多个 Web 应用程序之间共享数据存储如果可能的话还可以 http localhost ah
提取电话号码正则表达式

如何从文本文件中提取电话号码 x lt c Mr Bean bought 2 tickets 2 613 213 4567 or 5555555555 call either one 43 Butter Rd Brossard QC K0A
mySQL：连接三个表 - 如何？

我的应用程序中有以下查询它运行良好但我需要它还包含与每个制造商关联的产品数量当前查询 SELECT FROM manufacturers JOIN languages ON manufacturers lang languages i
MySQL 中选定值的逗号分隔字符串

我想在 MySQL 中将选定的值转换为逗号分隔的字符串我的初始代码如下 SELECT id FROM table level WHERE parent id 4 其产生 5 6 9 10 12 14 15 17 18 779 我想要的输出
jQuery 奇怪的插入问题

我有一个列表我不想通过 javascript 中断它来添加标题 From ul li 1 li li class afterthis 2 li li 3 li li 4 li ul To ul li 1 li li class after
VueJS 动态属性名称不更新值

我正在尝试实现一个关联数组并结合访问值中的属性键基于活动对象的值 li li
为什么迭代大型 Django QuerySet 会消耗大量内存？

该表包含大约一千万行 for event in Event objects all print event 这会导致内存使用量稳定增加到 4 GB 左右此时行会快速打印第一行打印之前的漫长延迟让我感到惊讶我预计它几乎会立即打印我也尝

为什么迭代大型 Django QuerySet 会消耗大量内存？

为什么迭代大型 Django QuerySet 会消耗大量内存？ 的相关文章

随机推荐

热门标签

为什么迭代大型 Django QuerySet 会消耗大量内存？的相关文章