postgresql：偏移+限制变得非常慢

2024-01-09

我有一张桌子tmp_drop_ids用一列，id，以及 330 万个条目。我想迭代该表，每 200 个条目执行一些操作。我有这个代码：

LIMIT = 200
for offset in xrange(0, drop_count+LIMIT, LIMIT):
    print "Making tmp table with ids %s to %s/%s" % (offset, offset+LIMIT, drop_count)
    query = """DROP TABLE IF EXISTS tmp_cur_drop_ids; CREATE TABLE tmp_cur_drop_ids AS
    SELECT id FROM tmp_drop_ids ORDER BY id OFFSET %s LIMIT %s;""" % (offset, LIMIT)
    cursor.execute(query)

一开始运行得很好（大约 0.15 秒生成 tmp 表），但偶尔会变慢，例如大约 300k 票证开始需要 11-12 秒来生成此 tmp 表，然后再次大约 400k。基本上看起来不可靠。

我将在其他查询中使用这些 id，因此我认为放置它们的最佳位置是在 tmp 表中。有没有更好的方法来迭代这样的结果？

请改用光标。使用 OFFSET 和 LIMIT 非常昂贵 - 因为 pg 必须执行查询、处理和跳过 OFFSET 行。 OFFSET 就像“跳过行”，这是昂贵的。

光标文档 http://www.postgresql.org/docs/9.1/static/sql-declare.html

游标允许对一个查询进行迭代。

BEGIN
DECLARE C CURSOR FOR SELECT * FROM big_table;
FETCH 300 FROM C; -- get 300 rows
FETCH 300 FROM C; -- get 300 rows
...
COMMIT;

也许您可以使用服务器端游标，而无需显式使用 DECLARE 语句，只需支持psycopg http://initd.org/psycopg/docs/usage.html（有关服务器端光标的搜索部分）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

performance

postgresql

LIMIT

offset

postgresql：偏移+限制变得非常慢的相关文章

SQL 删除表并重新创建并保留数据

在我们最初的设计中我们搞砸了表中的外键约束现在表已充满数据我们无法在不删除表中所有记录的情况下更改它我能想到的唯一解决方案是创建一个备份表并将所有记录放在那里然后删除所有记录更改表并开始将它们添加回来还有其他更好的想法吗
postgreSql 中特定时间后表更新

我已经在 postgres 中创建了表现在我想在特定时间例如 1 小时后更新一行我看到很多问题例如 https dba stackexchange com questions 56424 column auto updated a
Mysql 中 UNION 子句的替代方案

我有两张桌子表 a 表 b table a ID 1 2 3 4 5 7 table b ID 2 3 4 5 6 我必须得到这样的输出而无需UNION命令 ID 1 2 3 4 5 6 7 注意我有一个联合解决方案 select fr
独立对列进行排序，使得所有空值都位于每列的最后

这是一个名为的示例表animal name color fox brown fox red dog gold 现在我想要的是这样的结果 fox dog brown gold red 名称应该是结果的列不同颜色值作为行我的第一个想法是
在sqlite SQL语句中与order by子句结合使用limit

下面的两条 SQL 语句总是会产生相同的结果集吗 1 SELECT FROM MyTable where Status 0 order by StartTime asc limit 10 2 SELECT FROM SELECT FROM
是否有适用于所有数据库的标准sql

如下所示不同数据库的语法有所不同是否存在适用于所有数据库的标准方法有没有什么工具可以将任意sql转换为任意sql SQL Server 2005 CREATE TABLE Table01 Field01 int primary key
MySQL 按重复项从上到下排序

我有一个lammer问题因为我不是mysql专业人士我有类似的字段 id color 1 red 2 green 3 yellow 4 green 5 green 6 red 我想按重复项进行分组最常见的重复项先进行分组所以应该这样
为什么C++代码执行速度比java慢？

我最近用 Java 编写了一个计算密集型算法然后将其翻译为 C 令我惊讶的是 C 的执行速度要慢得多我现在已经编写了一个更短的 Java 测试程序和一个相应的 C 程序见下文我的原始代码具有大量数组访问功能测试代码也是如此 C 的
测量窗口偏移

有没有一种方法可以测量 jQuery 中窗口的偏移量以便我可以比较固定元素和相对定位元素的位置我需要能够知道窗口滚动了多远以便我可以使用该图来计算固定元素的高度相对于视口顶部和相对对象的高度相对于顶部之间的差异文件的内容
jQuery mousemove 性能 - 节流事件？

我们面临着与 mousemove 连接的 jQuery 事件传播性能问题我们有一个屏幕填充画布需要跟踪用户是否在其上拖动鼠标因此我们在该对象上添加了一个鼠标移动侦听器如下所示 ourCanvas on mousemove funct
用更轻的解决方案替换完整的 ORM（JPA/Hibernate）：推荐的加载/保存模式？

我正在开发一个新的 Java Web 应用程序并且正在探索保存数据的新方法对我来说是新方法我主要有 JPA 和 Hibernate 的经验但是除了简单的情况之外我认为这种完整的 ORM 可能会变得相当复杂另外我不太喜欢和他们
初级SQL部分：避免重复表达式

我对 SQL 完全陌生但我们可以说StackExchange 数据浏览器 https data stackexchange com 我只想按信誉列出前 15 位用户我写了这样的内容 SELECT TOP 15 DisplayName I
隐藏类以及 {} 对象与自定义构造函数之间的等效性 (v8)

鉴于这篇文章 http richardartoul github io jekyll update 2015 04 26 hidden classes html http richardartoul github io jekyll upd
无法“安装”plpython3u - postgresql

我正在尝试在 postgresql 中使用 python 语言像这样的事情 create or replace function test a integer returns integer as if a 2 0 return even
PESSIMISTIC_WRITE 是否锁定整个表？

只是为了确保我正确理解事情是如何运作的 If I do em lock employee LockModeType PESSIMISTIC WRITE 它会仅阻止该实体吗 employee 或整个表Employees 如果重要的话我正在谈
Java 11 中使用堆栈跟踪的速度明显慢于 Java 8

我正在比较 JDK 8 和 11 的性能jmh https openjdk java net projects code tools jmh 1 21 当我遇到一些令人惊讶的数字时 Java version 1 8 0 192 vendor
是否可以提高 Mongoexport 速度？

我有一个 1 3 亿行的 MongoDB 3 6 2 0 集合它有几个简单的字段和 2 个带有嵌套 JSON 文档的字段数据以压缩格式 zlib 存储我需要尽快将其中一个嵌入字段导出为 JSON 格式然而 mongoexport 需
如何使用sql作为xml路径('')但保留回车符

我有下面的代码 select select cast Narrative as Varchar max char 13 from officeclientledger where ptmatter matter and ptTrans 4
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
Draggable JS Bootstrap 模式 - 性能问题

对于工作中的项目我们在 JavaScript 中使用 Bootstrap Modal 窗口我们想让一些窗口可移动但我们遇到了 JQuery 的性能问题 myModal draggable handle modal header Exa

随机推荐

dev_appserver.py app.yaml 产生： ImportError：导入多数组 numpy 扩展模块失败

我运行这个命令 dev appserver py app yaml 我收到一个错误 Traceback most recent call last File C Users sehrlich AppData Local Google Clo
Javascript：长度方法有效吗？

我正在做一些 javascript 编码我想知道 length 方法是否是预先计算的或者由 JS 引擎记住所以问题是如果我经常检查数组长度并且假设我不更改它通过闭包使其不可变我是否应该预先计算 length 方法并将其存储
如何为生产中的网站设置代理设置

我用 Angular 开发了一个网站并在 proxy conf js 文件中有以下代理设置 const proxyConfig context web api webclients target https 10 109 102 109
Python Pandas 按二级索引（或任何其他级别）切片多索引

有很多关于按级别范围切片多索引的 level 0 的帖子1 http pandas pydata org pandas docs stable advanced html using slicers 但是我找不到解决我的问题的方法也就是
Python urlparse：小问题

我正在制作一个解析 html 并从中获取图像的应用程序使用 Beautiful Soup 解析很容易下载 html 和图像也可以使用 urllib2 我确实在使用 urlparse 从相对路径中创建绝对路径时遇到问题这个问题最好用一个
用于查找 UNIX 计算机上 CPU 信息的命令

您知道是否有一个 UNIX 命令可以告诉我 Sun OS UNIX 机器的 CPU 配置是什么我也在尝试确定内存配置有没有 UNIX 命令可以告诉我这一点 AFAIK 没有标准的 Unix 命令我没有使用过Sun OS 但是在Linu
jQuery 轮播卡住（Twitter Bootstrap）

我在这里实现了 Twitter Bootstrap 的 Carousel jQuery 插件 http zarin me circle Five dashboard html http zarin me circlefive dashboa
尝试了解将 {} 放在管道运算符 (%>%) 之后的作用

In this tutorial https jennybc github io purrr tutorial ls01 map name position shortcuts html 有如下代码 library repurrrsive
如何在 Swift iOS 中获取给定国家/地区名称的国家/地区电话代码？

我正在做一个项目我需要将选定的电话号码用户已从电话联系人列表中选择发送到以下格式的服务器不带零或加数字的国际代码所以我需要处理很多情况没有国际代码的数字带有零的数字带有加号的数字带有两个零的数字等问题是当我有一个前所
Cuda Clang 和 OS X Mavericks

我目前正在尝试在 MacOS 10 9 上使用 Cmake 构建 Cuda 项目我的C和C 编译器是gcc 但似乎自Mavericks gcc和g 链接到clang以来 CUDA不支持clang 有没有人找到一个好的解决方案来使用真正的
phpMyAdmin 中的 MySQL 解析错误（“此类子句先前已解析”）

我有以下 SQL 查询 SELECT SUM tmp mval tmp timekey FROM SELECT teghamas MAX arzheq as mval ceil UNIX TIMESTAMP zhamanak 60 60 A
按键排序的 NSDictionary 实例的快速枚举

Overview 我正在使用快速枚举来迭代 NSDictionary 实例我希望根据键的升序枚举 NSDictionary 实例但情况似乎并非如此我想做的事我希望能够使用快速枚举按键的升序遍历 NSDictionary 实例 Not
从 .NET C# 中的用户控件在父窗口上引发事件

标题基本上已经解释了这个问题当应用程序首次运行时我将用户控件加载到主窗口中我想要做的是当单击用户控件上的按钮时在父窗口上引发事件那么如何从用户控件上的button1 Click 引发父事件这个问题似乎没有在任何地方得到完整的端到端
秒表的 Elapsed Ticks 属性的差异

ElapsedTicks 和 Elapsed Ticks 是 Stopwatch 的属性我认为应该是相同的如果它们相同为什么它们应该给出不同的输出 Code Stopwatch spwt Stopwatch StartNew spwt
我应该在哪个元素中包含
的注释？

我正在开发一个实现 Disqus 评论的博客并且我正在努力尽可能多地使用 HTML5 语义标记这是一个例子
WooCommerce 订阅取消电子邮件发送给客户

我正在使用 WooCommerce 订阅我已经自定义了取消订阅模板当客户取消订阅时它可以工作将自定义电子邮件发送给管理员但我无法让它向客户发送取消电子邮件我尝试过改编 stackoverflow 上找到的代码 Send emai
如何访问 axios 请求之外的值？

很简单的问题当我在第 6 行的 jsonPayload 上运行 console log 时我看到了预期的输出当我在最后一行的 jsonPayload 上再次运行 console log 时它返回一个空的如何在初始请求之外访问有效负
如何在scala中设置类型参数绑定来为数字创建泛型函数？

我想创建一个适用于所有数字类型的求和函数这有效 object session def mapReduce A f A gt A combine A A gt A zero A inc A a A b A implicit num Nume
如何在 Xcode/iOS 中设置 UIView 的标识符以调试自动布局？

在 WWDC 2012 掌握自动布局的最佳实践的一次演讲中演示者表示您可以在 Xcode 中设置 UIView 标识符来帮助调试自动布局这似乎是一个非常好的主意但是在我的 iOS 项目的 Xcode 4 5 1 中我无法看到设置
postgresql：偏移+限制变得非常慢

我有一张桌子tmp drop ids用一列 id 以及 330 万个条目我想迭代该表每 200 个条目执行一些操作我有这个代码 LIMIT 200 for offset in xrange 0 drop count LIMIT LIM

postgresql：偏移+限制变得非常慢

postgresql：偏移+限制变得非常慢 的相关文章

随机推荐

热门标签

postgresql：偏移+限制变得非常慢的相关文章