为什么PostgresQL查询性能随着时间的推移而下降，但重建索引时又恢复了

2024-05-26

根据这个page http://www.postgresql.org/docs/current/static/indexes-examine.html在手册中，indexes don't need to be maintained。然而，我们运行的 PostgresQL 表的连续速率为updates, deletes and inserts随着时间的推移（几天），查询会显着下降。如果我们删除并重新创建索引，查询性能就会恢复。

我们正在使用开箱即用的设置。
我们测试中的表目前一开始是空的，后来增长到了 50 万行。它有一个相当大的行（很多文本字段）。

We are searching based of an index, not the primary key（我已经确认索引正在被使用，至少在正常情况下）

该表被用作单个进程的持久存储。在 Windows 上使用 PostgresQL 和 Java 客户端。

我愿意放弃insert and update performance以保持查询性能。

我们正在考虑重新构建应用程序，以便将数据分布在各种动态表中，从而允许我们定期删除和重建索引而不影响应用程序。然而，与往常一样，要让它发挥作用需要时间紧迫，我怀疑我们在配置或使用中缺少一些基本的东西。

我们考虑过forcing vacuuming and rebuild to run at certain times，但我怀疑locking period for such an action would cause our query to block。这可能是一个选项，但存在一些实时（3-5 秒的窗口）影响，需要对我们的代码进行其他更改。

附加信息：表和索引

CREATE TABLE icl_contacts
(
  id bigint NOT NULL,
  campaignfqname character varying(255) NOT NULL,
  currentstate character(16) NOT NULL,
  xmlscheduledtime character(23) NOT NULL,
...
25 or so other fields.  Most of them fixed or varying character fiel  
...
  CONSTRAINT icl_contacts_pkey PRIMARY KEY (id)
)
WITH (OIDS=FALSE);
ALTER TABLE icl_contacts OWNER TO postgres;

CREATE INDEX icl_contacts_idx
  ON icl_contacts
  USING btree
  (xmlscheduledtime, currentstate, campaignfqname);

Analyze:

Limit  (cost=0.00..3792.10 rows=750 width=32) (actual time=48.922..59.601 rows=750 loops=1)
  ->  Index Scan using icl_contacts_idx on icl_contacts  (cost=0.00..934580.47 rows=184841 width=32) (actual time=48.909..55.961 rows=750 loops=1)
        Index Cond: ((xmlscheduledtime < '2010-05-20T13:00:00.000'::bpchar) AND (currentstate = 'SCHEDULED'::bpchar) AND ((campaignfqname)::text = '.main.ee45692a-6113-43cb-9257-7b6bf65f0c3e'::text))

是的，我知道有各种各样的事情we could do to normalize and improve the design of this table。我们可能可以使用其中一些选项。

我这个问题的重点是关于理解how PostgresQL is managing the index and query over time (understand why, not just fix)。如果要重新进行或大幅重构，就会有很多变化。

只要您根据所需的性能配置它，自动真空吸尘器就可以解决问题。

笔记： VACUUM FULL：这将重建表统计信息并回收磁盘空间负载。它锁定整个表。

VACUUM：这将重建表统计信息并回收一些磁盘空间。它可以与生产系统并行运行，但会生成大量 IO，从而影响性能。

ANALYZE：这将重建查询计划器统计信息。这是由 VACUUM 触发的，但可以单独运行。

More 详细注释可以在这里找到 http://www.postgresql.org/docs/current/static/routine-vacuuming.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么PostgresQL查询性能随着时间的推移而下降，但重建索引时又恢复了的相关文章

PostgreSQL Age() 函数：在不同月份登陆时出现不同/意外的结果

今天我在 PostgreSQL 9 6 中运行此查询时遇到了无法解释的结果 SELECT age 2018 06 30 2018 05 19 AS one age 2018 07 01 2018 05 20 AS two 两列的预期结果
PostgreSQL 函数/存储过程 CURRENT_TIMESTAMP 不变

我想跟踪函数内的执行时间作为示例我有以下状态跟踪表 CREATE TABLE status table run id numeric NOT NULL start ts timestamp 6 without time zone NOT
在电话字段的前 3 个字符（区号）上创建索引？

我有一个 Postgres 表其中电话字段存储为varchar 10 但我们经常搜索区号例如 select from bus t where bus phone like 555 我想创建一个索引来促进这些搜索但在尝试时出现错误 CR
去除字符串的最佳方法是什么？

我需要具有最佳性能的想法来删除过滤字符串 I have string Input view 512 3 159 删除 view 和的最佳性能方法是什么和引号我可以做这个 Input Input Replace view Replac
如何找到 IIS 在负载/性能测试期间模拟的平均并发用户数？

我正在使用 JMeter 进行负载测试我正在练习通过简单地增加我的分布式 JMeter 测试用例中的线程数并启动测试来查找我们的网络服务器可以处理的最大并发线程用户数量然后我突然意识到虽然 MAX 数字可能有用但REAL我的网
如何在 pgAdmin III 中为多个表生成 CREATE 脚本？

在 pgAdmin III 中您可以右键单击表格 scripts 创建脚本从 SQL 编辑器保存脚本如果必须对多个表执行此操作是否有一种方法可以将脚本合并到一个文件中除了手动复制粘贴它们之外如果这可以通过 psql 提示符或 p
如何有效地从 DB2 表中删除所有行

我有一个大约有 50 万行的表我想删除所有行如果我做简单的delete from tbl 事务日志已满我不关心这种情况下的事务无论如何我都不想回滚我可以删除许多事务中的行但是有更好的方法吗如何有效地从 DB2 中的表中删除所有
只读有运行时开销吗？

出于某种原因我一直认为readonly字段有与其相关的开销我认为这是 CLR 跟踪是否存在readonly字段是否已初始化这里的开销是一些额外的内存使用量用于跟踪状态以及分配值时的检查也许我这么认为是因为我不知道readonly字
Java ByteBuffer 性能问题

在处理多个千兆字节文件时我注意到一些奇怪的事情似乎使用文件通道从文件读取到使用 allocateDirect 分配的重用 ByteBuffer 对象比从 MappedByteBuffer 读取要慢得多事实上它甚至比读取到字节还要慢使用
如何使用PostGIS将多边形数据转换为线段

我在 PostgreSQL PostGIS 中有一个多边形数据表现在我需要将此多边形数据转换为其相应的线段谁能告诉我如何使用 PostGIS 查询进行转换提前致谢一般来说将多边形转换为线可能并不简单因为没有一对一的映射 http
在Python列表中交换元素的最快方法

在Python中交换两个列表元素是否有比 L a L b L b L a 或者我必须求助于Cython http cython org or Weave http www scipy org Weave或类似的看起来 Python 编译器
如何使用 typeorm 在 postgres 中保存 json 对象数组

我正在尝试在 postgres 中保存 jsonb 类型的对象数组 Entity Column type jsonb array true nullable true testJson object 我在邮递员中发送的json testJs
如何在不运行 PostgreSQL 服务器的情况下初始化 PostgreSQL 数据库

在初始化脚本中我想初始化 PostgreSQL 目录但在此阶段不需要也不希望正在运行的 PostgreSQL 服务器如果我只是创建集群作为用户postgres initdb D 但是我还需要创建 PostgreSQL 角色创
wal_keep_segments 为什么是最小值而不是最大值？

根据docs http www postgresql org docs current static runtime config replication html wal keep segments integer 指定过去日志的最小数量
无法“安装”plpython3u - postgresql

我正在尝试在 postgresql 中使用 python 语言像这样的事情 create or replace function test a integer returns integer as if a 2 0 return even
基于代理的模拟：性能问题：Python vs NetLogo & Repast

我正在 Python 3 中复制一小段 Sugarscape 代理模拟模型我发现我的代码的性能比 NetLogo 慢约 3 倍这可能是我的代码的问题还是Python的固有限制显然这只是代码的一个片段但 Python 却花费了三分
执行带有 EXCEPTION 的 PostgreSQL 查询会导致两条不同的错误消息

我有一个 PostgreSQL 查询其中包含事务和列重复时的异常 BEGIN ALTER TABLE public cars ADD COLUMN top speed text EXCEPTION WHEN duplicate colum
比较两个 postgres 转储文件

如何比较 postgres 转储文件我有两个转储文件 dump1 和 dump2 我想比较这两个转储文件任何帮助将不胜感激谢谢如果使用 Windows 则可以使用 Beyond Compare 如果使用 linux fedora 则
使用间隔阈值对不同的连续时间戳记录进行分组

我有一系列间歇性间隔的带有时间戳的 GPS 坐标我正在使用 PostGIS 将它们渲染到地图画布上为了渲染它们需要使用 PostGIS 中的 ST MakeLine 聚合函数将点聚合成线从而在地图上留下 GPS 数据丢失的间隙数据
使用 postgres 和 node js 在单个语句中执行多个查询

我需要在像这样的单个语句中执行插入和删除查询 INSERT INTO COMPANY ID NAME VALUES 1 Paul DELETE FROM COMPANY WHERE ID 12 这是我用于执行查询的 node js 代码 p

随机推荐

如何从包含许多表的 Excel 工作表中解析数据帧（使用 Python，可能使用 Pandas）

我正在处理布局糟糕的 Excel 工作表我正在尝试解析这些工作表并将其写入数据库每个工作表可以有多个表尽管这些可能的表格的标题是已知的但哪些表格将位于任何给定的工作表上它们在工作表上的确切位置也不是已知的表格不以一致的方式对齐
如何使用Python从Excel复制图表并将其作为图表粘贴到powerpoint（而不是图像）中

我有一个excel文件它根据可用数据生成图表图表名称是thisChart 我想复制thisChart从 excel 文件到 ppt 文件现在我知道有两种方法可以做到这一点即VBA和python 使用win32com client V
Android：RecyclerView 项目上下文菜单问题

我正在尝试实现一个 RecyclerView 单击每个项目时都会弹出一个上下文菜单我已引用此的答案评论question https stackoverflow com questions 26466877 how to create
如何使用 R markdown 和 bookdown 将图形列表和表格列表添加到目录中

我有一份报告 pdf 输出我想在附录中添加参考书目图表列表和表格列表我希望这三个元素出现在目录中我添加参考书目通过增加bibliography bibliography bib到我的 yaml 标头我直接用 LaTex 添加的图形
使用命名空间

有什么区别 using System and using namespace System 是同一件事吗 thanks 是的有区别第一个无法编译也许你的意思是这样的 using
如何根据python中的文件名检索每个文件的datemodtime？

我当前的流程涉及循环遍历源目录并将每个文件的名称添加到 python 中的数据帧中我也想获取每个文件的修改日期 import datetime import os import pandas as pd set src directory
如何捕获 PL/SQL 块中的唯一约束错误？

假设我有一个 Oracle PL SQL 块它将一条记录插入表中并且需要从唯一约束错误中恢复如下所示 begin insert into some table some values exception when update som
有人可以解释一下这段代码吗？尤其是“函数x和[[x]]”的作用？

这是 R 中的代码我无法理解其作用function x and qdata x 在这行代码中有人能给我详细解释一下吗这段代码不是我写的谢谢 outs lapply names qdata 12 35 function x hist
如何通过实体键添加/删除与实体框架的多对多关系？

I tried using Entities e new Entities EntityKey key new EntityKey Entities Users UserId 20 User user new User EntityKey
JSch：如何使用 ssh 密钥 ssh 到服务器

我想从另一个 ssh 服务器后面 ssh 进入服务器网关服务器需要用户名密码我可以做到这一点我正在使用隧道进入下一台服务器但这需要only一个 ssh 密钥我已经通过 PuTTY 生成了密钥因此它存在于我的用户名中但我不确定
使用 C# 和反射打印完整的对象图

我有一个复杂的对象 class A int Field1 int field2 property ClassB ClassB property classC classC etc etc 我想使用反射打印完整的对象图有什么好的代码吗一种
使用 jQuery 将所有带有类的对象加载到数组中

我的页面上有一堆带有 testClass 类的 div 我想将它们加载到数组中然后检查数组的大小但它不起作用 myArray testClass alert myArray count 怎么了你有 myArray testClass
-[NSCFString objectAtIndex:]：无法识别的选择器

我有一个小问题在谷歌中找不到 UITableView工作正常直到我开始滚动 Error Message NSCFString objectAtIndex unrecognized selector sent to instance 0x
sh read 命令会吃掉输入中的反斜杠吗？

也许最容易用一个例子来解释 echo echo while read in do echo in done 看来read命令将输入中的反斜杠解释为转义符并删除它们我需要逐行处理文件而不更改其内容并且我不知道如何停止在这里智能读取有任
用户无法安装单击一次应用程序

我有一个相对简单的支持应用程序我选择通过单击一次将其部署给我们的支持人员我认为它仍然被称为 Click Once 我在 VS2008 中使用项目属性的发布选项卡一些用户已成功点击该网址下载并运行该应用程序某一特定用户不能他安装了
如何使用 Anaconda Python 执行 .py 文件？

我刚刚在我的 Windows 计算机上下载并安装了 Anaconda 但是我在使用命令提示符执行 py 文件时遇到问题如何让我的计算机了解 python exe 应用程序位于 Anaconda 文件夹中以便它可以执行我的 py 文件
Java 8 中函数类型全等 lambda 表达式的用法

我对的定义和用法感到困惑 Stream collect Supplier
如何在Python中将字符串转换为包含一个元素的列表[重复]

这个问题在这里已经有答案了我有一个字符串我想将其转换为其中只有一个元素的列表 a abc print list a output a b c Expected o p abc 正确的做法是什么只需使用 a abc b a print
mongodb 通配符匹配特定键的所有值[重复]

这个问题在这里已经有答案了我试图弄清楚如何匹配一个键并返回该键的所有值是否可以将值作为通配符给出我想在值上使用通配符返回该特定键的所有内容 db collection find key 我还希望这也能返回整个集合其中的键也与通配符值
为什么PostgresQL查询性能随着时间的推移而下降，但重建索引时又恢复了

根据这个page http www postgresql org docs current static indexes examine html在手册中 indexes don t need to be maintained 然而我们运

为什么PostgresQL查询性能随着时间的推移而下降，但重建索引时又恢复了

为什么PostgresQL查询性能随着时间的推移而下降，但重建索引时又恢复了 的相关文章

随机推荐

热门标签

为什么PostgresQL查询性能随着时间的推移而下降，但重建索引时又恢复了的相关文章