Postgres jsonb 使用更大的运算符在数组中搜索（使用 jsonb_array_elements）

2024-05-26

我尝试寻找解决方案，但没有找到适合我的情况的任何内容......

这是数据库声明（简化）：

CREATE TABLE documents (
    document_id int4 NOT NULL GENERATED BY DEFAULT AS IDENTITY,
    data_block jsonb NULL
);

这是插入的一个例子。

INSERT INTO documents (document_id, data_block)
VALUES(878979, 
    {"COMMONS": {"DATE": {"value": "2017-03-11"}},
     "PAYABLE_INVOICE_LINES": [
         {"AMOUNT": {"value": 52408.53}}, 
         {"AMOUNT": {"value": 654.23}}
     ]});
INSERT INTO documents (document_id, data_block)
VALUES(977656, 
    {"COMMONS": {"DATE": {"value": "2018-03-11"}},
     "PAYABLE_INVOICE_LINES": [
         {"AMOUNT": {"value": 555.10}}
     ]});

我想搜索其中 PAYABLE_INVOICE_LINES 之一的行值大于 1000.00 的所有文档

我的查询是

select *
from documents d
cross join lateral jsonb_array_elements(d.data_block -> 'PAYABLE_INVOICE_LINES') as pil 
where (pil->'AMOUNT'->>'value')::decimal >= 1000

但是，由于我想限制为 50 个文档，因此我必须对 document_id 进行分组并将结果限制为 50 个。

对于数百万个文档，此查询非常昂贵……100 万个文档需要 10 秒。

您有什么想法可以取得更好的表现吗？

Thanks

代替cross join lateral use where exists:

select *
from documents d
where exists (
  select 1
  from jsonb_array_elements(d.data_block -> 'PAYABLE_INVOICE_LINES') as pil
  where (pil->'AMOUNT'->>'value')::decimal >= 1000)
limit 50;

Update

还有另一种方法，更复杂但也更有效。

创建函数返回最大值JSONB数据，像这样：

create function fn_get_max_PAYABLE_INVOICE_LINES_value(JSONB) returns decimal language sql as $$
  select max((pil->'AMOUNT'->>'value')::decimal)
  from jsonb_array_elements($1 -> 'PAYABLE_INVOICE_LINES') as pil $$

在此函数上创建索引：

create index idx_max_PAYABLE_INVOICE_LINES_value
  on documents(fn_get_max_PAYABLE_INVOICE_LINES_value(data_block));

在查询中使用函数：

select *
from documents d
where fn_get_max_PAYABLE_INVOICE_LINES_value(data_block) > 1000
limit 50;

在这种情况下，将使用索引，并且在大量数据上查询会更快。

PS：通常limit配对有意义order by.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

postgresql

jsonb

Postgres jsonb 使用更大的运算符在数组中搜索（使用 jsonb_array_elements）的相关文章

如何在 PostgreSQL 函数中声明行类型数组？

我正在尝试创建一个 PostgreSQL 函数在用它做更多事情之前我将循环查询的行并将其中一些存储在数组中如何创建行类型数组 CREATE OR REPLACE FUNCTION forExample RETURNS integer
为什么我的 SQL 占位符没有被替换（使用 Go pq）？

根据文档我正在这样做 var thingname string asdf var id int err database QueryRow SELECT id from things where thing thingname Scan
如何在 PostgreSql 的预订表中找到第一个空闲时间

预订表包含预订开始日期开始时间和持续时间工作日的开始时间为工作时间 8 00 18 00 以半小时为增量持续时间也以每天半小时为增量 CREATE TABLE reservation startdate date not null s
如何使用 Dapper 从 .NET 7 执行 Postgresql 函数，而不列出所有参数的数据类型

我正在尝试将我的 NET 5 Web API 代码传输到 NET 7 我有一个名为的单例服务DataManager它实现了接口IDataManager 其中一项功能是Execute还有其他 C 函数称为 Get GerMany 以及 In
CREATE VIEW 指定的列名多于列

如果我在 PostgreSQL 9 4 8 中运行以下语句我会收到以下错误消息 CREATE VIEW 指定的列名多于列但为什么没有f1返回一个包含 5 列的表格不应该v1也有 5 列吗另外如果我从第一个中删除演员阵容SELEC
Ansible 创建可以访问所有表的 postgresql 用户？

这应该很简单我想要创建一个 Ansible 语句来创建一个 Postgres 用户该用户具有特定数据库的连接权限以及对该特定数据库中所有表的选择插入更新删除权限我尝试了以下方法 name Create postgres user
在 Mac 中运行 Postgresql：数据库“postgres”不存在 [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我按照这些说明让 postgresql 在 mac 上运行请注意我使用 Homebrew 进行安装并且当前可通过brew安装的版本是 9 2 1
与 PostgreSQL CTE 的一般并行性

我正在处理一些大数据并且在查询中获取并行计划是必要的我也很喜欢使用 CTE 来表达我的查询但根据 PostgreSQL 的文档我不太确定 CTE 是否对并行性造成严重限制 Here https www postgresql org
Postgres 简单的“数据透视表”

如果我有一个这样的数据表 name type count test blue 6 test2 red 3 test red 4 我怎样才能查询它以获得一个表 name num red num blue test 4 6 test2 3 0
在电话字段的前 3 个字符（区号）上创建索引？

我有一个 Postgres 表其中电话字段存储为varchar 10 但我们经常搜索区号例如 select from bus t where bus phone like 555 我想创建一个索引来促进这些搜索但在尝试时出现错误 CR
无法安装 psycopg2 (pip install psycopg2)

我使用的是 MAC 和 python 版本 2 7 14 Collecting psycopg2 Could not fetch URL https pypi python org simple psycopg2 There was a p
防止 PostgreSQL 中专有名词的词干？

以其热情将词干标记转化为词位 http www postgresql org docs current interactive textsearch intro html PostgreSQL全文搜索引擎也减少了专有名词例如 essais
Google Cloud SQL - Postgresql 存储不断增长

我最近开始修补 Google Cloud SQL PostgreSQL 我创建了一个空数据库在 4 5 天的时间里其存储使用量已增长到超过 20GB 它一直在上升但数据库中没有数据它甚至没有被使用有谁知道会发生什么以及如何阻止它
如何从 PostgreSQL 中的时间戳列值提取一天中的时间（或小时）？

我正在尝试从 PostgreSQL 中的时间戳列中提取一天中的时间这是我的做法但是太糟糕了知道如何做得更好吗 SELECT date part hour date demande text hours date part min
如何 md5 所有列（无论类型如何）

我想创建一个 sql 查询或 plpgsql 它将 md5 所有给定的行无论类型如何但是在下面如果 1 为空则哈希为空 UPDATE thetable SET hash md5 accountid accounttype cre
使用 psycopg2 在 python 中执行查询时出现“编程错误：语法错误位于或附近”

我正在运行 Python v 2 7 和 psycopg2 v 2 5 我有一个 postgresql 数据库函数它将 SQL 查询作为文本字段返回我使用以下代码来调用该函数并从文本字段中提取查询 cur2 execute SELECT
比较两个 postgres 转储文件

如何比较 postgres 转储文件我有两个转储文件 dump1 和 dump2 我想比较这两个转储文件任何帮助将不胜感激谢谢如果使用 Windows 则可以使用 Beyond Compare 如果使用 linux fedora 则
使用间隔阈值对不同的连续时间戳记录进行分组

我有一系列间歇性间隔的带有时间戳的 GPS 坐标我正在使用 PostGIS 将它们渲染到地图画布上为了渲染它们需要使用 PostGIS 中的 ST MakeLine 聚合函数将点聚合成线从而在地图上留下 GPS 数据丢失的间隙数据
Postgres 中的输出 Inserted.id 等效项

我是 PostgreSQL 新手正在尝试将 mssql 脚本转换为 Postgres 对于合并语句我们可以使用冲突更新插入或不执行任何操作但我使用下面的语句不确定这是否是正确的方法 MSSQL代码 Declare tab2 New
使用 postgres 和 node js 在单个语句中执行多个查询

我需要在像这样的单个语句中执行插入和删除查询 INSERT INTO COMPANY ID NAME VALUES 1 Paul DELETE FROM COMPANY WHERE ID 12 这是我用于执行查询的 node js 代码 p

随机推荐

识别左侧由 delta 链接的簇，右侧由不同 delta 链接的簇

考虑排序后的数组a a np array 0 2 3 4 5 10 11 11 14 19 20 20 如果我指定了左增量和右增量 delta left delta right 1 1 这就是我期望的集群分配方式 a 0 2 3 4 5 1
如果满足条件，Angular JS 如何添加 CSS 类

我正在创建一个截断指令如果字符超过 10 我就会截断文本字符串然后它将显示我的目标是编写一个条件如果字符少于 10 个则删除如果有人对我如何实现此目标有任何想法我会坚持这一点并接受建议这是我的代码 var app angul
从 HTML 文件输入中删除“所有文件”选项

我在用
如何让 JQuery UI 自动完成与项目 id 配合使用

我在这里看到了这篇文章带有项目和 ID 的 jQuery UI 自动完成 https stackoverflow com questions 4815330 jquery autocomplete with item and id但我无法
Apache Beam：如何在使用重复数据删除功能时解决“ParDo 需要确定性密钥编码器才能使用状态和计时器”

我正在尝试使用 Apache Beam 的重复数据删除功能对来自 Google Cloud Pubsub 的输入消息进行重复数据删除但是我创建后遇到错误KV
替换 XSLT 中的特殊字符

我想从 XSLT 中的字符串中删除字母以外的字符例如
如何在浏览时检查客户端是否安装了 SQLNCLI10 提供程序？

我有一个 C 网站允许客户端从其 PC 直接连接到远程 SQL Server 数据库通过使用第 3 方 ActiveX 控件绕过 Web 服务器我最初使用的是SQLOLEDB提供商并且运行良好客户端位于内部网络中使用 Window
创建由线连接的 CSS3 圆圈

我必须在 CSS 中实现以下圆形和线条组合并且我正在寻找有关如何有效实现此功能的指示圆圈和线条应如下所示我能够这样实现圆圈 span step background ccc border radius 0 8em moz border
https登录的安全性？

我正在编写一个 Apple iOS 应用程序用于登录帐户并获取一些余额它使用纯 html 链接进行登录用户名和密码在运行时动态加载到登录链接我使用 Wireshark 嗅探了流量但在发送的任何包中都找不到用户名或密码我猜 htt
直接从表中选择和视图之间的区别

直接从表中选择数据或从视图中选择数据有什么区别每一种的最佳用途是什么根据微软的说法如果你使用的话会有性能优势indexedSQL Server 2000 2005 2008 中的视图索引视图可以通过以下方式提高查询性能1 可以预先计
onLocationChanged 回调是在哪个线程上进行的？主 UI 线程？

当在我的应用程序中进行此回调时我有相当多的工作要做通过 ORM 库和一些基于距离的计算读取和写入 SQL 数据库当然我担心不会阻塞主 UI 线程因此我一直在尝试未成功找出这是否是进行回调的线程如果是我打算在回调发生时触发的
Python - 函数无法在新线程中运行

我正试图杀死notepad exe使用此函数在 Windows 上进行处理 import thread wmi os print CMD Kill command called def kill c wmi WMI Commands not
如何在控制台程序中获取鼠标位置？

如何在 Windows 控制台程序中用 C 获取鼠标单击位置点击时返回鼠标位置的变量我想用简单的文本命令绘制一个菜单这样当有人点击时游戏就会注册它并知道位置我知道如何做我需要做的一切除了单击时获取鼠标位置您需要使用 Conso
为什么 `Pool.map()` 多处理中的内存消耗急剧增加？

我正在对 pandas 数据帧进行多重处理方法是将其拆分为多个数据帧这些数据帧存储为列表并且使用Pool map 我将数据帧传递给定义的函数我的输入文件约为 300 mb 因此小数据帧大约为 75 mb 但是当多处理运行时内存
为什么.net中的数组只实现IEnumerable而不实现IEnumerable？

我正在实现自己的 ArrayList 类当我意识到这一点时我感到很惊讶 public System Collections Generic IEnumerator
加载远程图像

在 Android 中最简单的方法是什么从远程服务器加载图像将其显示在 ImageView 中这是我在应用程序中实际使用的方法我知道它有效 try URL thumb u new URL http www example com
读取文件而不从操作系统页面缓存中逐出

这主要适用于 Linux 或者理想情况下适用于任何 POSIX 系统当我阅读以下页面时我正在寻找一种读取大量文件其中任何一个文件本身可能高达 1GB 的方法具有以下特征如果相关磁盘页面已在文件系统缓存中则使用该页面如果相关页面
随机排列

我无法找到一种随机洗牌元素的好方法std vector经过一些操作后恢复原来的顺序我知道这应该是一个相当简单的算法但我想我太累了由于我被迫使用自定义随机数生成器类我想我不能使用std random shuffle 无论如何这没有帮
在哪里可以找到 AWS Amplify Logger 日志

我目前正在开发一个使用 AWS Amplify 创建的 Web 应用程序我必须在其中实现日志记录基于AWS 放大文档 https docs amplify aws lib utilities logger q platform js有一
Postgres jsonb 使用更大的运算符在数组中搜索（使用 jsonb_array_elements）

我尝试寻找解决方案但没有找到适合我的情况的任何内容这是数据库声明简化 CREATE TABLE documents document id int4 NOT NULL GENERATED BY DEFAULT AS IDENTITY

Postgres jsonb 使用更大的运算符在数组中搜索（使用 jsonb_array_elements）

Postgres jsonb 使用更大的运算符在数组中搜索（使用 jsonb_array_elements） 的相关文章

随机推荐

热门标签

Postgres jsonb 使用更大的运算符在数组中搜索（使用 jsonb_array_elements）的相关文章