redshift select unique 返回重复值

2024-01-06

我有一个数据库，其中每个对象属性都存储在单独的行中。附加的查询不会在 redshift 数据库中返回不同的值，但在任何 mysql 兼容数据库中测试时可以按预期工作。

SELECT DISTINCT distinct_value 
FROM
( 
  SELECT
    uri,
    ( SELECT DISTINCT value_string 
      FROM `test_organization__app__testsegment` AS X 
      WHERE X.uri = parent.uri AND name = 'hasTestString' AND parent.value_string IS NOT NULL ) AS distinct_value 
  FROM `test_organization__app__testsegment` AS parent 
  WHERE     
    uri IN ( SELECT uri 
             FROM `test_organization__app__testsegment` 
             WHERE name = 'types' AND value_uri_multivalue = 'Document'
           )
) AS T 
WHERE distinct_value IS NOT NULL
ORDER BY distinct_value ASC
LIMIT 10000 OFFSET 0

这不是错误，行为是有意为之，但并不简单。

在 Redshift 中，您可以声明对表的约束，但 Redshift 不会强制执行它们，即如果您插入重复值，它允许重复值。这里唯一的区别是当你运行时SELECT DISTINCT针对没有声明主键的列进行查询，它将扫描整个列并获取唯一值，如果您在具有主键约束的列上运行相同的操作，它将只返回输出不执行唯一列表过滤。如果您插入重复的条目，这就是如何获得重复条目的方法。

为什么要这样做？ Redshift 针对大型数据集进行了优化，如果您不需要检查复制或插入的每一行的约束有效性，复制数据的速度会更快。如果您愿意，可以将主键约束声明为数据模型的一部分，但您需要通过删除重复项或以不存在这种方式的方式设计 ETL 来显式支持它。

这篇堆博客文章中包含具体示例的更多信息红移陷阱以及如何避免它们 https://blog.heapanalytics.com/redshift-pitfalls-avoid/

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

amazonredshift

redshift select unique 返回重复值的相关文章

插入多行并返回主键时 Sqlalchemy 的奇怪行为

插入多行并返回主键时我注意到一些奇怪的事情如果我在 isert 查询中添加使用参数值我会得到预期的行为但是当将值传递给游标时不会返回任何内容这可能是一个错误还是我误解了什么我的sqlachemy版本是0 9 4 下面如何重现错
Oracle 中的 SQL 调优 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有任何文章链接可以让我找到 SQL 调优 Oracle 的示例如果能用例子来解释那就太好了我需
SQLite HAVING 比较错误

我有一个测试 SQLite 表用于存储带有值的报告数据 CREATE TABLE IF NOT EXISTS test fact daily revenue date TEXT revenue NUMERIC product TEXT I
复选框上的数据绑定

我目前正在将数据从 SQL 数据库之一提取到我的应用程序中我可以让它适用于我的文本框和其他项目但是我似乎无法让它适用于复选框这是我正在使用的代码 DataTable dt new DataTable dt using SqlConn
查找 PostgreSQL 中所有范围集合的所有交集

我正在寻找一种有效的方法来查找时间戳范围集之间的所有交集它需要与 PostgreSQL 9 2 配合使用假设这些范围代表一个人可以见面的时间每个人都可以有一个或多个空闲时间范围我想找到all可以召开会议的时间段即所有人都有空的时间
如何将可视选择的文本通过管道传输到 UNIX 命令并将输出附加到 Vim 中的当前缓冲区

使用 Vim 我尝试将在可视模式下选择的文本通过管道传输到 UNIX 命令并将输出附加到当前文件的末尾例如假设我们有一个 SQL 命令例如 SELECT FROM mytable 我想做如下的事情
Oracle：使用SQL或PL/SQL查找动态SQL中的错误位置

如何在 PL SQL 或 SQL 中找到动态 SQL 语句中的错误位置从 SQL Plus 中我看到了错误的位置例如无效的 SQL DML 语句 SYS orcl gt SELECT 2 X 3 FROM 4 TABLEX 5 TA
使用 JSON 参数的 Postgres 批量 INSERT 函数

这是一个plpgsqlpostgres 的函数9 6 它试图INSERT一行如果插入没有失败由于违反键约束那么它会运行更多命令 CREATE FUNCTION foo int text text RETURNS void AS BEG
独立对列进行排序，使得所有空值都位于每列的最后

这是一个名为的示例表animal name color fox brown fox red dog gold 现在我想要的是这样的结果 fox dog brown gold red 名称应该是结果的列不同颜色值作为行我的第一个想法是
sql server 按组排名

问题看似简单但我却无法理解这是针对 sql 服务器的 what I have in a table What I need as a output cksum id cksum id 2162514679 204 2162514679
对多个数据库执行 SQL 查询

我知道我的帖子与该论坛中的其他帖子的标题非常相似但我真的找不到我需要的答案这是我的问题我的 Windows Server 上运行着 SQL Server 在我的 SQL Server 中我有大约 30 个数据库它们都具有相同的表和
为什么 SqlClient 在传递 SqlXml 时使用不必要的 XML 转换？

我有一个关于从 C 代码将 xml 数据类型传递给查询的问题首先这是 SQL Server 上的一个表 CREATE TABLE dbo XmlTable id int IDENTITY 1 1 NOT NULL dat xml NOT
使用 ADODB 连接从关闭的工作簿中检索数据。某些数据被跳过？

我目前正在编写一些代码可以通过 ADODB 连接访问单独的工作簿由于速度的原因我选择了这种方法而不是其他方法下面是我的代码 Sub GetWorksheetData strSourceFile As String strSQL As
内连接不重复，可以吗？

鉴于这两个表表 A1 有两行具有相同的值 a A1 a a 表 A2 有两行主键值为 A B 它们与 a 关联 A2 PK col2 A a B a 我想要的是 A1 和 A2 的连接并得到这个结果 a A a B 显然内连接在这里不起作
MyBatis：在一个查询中通过注释收集

我有一个 xml 映射器一个选择映射器和一个结果映射器它工作没有问题但我想使用注释我的映射器
月份增量查询

我想通过添加 1 个月来更新数据库中的月份但我不知道如何在以下存储过程查询中添加月份我不擅长 sql 请检查它 ALTER PROCEDURE dbo ChangePassword password varchar 20 epasswo
为什么我可以像调用实例方法一样调用类方法？

我正在查看这个例子 class SQLObject def self columns return columns if columns columns DBConnection execute2 lt lt SQL first SELEC
执行带有 EXCEPTION 的 PostgreSQL 查询会导致两条不同的错误消息

我有一个 PostgreSQL 查询其中包含事务和列重复时的异常 BEGIN ALTER TABLE public cars ADD COLUMN top speed text EXCEPTION WHEN duplicate colum
SQL - != 'NULL' 的解释

我的SSMS代码如下 Select top 50 From FilteredContact Where statuscode 1 and emailaddress1 NULL and telephone1 NULL and address1
索引数量越少意味着插入、更新和删除速度更快？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi

随机推荐

Angular 2 - 无法读取未定义的属性“AssetUrl”

我是新来的angular2 and material design 我正在尝试将它们一起使用 I cloned this Material2 应用程序 https github com jelbourn material2 app 这是基于
计算和验证第一个字节的时间 (TTFB)

我得到了以下公式来测量第一个字节的时间 TTFB TTFB 到 DOM 就绪和页面加载 TTFB window performance timing responseStart window performance timing navig
Redux 减速器初始化相同的状态键

我正在搞乱github 上的最简单的 Redux 示例 https github com jackielii simplest redux example我添加了第二个减少 state count 的减速器如果我在 switch cas
如何用C#实现交互式决策树

我需要允许用户通过在屏幕上显示的两个简单选项之间进行选择来选择自己的路径以便进行下一组选择直到他们到达其中一个结局即应该实现这样的事情我尝试过以下代码但每次只评估左侧我想知道如何才能达到如上图所示的结果覆盖所有分支例如如果
AbstractNum 和 NumberingInstance 的用途

1 我在想他的目的AbstractNum是重用编号格式并且NumberingInstance是创建新列表从 1 重新启动但我注意到如果在 1 处重新启动列表的第二个实例 openxml 文档将具有该列表的精确副本AbstractNum
Resharper 总是建议我制作 const string 而不是 string

哪一个好 string sQuery SELECT FROM table or const string sQuery SELECT FROM table 为什么 resharper 总是建议我这样做后者更好这意味着这不是实例变量因
AIX 上的 proftpd 静态编译

我想在 AIX 上编译 proftpd 使其可以部署在其他服务器上而不必在每台服务器上重新安装所有 gnu lib 库我已经设法动态编译它但我无法使用该选项来编译它 LDFLAG Wl static 就像 Proftpd 官方文档中的
如何在 Debian Wheezy armel 上安装 g++ 4.9？

我的 Debian 7 armel 嵌入式系统目前有 g 4 6 我想升级到 g 4 9 以使用新的 C 11 功能我怎么做我当前的sources list内容是 deb http security debian org wheezy
Spreadsheet_excel_reader 日期格式[重复]

这个问题在这里已经有答案了我正在使用电子表格 excel reader 读取 php 上的 xls 文件并将数据插入到 oracle 数据库中我正在使用下面的代码 filename test xls reader new Spreads
EF 3.x 中最简单的分组依据失败，并显示“不支持客户端分组依据”

目前正在使用 EF Core 版本 3 1 1 进行测试当我搜索时我找到了对此问题的引用但我没有看到任何关于为什么会发生这种情况的明确答案以及它是否是一个将被修复的错误或是否是预期的行为这就像看起来一样简单 BatchReques
通过 WordPress 管理员不断收到此控制台错误

未捕获承诺中 message 侦听器通过 r 指示异步响应在收到响应之前关闭了通道消息侦听器通过返回 true 指示异步响应但消息通道在响应之前关闭收到原型对象 Promise then 异步匿名 geolocation s
从代码隐藏访问 asp:content

好吧我是一名经验丰富的 Web 开发人员但有时 ASP Net 会欺骗我我在 asp net 中有一个母版页然后我有一个基于该母版页 home aspx 的页面现在在 home aspx cs 中我想访问 asp content
停止自动隐藏托盘通知图标

每当我的 Windows 窗体应用程序第一次运行时托盘图标保持可见状态大约不到一分钟然后自动隐藏我该怎么做才能让它粘住而不是自动隐藏我尝试搜索但找不到任何有用的信息看来这是 Windows 7 及更高版本的默认行为我想知道是否
如何在 Amazon EC2 Ubuntu 服务器上设置 GUI

我正在使用亚马逊 Ubuntu EC2 实例它只有一个命令行界面我想为该服务器设置 UI 以使用远程桌面工具进行访问有没有办法将GUI应用到EC2实例这是可以做到的以下是设置 GUI 的步骤创建新用户使用密码登录 sudo u
使用Java注解的ViewResolver

是否有可能在Spring http en wikipedia org wiki Spring Framework3 1 1 使用Java注释配置视图解析器我已经使用 Java 注释完成了所有配置但我陷入困境视图解析器 Code pack
如何使用 BigDecimal 显示始终保留 2 位小数的数字？

我在用大十进制以获得一些价格值需求是这样的无论我们从数据库中获取什么值显示的值都应该有2个小数点 Eg 获取的值为 1 应显示为 1 00获取的值为 1 7823 应显示为 1 78 我在用setScale 2 BigDecimal
如何在javascript中匹配由已知前缀和后缀包围的子字符串

给定一个字符串例如示例字符串与要匹配的预期嵌套字符串如何隔离仅知道其前缀和后缀的子字符串例如之间intended and to match 使用正则表达式非捕获括号 https developer mozilla org en US
如何检测 UIImage 中的 alpha 像素

如果用户触摸位于 alpha 像素透明上我尝试将 hitTest 传递给我下面的元素我不知道的是如何确定 CGPoint 20 20 上的像素是否是完整的 alpha iOS 4 谢谢奥可以获取像素RGBA 然后获取alpha
将请求从servlet转发到jsp

我有一个小型应用程序 HTML 表单作为控制器的 servlet 和 jsp 文件我尝试弄清楚为什么我无法将请求从 servlet 转发到 jsp 文件问题是从 html 提交后显示 HTTP Status 404 申请流程从 h
redshift select unique 返回重复值

我有一个数据库其中每个对象属性都存储在单独的行中附加的查询不会在 redshift 数据库中返回不同的值但在任何 mysql 兼容数据库中测试时可以按预期工作 SELECT DISTINCT distinct value FROM S

redshift select unique 返回重复值

redshift select unique 返回重复值 的相关文章

随机推荐

热门标签

redshift select unique 返回重复值的相关文章