Google BigQuery 无法处理更大的结果集，出现“响应太大而无法返回”或“查询执行期间资源超出”

2023-12-04

我目前正在 C# 应用程序中处理大型表（~105M 记录）。

当使用“Order by”或“Order Each by”子句查询表时，我收到“查询执行期间超出资源”错误。
如果我删除“Order by”或“Order Each by”子句，那么我会得到响应太大而无法返回错误。

这是两个场景的示例查询（我正在使用维基百科公共表）

SELECT Id,Title,Count(*) FROM [publicdata:samples.wikipedia] 按 Id 对 EACH 进行分组，标题按 Id 排序，标题描述
SELECT Id,Title,Count(*) FROM [publicdata:samples.wikipedia] 按 Id、标题对 EACH 进行分组

这是我的问题

Big Query 响应的最大大小是多少？
我们如何选择查询请求中而不是“导出方法”中的所有记录？

1. Big Query Response 的最大大小是多少？

正如上面提到的配额政策查询最大响应大小：10 GB 压缩（返回大型查询结果时无限制）

2. 如何选择查询请求中而不是“导出方法”中的所有记录？

如果您计划运行可能返回更大结果的查询，您可以设置allowLargeResults真实地在你的作业配置.

返回大结果的查询将需要更长的时间来执行，即使结果集很小，并且会受到额外的限制:

您必须指定目标表。
您不能指定顶级 ORDER BY、TOP 或 LIMIT 子句。这样做会抵消使用allowLargeResults 的好处，因为无法再并行计算查询输出。
仅当与 PARTITION BY 子句结合使用时，窗口函数才能返回大型查询结果。

详细了解如何分页以获得结果here并还从BigQuery 分析书籍，从第 200 页开始的页面，其中解释了如何乔布斯::getQueryResults正在与maxResults参数和int的阻塞模式。

Update:

查询结果大小限制 - 有时，很难知道 10 GB 的压缩内容是什么数据手段。

当您在 BigQuery 中运行普通查询时，响应大小限制为 10 GB 的压缩数据。有时，很难知道 10 GB 的压缩内容是什么数据手段。它被压缩了 2 倍吗？ 10 倍？结果被压缩在它们各自的列，这意味着压缩比往往非常高好的。例如，如果您有一列是国家/地区名称，则可能只有几个不同的值。当你只有几个不同的值，这意味着没有很多独特的信息，并且该列通常会压缩得很好。如果您返回加密的数据块，它们将可能无法很好地压缩，因为它们大多是随机的。（上面链接的书第 220 页对此进行了解释）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

googlebigquery

Google BigQuery 无法处理更大的结果集，出现“响应太大而无法返回”或“查询执行期间资源超出” 的相关文章

Google BigQuery：检索每行的最后版本

我有一个 Google BigQuery 表其中包含所有版本的资源每次创建更新删除资源时都会添加一个新行并递增版本号该数字将是添加行时的时间戳 ID ResourceID Action Count Timestamp ABC
Google BigQuery：如何使用 SQL 创建新列

我想在不使用旧版 SQL 的情况下向现有表添加一列基本的 SQL 语法是 ALTER TABLE table name ADD column name datatype 我格式化了 Google BigQuery 的查询 ALTER TA
Google BigQuery 另存为表

我用 Google BigQuery 运行了这个查询 SELECT repo id count as count FROM TABLE DATE RANGE githubarchive day events TIMESTAMP 2015 0
Google Bigquery 命令行返回限制

我刚刚升级了 bigquery 命令行程序现在运行查询时返回的行数受到限制限制似乎是 100 行在升级之前我能够返回数千行我正在使用Debian 有没有办法扩大返回行的限制如果我可以提供更多信息请告诉我 Try the max
Bigquery 中数组对之间的余弦相似度

我创建了一个表其中有一对 ID 和每个 ID 的坐标以便我可以计算它们之间的成对余弦相似度 The table looks like this 坐标的维度数当前为 128 但可能会有所不同但同一个表中一对 ID 的数字维度始终相同 c
从 Google Apps 脚本运行保存的 bigquery 查询？

我们经常使用 Google Apps 脚本来运行 BigQuery 查询并将其放入 Google Sheet 中然而工作流程很烦人在 BigQuery 中运行查询直到正确为止复制粘贴到文本编辑器以放入换行斜杠在应用程序脚本中运
Bigquery 取消或停止尚未启动的批量查询作业 (Status.State = "PENDING")

如果由于某种原因想要停止取消尚未启动的批量查询作业 Status State PENDING 是否可以这样做使用的库 net Google Apis Bigquery v2 1 5 0 122 beta BigQuery 现在支持取消
Firebase 中的每用户会话分布表

这是第二篇文章我的后续文章第一篇文章 https stackoverflow com questions 48670590 session duration distribution table in firebase 查看 Fireba
BigQuery：如何计算每天和类别的不同访问者的运行计数？

在 Google BigQuery 中我有一个像这样的表开始时间 STRING 访客 ID STRING 类别 STRING 此内容的示例 startTime visitorId category 2013 11 27 00 00 00
查询文本指定 use_legacy_sql:false，而 API 选项指定:true

我将 standardSQL 与 bigrquery 一起使用 library bigrquery project lt sql lt standardSQL SELECT result lt query exec sql project
从哪里获取 Google Bigquery 使用信息（主要是处理后的数据）

我知道 BigQuery 每月免费提供第一批已处理的 1 TB 数据但我不知道在仪表板上的何处查看我的每月使用情况我曾经能够恢复到包含信息的旧仪表板但在过去的几周内旧仪表板无法访问在项目的 Google Cloud Con
pyspark读取bigquery时出错：java.lang.ClassNotFoundException：org.apache.spark.internal.Logging$class

我创建了一个 dataproc 集群并尝试提交我的本地作业进行测试 gcloud beta dataproc clusters create test cluster region us central1 zone us central1
BigQuery：通配文件模式时遇到错误

我查询了包含 Google 电子表格中数据的联合表遵循第 720 期中的建议https code google com p google bigquery issues detail id 720 https code google co
第一天安装者的原始 BigQuery 日志数据

我对 StandardSQL 相当陌生想要导出在给定日期 2017 年 6 月 1 日安装的用户的原始 BigQuery 日志数据以及安装日期 D0 D20 当天和之后前 3 周的会话数据 StandardSQL SELECT use
无法将 bigrquery 与标准 sql 一起使用

我正在 R ipython 笔记本相对 R 新手中工作并尝试使用 bigrquery 从 Google Big Query 中提取数据我被告知这应该很简单但使用标准 sql 提取不起作用这是我的代码 require bigrqu
Python 单元测试 Google Bigquery

我在对以下代码块进行单元测试时遇到问题 from google cloud import bigquery from google oauth2 import service account def run query query gcp
BigQuery 未显示链接的 Firebase Analytics 事件日志的任何数据集

我将我的帐户链接到 Big Query 但 Firebase Analytics 事件不会自动加载到 BigQuery 中显示未找到数据集警告我的工作进度附在下面请查收 I have getting firebase Analyt
user_pseudo_id 与会话 id 相同吗？如何按会话对所有事件进行分组？ - Firebase BigQuery

我有一个 iOS 应用程序我试图弄清楚用户如何在我的应用程序中移动我正在寻找一种通过某种会话 ID 对所有事件进行分组的方法我假设所有 fireBase 事件都有一个会话 ID 事实似乎并非如此我注意到有一个user pseudo
谷歌的Dremel是什么？它与 MapReduce 有什么不同？

谷歌的 Dremel 是此处描述 http research google com pubs pub36632 html Dremel 和 Mapreduce 有什么区别 Dremel http research google com pu
BigQuery 中 _PARTITIONDATE 与 _PARTITIONTIME 伪列的使用

在官方的最佳实践中我found https cloud google com bigquery docs best practices costs 按日期对表进行分区并查询相关分区例如 WHERE PARTITIONDATE 2017 0

随机推荐

卷曲 cookie 处理

是否有可能使用 cURL 时并非每个用户都使用相同的 cookie 因为我存储得到的 cookie 很酷但是这个 cookie 会被每个人使用而且应该如此因为它是一个登录 cookie Charlie 这是 cookie 工作原理的
语法错误：当前未启用对实验性语法“jsx”的支持

我无法使用我创建的 npm 组件包我已经成功发布了该包但是当我在新代码中使用它时它显示此错误 SyntaxError home trinendra Desktop react test node modules iconbox1 in
SSIS：创建具有不同行格式的平面文件

我想创建一个平面文件输出其中行的格式不同文件有标题行中间数据行页脚行文件如下所示 H deptcode123 deptNameXYZ totalemp300 E Sam Johnson address1 empCode1 many
window.open() 中的 name 参数是什么

请有人告诉我这个窗口的名称是什么window open 是标题名称还是java脚本语言中的某个ID windowName 为新窗口指定的名称该名称可用于再次引用该窗口打开窗口后您会想用它做各种各样的事情例如移动它然后你就可以做
如何使用面板上的图形类绘制多色文本？

我想在面板上绘制以下文本这是一个多颜色的文本我找到了这个article关于绘制彩色文本我用单词替换了字符但它不起作用我使用FillPath DrawPath来绘制文本 my code private void Form1 Pain
将递归Python代码转换为非递归版本

除非我们开始增加 unique 和 n symbols 和长度否则此处提供的代码将有效例如在我的计算机上 n symbols 512 length 512 distinct 300 最终会出现此错误RecursionError 比较中
Windows批处理文件将X个文件从一个文件夹移动到另一个文件夹

如果文件少于 20 个我尝试使用批处理文件以 30 个块为单位移动文件 DataLoc 我修改了代码一个先前的问题问题在于FMove文件的部分无论我在里面放什么for线它给了我一个错误我希望这个有 HoldLoc 值但由于我遇到
Javascript 对象和 JSON 对象有什么区别

谁能用一个例子告诉我 Javascript 对象和 JSON 对象之间的区别 JavaScriptobject是 Javascript 中的一种数据类型仅在 Javascript 中才有意义你经常会看到 Javascript对象字面量像
即使在postgres中使用listen_addresses ='*'，远程登录也不起作用

我想使用远程主机登录 postgres 我已经使用listen addresses 配置了postgresql conf文件我已经配置了 pg hba conf 文件 host all all 0 0 0 0 0 md5 但我仍然无法登录
CSS3 标签朝右并使用位置或:after

我正在尝试在 CSS 中构建这个形状但我不知道如何将三角形考虑到我有一个矩形作为标签的主体一个三角形作为尖端朝右因为我正在处理位置所以当标签都可以具有不同的大小时如何让三角形出现在矩形之后我就是搞不出来您可以检查小提琴
在网络浏览器中输入 google.com 后按 Enter 键后会发生什么

当我在网络浏览器中输入 google com 后按 Enter 键后到底发生了什么第一个数据包去往何处以及从那里去往何处我想要详细信息所以请有人帮助我您是否尝试过研究输出traceroute www google com从命令行
我不明白 Delphi 中的 Application.ProcessMessages 正在做什么[关闭]

Closed 这个问题需要多问focused 目前不接受答案我是德尔福的新手我的主管向我解释说 Application ProcessMessages 可以防止应用程序冻结并分配一些额外的计算时间但是在这个命令的文档中总是解释一些关于
有没有办法修改 Jersey 生成的 XML 响应以包含样式表信息？

在 JAXB 中这是可能的使用编组器对象我不知道如何使用泽西岛做到这一点我想知道是否有一种方法可以以某种方式注入类似的东西在生成的 xml 响应中请参阅 XmlHeader 注释将其附加到您的资源方法中例如这样 GET Pr
纸张元素导入在 python 中不起作用

Paper 元素无法在 python django 环境中导入并且出现导入错误 Uncaught TypeError Failed to resolve module specifier polymer polymer polymer
适用于 .NET Core 的 Windows 窗体设计器和 WPF 设计器

我最近听说 NET Core NET Core 3 0 的alpha版本支持Windows Forms和WPF 但是 Visual Studio 设计器和 Visual Studio 不支持 NET Core版本Windows 窗体和 W
为什么 Java 同步不能按预期工作？

我试图弄清楚同步方法是如何工作的根据我的理解我创建了两个线程T1 and T2这将调用相同的方法addNew 由于该方法是同步的难道它不应该先为一个线程执行 for 循环的所有迭代然后再为另一个线程执行吗输出不断变化有时打印正确
安卓 pdf 阅读器

我想使用 Android pdf 库http andpdf sourceforge net 但我有同样的错误日志 ST file no file selected not found ST reading page 1 zoom 1 0
Matlab，使用if语句比较数组

我在网上搜索试图找到我遇到的这个问题的答案我有一个类似于以下的数组 A 2 4 6 8 3 5 7 9 1 4 6 9 row median 5 6 5 col median 2 4 6 9 我想根据这些值创建一个中值图所以我创建了数组
4.0 设备上的 Android 菜单按钮

如果我的目标 SDK 设置为 11 并且我使用的是 Theme Holo NoActionBar 有什么方法可以让我的菜单出现我将 Theme Holo 用于较大的屏幕例如平板电脑但纯粹是为了节省屏幕空间我不想在智能手机上显示操作栏
Google BigQuery 无法处理更大的结果集，出现“响应太大而无法返回”或“查询执行期间资源超出”

我目前正在 C 应用程序中处理大型表 105M 记录当使用 Order by 或 Order Each by 子句查询表时我收到查询执行期间超出资源错误如果我删除 Order by 或 Order Each by 子句那么我会得

Google BigQuery 无法处理更大的结果集，出现“响应太大而无法返回”或“查询执行期间资源超出”

Google BigQuery 无法处理更大的结果集，出现“响应太大而无法返回”或“查询执行期间资源超出” 的相关文章

随机推荐

热门标签