从 Dataflow 中的 BigQuery 读取时设置 MaximumBillingTier

2024-05-03

当我从 BigQuery 读取数据作为查询结果时，我正在运行 GCP Dataflow 作业。我正在使用 google-cloud-dataflow-java-sdk-all 版本 1.9.0。设置管道的代码片段如下所示：

PCollection<TableRow> myRows = pipeline.apply(BigQueryIO.Read
            .fromQuery(query)
            .usingStandardSql()
            .withoutResultFlattening()
            .named("Input " + tableId)
    );

查询非常复杂，导致错误消息：

查询超出第 1 层的资源限制。需要第 8 层或更高层。错误：查询超出第 1 层的资源限制。需要第 8 层或更高层。

我想设置maximumBillingTier就像在 Web UI 或 bq 脚本中完成的一样。除了为整个项目设置默认值之外，我找不到任何方法来做到这一点，不幸的是这不是一个选项。

我试图通过这些设置它但没有成功：

DataflowPipelineOptions - 无论是这个还是它扩展的任何接口似乎都没有该设置
BigQueryIO.Read.Bound - 我希望它就在旁边usingStandardSql和其他类似但显然不存在
JobConfigurationQuery - 这个类具有所有很酷的设置，但似乎在设置管道时根本没有使用它

有什么方法可以从数据流作业中传递此设置吗？

也许谷歌员工会纠正我，但看起来你是对的。我也看不到这个参数暴露。我检查了Dataflow https://github.com/GoogleCloudPlatform/DataflowJavaSDK和Beam https://github.com/apache/beam/tree/master/sdks/java APIs.

在幕后，Dataflow 正在使用JobConfigurationQuery来自 BigQuery API，但它根本不通过自己的 API 公开该参数。

我看到的一种解决方法是首先直接使用 BigQuery API 运行复杂查询，然后再放入管道中。这样您就可以通过以下方式设置最大计费等级JobConfigurationQuery班级。将该查询的结果写入 BigQuery 中的另一个表。

最后，在您的管道中，只需读入从复杂查询创建的表。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从 Dataflow 中的 BigQuery 读取时设置 MaximumBillingTier 的相关文章

解析 dockerfile 路径时出错：请使用 --dockerfile 在构建上下文中提供 Dockerfile 的有效路径

apiVersion v1 kind Pod metadata name kaniko spec containers name kaniko image gcr io kaniko project executor latest args
压缩保存在Google云存储中的文件

是否可以压缩已保存在 Google 云存储中的文件这些文件由 Google 数据流代码创建和填充数据流无法写入压缩文件但我的要求是将其保存为压缩格式标准 TextIO Sink 不支持写入压缩文件因为从压缩文件中读取的可扩展性较差
Grpc.Auth：无法从程序集“Grpc.Core.Api”加载类型“Grpc.Core.CallCredentials”

Context 我正在尝试使用 Google 的 Cloud Natural Language API 我有我的服务帐户密钥 JSON 文件并且正在尝试编写一个简单的 NET Core 应用程序更具体地说是使用 NET Core 的 A
Apache Beam：具有无限源的批处理管道

我目前正在使用 Apache Beam 和 Google Dataflow 来处理实时数据数据来自Google PubSub 它是无限制的所以目前我正在使用流媒体管道然而事实证明拥有一个 24 7 运行的流管道是相当昂贵的为了降
签名 URL 在过期日期后仍然有效

我创建了一个签名 URL 有效期为 2 天尽管过期但它仍然有效我希望它给出一些错误 3XX 4XX 测试脚本 https gist githubusercontent com forvaidya 984003008b0603ca679
kubernetes nginx ingress 无法将 HTTP 重定向到 HTTPS

我有一个托管在 Google Cloud 平台中的网络应用程序该应用程序位于负载均衡器后面而负载均衡器本身位于入口后面入口设置了 SSL 证书并按预期接受 HTTPS 连接但有一个问题我无法让它将非 HTTPS 连接重定向到 H
Google PubSub 在阻止和等待消息时没有标准输出

我正在使用这个问题底部的 Python 代码监听 Google PubSub 消息它实际上是来自 Google 的异步拉取示例我运行我的程序并输出到文件 python my script py tee log txt 如果我在接收消息时
BigQuery 数据类型

我正在开始一个新项目只是想在定义表模式之前进行验证 BigQuery 是否支持以下以外的其他功能 string integer float boolean BigQuery 数据类型官方文档 https cloud google com
从云函数在 Google Cloud Storage 中创建新的 csv 文件

第一次使用 Google 云存储下面我有一个云函数每当 csv 文件上传到时就会触发该函数my folder在我的桶里我的目标是在同一文件夹中创建一个新的 csv 文件读取上传的 csv 的内容并将每一行转换为将进入新创建的 csv
可以在不填充数据的情况下创建 BigQuery 表/架构吗？

是否可以在不先用数据填充的情况下创建表模式最好使用 Google 的 python 客户端谷歌的文档似乎没有提供明确的是或否的答案他们建议创建一个表 https cloud google com bigquery docs table
Google Cloud Kubernetes 上任务队列的替代方案

我发现任务队列主要用于App Engine标准环境我正在将现有服务从 App Engine 迁移到 Kubernetes 任务队列的一个好的替代方案是什么推送队列是当前正在使用的队列我在线阅读文档并浏览了此链接何时使用 PubSub
firebase批量更新和onWrite触发同步

我在同步两个 Firebase 云函数时遇到问题第一个函数对多个文档执行批量更新第二个函数由onWrite触发这些文档之一为了便于说明假设我有两个文档A and B 在两个单独的集合中第一个云功能更新两个文档A and B有消防库
防止 Firebase 中的待处理写入事务不起作用

我的目标是在单击按钮时将名称插入 Cloud Firestore 中但如果用户未连接到互联网我不希望保存处于挂起状态我不喜欢 Firebase 保存待处理写入的行为即使互联网连接已恢复我研究发现Firebase 开发人员建议使用事
GKE 出现错误：ImagePullBackOff 和错误：ErrImagePull 错误

当 kubectl 应用 yaml 将自定义构建的 docker 映像部署到 GCP 中的集群编辑掉敏感信息时我收到以下错误已尝试以下但没有运气手动部署镜像检查以确保防火墙规则允许 443 并且没有任何东西阻止它尝试将容器注册
如何对 Firebase 中托管的静态网站进行 IP 白名单？ / 是否有用于 Firebase 托管的 WAF？

我有一个在 Firebase 中托管的静态网站我可以很好地附加一个自定义域我想将对我的网站的访问限制在特定范围的 IP 范围内我知道在 GCP 中 Google Cloud Armor 可以做到这一点但 Cloud Armor 仅适
Firebase 身份验证无法启用 Google 身份验证方法 - “更新 Google 时出错”

我正在尝试使用 Google Auth 登录方法启用 Firebase 身份验证但启用它并单击保存显示错误更新 Google 时出错 https i stack imgur com HMVGD png 在 Google Cloud
Dataflow SQL (GCP) 不支持使用 STRUCT 的嵌套行

使用 Dataflow SQL 我想读取 Pub Sub 主题丰富消息并将消息写入 Pub Sub 主题哪个 Dataflow SQL 查询将创建我想要的输出消息 Pub Sub input消息 event timestamp 1619
BigQuery 标准 SQL 错误，根本未触及日期字段时的时间戳无效

答案here https stackoverflow com questions 41195883 bigquery standard sql error invalid timestamp对我没有帮助尽管我在一个相当简单的更新查询中遇到
访问 GCP 深度学习平台映像的 dockerfiles

我正在使用源自的图像深度学习容器 https cloud google com ai platform deep learning containers docs 在 AI Platform Notebooks 产品中运行多个任务为了对我
尽管具有适当的角色，GCP VM 实例仍无法从 Secret Manager 访问密钥

我在 GCP 中创造了一些秘密Secret Manager服务然后为了在本地计算机上访问这些秘密我创建了一个service account and a JSON用于从我的本地计算机验证该服务帐户的密钥我也授予了这个角色Secret M

随机推荐

实体框架的状态模式

我有一个模型Enquiry 它可以处于两种状态之一还有更多状态但出于此目的我将仅比较两种状态 New and Closed 查询所处的状态取决于用户能够对查询执行什么操作例如无法删除已关闭的查询而可以删除新的查询等等基本示例
Windows Phone 8.1 应用程序多语言

我正在使用 Visual Studio 2015 在 SilverLight 中创建 Windows Phone 应用程序 8 1 我正在用英语和阿拉伯语创建多语言应用程序为此我在项目中创建了 Strings 文件夹其中包含 en U
仅从 MySQL 中的日期时间 (YYYY-MM-DD HH:MM:SS) 中选择不同的日期

执行此命令会带来以下结果所有列中的所有日期因此它本质上与 SELECT date 执行相同的操作没有不同 SELECT DISTINCT date FROM daily ORDER BY date DESC 2013 02 12 16
如何在 Android Studio 中为单独的模块生成签名的 APK？

我的项目有 3 个模块 include app include videograbber include audiograbber 现在我想为Videograbber模块生成签名的APK 当我在 Android Studio 中使用生成签
自定义 UIAlertView？

鉴于蓝色与我的 UI 界面不相配我只是想知道是否有办法更改 uialertview 的颜色或者使用图像代替所有按钮关闭等仍然存在 Thanks CodeCropper 的优秀人员刚刚推出了一个开源控件可让您创建自定义警报视图这
Big O 用于有限、固定大小的可能值集

这个问题 https stackoverflow com questions 12305028 java what is the best way to find first duplicate character in a string引
在画布中的鼠标位置放大/缩小

我正在尝试使用 p5 js 实现缩放功能当前缩放级别以及 x 和 y 位置存储在controls view目的默认位置或 0 0 位置位于左上角问题是调整放大缩小时的 x 和 y 位置值以便无论视图的当前位置是什么它都会停留在缩
调试 python Web 服务

我正在使用找到的说明here http www diveintopython net http web services user agent html 尝试检查发送到我的网络服务器的 HTTP 命令但是我没有看到按照教程中的建议在控制
cuda中有模板化的数学函数吗？ [复制]

这个问题在这里已经有答案了我一直在寻找 cuda 中的模板化数学函数但似乎找不到在普通的 C 中如果我调用std sqrt它是模板化的并且将根据参数是浮点数还是双精度数执行不同的版本我想要这样的 CUDA 设备代码我的内核将真
registerForActivityResult TakePicture 未触发

我尝试使用新的 registerForActivityResult 来拍照我可以打开相机意图但拍照后未触发回调并且我在 logcat 上看不到任何有关 Activity Result 或错误的信息我也尝试了RequestPermi
如何在android中格式化长整型以始终显示两位数

我有一个倒计时器显示从 60 到 0 的秒数 1 分钟倒计时器当它达到 1 位数字例如 9 8 7 时它显示 9 而不是 09 我尝试使用String format B 02d B x 我将 x 从 long 转换为字符串它不起作
角度材质选择不会检测嵌套组件生成的选项的更改

我正在尝试提取过滤和显示我的逻辑mat option是我的mat selects 到他们自己的组件中然而由于某种原因会显示选项但单击它们不会触发事件我正在编写的网络应用程序有很多mat select每个都可能有很多mat opti
实体框架..自引用表..获取深度=x的记录？

我成功地在实体框架中使用自引用表但我不知道如何获得所需深度的记录这应该是什么逻辑 Model public class FamilyLabel public FamilyLabel this Children new Collectio
fread 的填充选项

假设我有这个 txt 文件 AA 3 3 3 3 CC ad 2 2 2 2 2 ZZ 2 AA 3 3 3 3 CC ad 2 2 2 2 2 With read csv I can gt read csv linktofile txt
验证仅适用于数组的第一项

给定这个模型代码 Required Display Name Name public string Name get set 以下查看代码有效 Html LabelFor model gt model Name Html TextBoxFo
如何在 .NET 6.0 中使用最小 Api 配置 Newtonsoft Json

I have net6 0具有最少 api 的项目我想使用NetwtonsoftJson而不是内置的System Text Json用于序列化和反序列化的库目前我有这个配置JsonOptions并且按预期工作 builder Servi
Laravel项目部署到Cpanel时出现404错误如何解决？

我正在尝试将我的 laravel Laravel Framework 7 28 3 部署到 Cpanel 但出现 404 错误我将项目上传到 public html 修改了 index php 文件以指向正确的文件如下所示我认为ind
React Native 中 SVG 中的定位图标

背景我正在尝试按照本教程将工具提示添加到react native svg图表中教程链接 Link https levelup gitconnected com adding tooltip to react native charts
二叉树实现C++

二叉树插入 include stdafx h include
从 Dataflow 中的 BigQuery 读取时设置 MaximumBillingTier

当我从 BigQuery 读取数据作为查询结果时我正在运行 GCP Dataflow 作业我正在使用 google cloud dataflow java sdk all 版本 1 9 0 设置管道的代码片段如下所示 PCollecti

从 Dataflow 中的 BigQuery 读取时设置 MaximumBillingTier

从 Dataflow 中的 BigQuery 读取时设置 MaximumBillingTier 的相关文章

随机推荐

热门标签