使用 Google.Cloud.BigQuery.V2 实现 BigQuery 加载作业的幂等性

2024-02-12

您可以使用 Google.Cloud.BigQuery.V2 中具有 CreateLoadJob 方法的 BigQueryClient 创建 csv 加载作业，以从 Google Cloud Storage 中的 csv 文件加载数据。

如何保证此 API 的幂等性，以确保在获得响应之前网络断开且您开始重试时，不会导致相同的数据多次加载到 BigQuery 中？

API 使用示例

    private void LoadCsv(string sourceUri, string tableId, string timePartitionField)
    {
        var tableReference = new TableReference()
        {
            DatasetId = _dataSetId,
            ProjectId = _projectId,
            TableId = tableId
        };

        var options = new CreateLoadJobOptions
        {
            WriteDisposition = WriteDisposition.WriteAppend,
            CreateDisposition = CreateDisposition.CreateNever,
            SkipLeadingRows = 1,
            SourceFormat = FileFormat.Csv,
            TimePartitioning = new TimePartitioning
            {
                Type = _partitionByDayType,
                Field = timePartitionField
            }
        };

        BigQueryJob loadJob = _bigQueryClient.CreateLoadJob(sourceUri: sourceUri,
                                                            destination: tableReference,
                                                            schema: null,
                                                            options: options);

        loadJob.PollUntilCompletedAsync().Wait();
        if (loadJob.Status.Errors == null || !loadJob.Status.Errors.Any())
        {
            //Log success
            return;
        }
        //Log error
    }

您可以通过基于例如生成您自己的 jobid 来实现幂等性您加载的文件位置和目标表。

job_id = 'my_load_job_{}'.format(hashlib.md5(sourceUri+_projectId+_datasetId+tableId).hexdigest())
var options = new CreateLoadJobOptions
        {
            WriteDisposition = WriteDisposition.WriteAppend,
            CreateDisposition = CreateDisposition.CreateNever,
            SkipLeadingRows = 1,
            JobId = job_id, #add this
            SourceFormat = FileFormat.Csv,
            TimePartitioning = new TimePartitioning
            {
                Type = _partitionByDayType,
                Field = timePartitionField
            }
        };

在这种情况下，如果您尝试重新插入相同的 job_id，则会出现错误。您还可以轻松生成此 job_id 以检查池是否失败。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

googlebigquery

googlecloudstorage

使用 Google.Cloud.BigQuery.V2 实现 BigQuery 加载作业的幂等性的相关文章

用于代数简化和求解的 C# 库 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案网络上有很多代数求解器和简化器例如 algebra com 上不错的代数求解器和简化器然而我正在
在 C++ 中使用 matlab 结构（matlab 函数调用的返回值）（由 matlab 编译器生成的库）

你好我有一个相当简单的 matlab 函数例如 function MYSTRUCT myfunc MYSTRUCT prop1 test MYSTRUCT prop2 foo MYSTRUCT prop3 42 end 我用 matla
注销租约抛出 InvalidOperationException

我有一个使用插件的应用程序我在另一个应用程序域中加载插件我使用 RemoteHandle 类http www pocketsilicon com post Things That Make My Life Hell Part 1 App
提交后禁用按钮

当用户提交付款表单并且发布表单的代码导致 Firefox 中出现重复发布时我试图禁用按钮去掉代码就不会出现这个问题在firefox以外的任何浏览器中也不会出现这个问题知道如何防止双重帖子吗 System Text StringBui
复制 std::function 的成本有多高？

While std function是可移动的但在某些情况下不可能或不方便复制它会受到重大处罚吗它是否可能取决于捕获变量的大小如果它是使用 lambda 表达式创建的它依赖于实现吗 std function通常被实现为值语义小缓
从 Linux 内核模块中调用用户空间函数

我正在编写一个简单的 Linux 字符设备驱动程序以通过 I O 端口将数据输出到硬件我有一个执行浮点运算的函数来计算硬件的正确输出不幸的是这意味着我需要将此函数保留在用户空间中因为 Linux 内核不能很好地处理浮点运算这是设
具有交替类型的可变参数模板参数包

我想知道是否可以使用参数包捕获交替参数模式例如 template
DbContext 和 ObjectContext 有什么区别

From MSDN 表示工作单元和存储库模式的组合使您能够查询数据库并将更改分组在一起然后将这些更改作为一个单元写回存储 DbContext在概念上类似于ObjectContext 我虽然DbContext只处理与数据库的连接以及针对数
Qt - ubuntu中的串口名称

我在 Ubuntu 上查找串行端口名称时遇到问题如您所知为了在 Windows 上读取串口我们可以使用以下代码 serial gt setPortName com3 但是当我在 Ubuntu 上编译这段代码时我无法使用这段代码 se
如何在 Xaml 文本中添加电子邮件链接？

我在 Windows Phone 8 应用程序中有一些大文本我希望其中有电子邮件链接例如 mailto 功能这是代码的一部分
如何设置 log4net 每天将我的文件记录到不同的文件夹中？

我想将每天的所有日志保存在名为 YYYYMMdd 的文件夹中 log4net 应该根据系统日期时间处理创建新文件夹我如何设置它我想将一天中的所有日志保存到 n 个 1MB 的文件中我不想重写旧文件但想真正拥有一天中的所有日志我该如
将 MQTTNet 服务器与 MQTT.js 客户端结合使用

我已经启动了一个 MQTT 服务器就像this https github com chkr1011 MQTTnet tree master例子该代码托管在 ASP Net Core 2 0 应用程序中但我尝试过控制台应用程序但没有成
如果没有抽象成员，基类是否应该标记为抽象？

如果一个类没有抽象成员可以将其标记为抽象吗即使没有实际理由直接实例化它除了单元测试是的将不应该实例化的基类显式标记为抽象是合理且有益的即使在没有抽象方法的情况下也是如此它强制执行通用准则来使非叶类抽象它阻止其他程序员创建该类
如何部署“SQL Server Express + EF”应用程序

这是我第一次部署使用 SQL Server Express 数据库的应用程序我首先使用实体框架模型来联系数据库我使用 Install Shield 创建了一个安装向导来安装应用程序这些是我在目标计算机中安装应用程序所执行的步骤安装
System.IO.FileNotFoundException：找不到网络路径。在 Windows 7 上使用 DirectoryEntry 对象时出现异常

我正在尝试使用 DirectoryEntry 对象连接到远程 Windows 7 计算机这是我的代码 DirectoryEntry obDirEntry new DirectoryEntry WinNT hostName hostName
C++ 条件编译

我有以下代码片段 ifdef DO LOG define log p record p else define log p endif void record char data 现在如果我打电话log hello world 在我的代码中
使用 .NET Process.Start 运行时挂起进程 - 出了什么问题？

我在 svn exe 周围编写了一个快速而肮脏的包装器来检索一些内容并对其执行某些操作但对于某些输入它偶尔会重复挂起并且无法完成例如一个调用是 svn list svn list http myserver 84 svn Docum
从列表中选择项目以求和

我有一个包含数值的项目列表我需要使用这些项目求和我需要你的帮助来构建这样的算法下面是一个用 C 编写的示例描述了我的问题 int sum 21 List
当我使用 OpenSSL1.1.0g 根据固定的 p 和 g 值创建 Diffie Hellman 密钥协议密钥时，应该执行哪些检查？

您好我尝试通过这段代码使用修复 p 和 g 参数来制作 Diffie Hellman Keysanswer https stackoverflow com a 54538811 4706711 include
BigQuery 中的字段可以具有 NULLABLE 和 REPEATED 模式吗？

BigQuery 中的字段可以为 NULLABLEand重复模式例如表示一个字符串数组其中某些字符串可能为 NULL BigQuery 中的字段可以具有 NULLABLE 和 REPEATED 模式吗没有要么是一个要么是另一个

随机推荐

规划网络应用程序

我即将开始建立新的初创公司因此我需要您的一些指导规划网站的最佳方法是什么我不认为首先设计然后数据库关系然后开始开发而是如何规划应用程序的工作方式是否有一些经过验证的方法例如制作网站蓝图的最佳方法例如使用某种工具或其
Docker php:fpm—安装 php 扩展

我用的是官方的php fpmdocker 镜像作为我的应用程序容器的基础所以Dockerfile像这样开始 FROM php fpm 稍后在文件中我希望有类似的内容 RUN apt get install y php7 0 gd 但这告诉
连续分数

我对连续分数的理解是它总是以分数形式表示小数我认为连续分数总是返回小于或等于小数的值不幸的是我的代码有时会返回大于十进制输入的小数值我对连续分数的理解正确吗如果是这样请解释一下我的代码中的错误所在 public static R
JavaScript 获取样式

是否可以使用 JavaScript 获取对象的所有样式就像是 main css myLayer position absolute width 200px height 100px color 0000ff main js var ob
在 ASP.NET MVC 5 中从 Facebook v2.4 API 访问 OAuthExternalLoginCallback 中的电子邮件地址[重复]

这个问题在这里已经有答案了对于 Facebook API v2 3 如果设置了以下内容用户的电子邮件地址将在回调中返回ExternalLoginCallback app UseFacebookAuthentication new Fac
Apache Tomcat 8 不工作。抛出 HTTP 状态 500 - java.lang.ClassNotFoundException: org.apache.jsp.index_jsp

我正在使用 Apache Tomcat 8 和 JDK 1 7 运行 startup bat 后 Tomcat 开始运行但当我尝试跑步时 http localhost 8080 它显示一个错误 HTTP 状态 500 java lang
提交到 Web 服务器的希伯来语字符串未收到希伯来语版本

我从我的应用程序向网络服务器提交注册表单 EditText email EditText findViewById R id email EditText password EditText findViewById R id passwo
使用 cin 检查空行

我想检查是否有空行作为输入来执行特定操作我尝试使用 cin peek 并检查它是否等于 n 但它没有意义 a b c 空行在这里我想执行我的操作 a 我试过这段代码 char a b c cin gt gt a cin gt gt b
MS Access 中的一对一关系

我在 MS Access 中的两个表之间创建一对一关系时遇到问题当我创建关系时它默认为多对一并且我没有看到更改它的选项有没有办法做到这一点 Access没有这样的概念您可以将两个表合并为一个表也可以在两个表上为公共字段放置唯一
Tomcat 访问日志中的 HTTP 状态代码 500 ClientAbortException / 管道损坏

我们使用 Kibana 设置了一些仪表板和可视化以监控 tomcat 为 Spring Boot Web 应用程序生成的访问日志我们特别关注状态代码为 5xx 的请求事实证明如果客户端请求资源并且在请求正在进行时取消该请求使用C
在 vb.net 中关闭数据读取器的正确点

我在 vb net 中有这段代码 reader myCommand ExecuteReader If reader HasRows Then While reader read End While End If 我应该在之后使用 reade
闪亮：动态更改选项卡名称

我正在开发一个应该处理多种语言的闪亮应用程序我设法动态翻译应用程序的几乎所有元素具体取决于selectInput选择语言然而困难的事情仍然是navbarPage选项卡以及tabPanels在我的页面内我不能改变他们的名字我尝试
美丽的汤和表抓取 - lxml 与 html 解析器

我正在尝试使用 BeautifulSoup 从网页中提取表格的 HTML 代码 table class facts label table 我想知道为什么下面的代码适用于 html parser 并打印回来none如果我改变 html pa
什么是顶点数组对象？

我今天刚刚开始从本教程学习 OpenGL http openglbook com the book http openglbook com the book 我读到了第二章画了一个三角形除了 VAO 这个缩写可以吗之外我理解了所有内
iOS 7/8 UITableView Cell：两个具有动态高度的 UILabel，具有可变行高的自动布局

因此当我只有一个标签可以根据字符串的长度更改高度时我可以使用自动布局设置动态高度大小我的问题是如果我添加另一个应该执行相同操作的 UILabel 事情就不会成功我将内容拥抱优先级和压缩阻力都设置为 1000 我收到歧义警告如果我
INNER JOIN 独特 ID

我有以下代码 FROM CTE Order cte INNER JOIN tblOrders o ON cte OrderId o Id INNER JOIN tblOrderUnits ou ON o id ou OrderId INNE
javafx 中具有不同单元格值的 TableView

在下面的代码中有 4 列在特定值列中可以添加不同类型的数据如字符串整数日期等但我想在同一列中在该单元格中输入的值旁边添加一个按钮前提是该值是字符串像这样的东西名字姓氏年龄特别价值詹姆斯史密斯 10 10 10
从AVPlayer获取HLS的PCM数据

这个问题在过去几年里似乎被问过几次但没有人回答我正在尝试处理来自 HLS 的 PCM 数据并且必须使用 AVPlayer 这篇文章利用了本地文件https chritto wordpress com 2013 01 07 proces
#value 错误，但在 VBA 中有效

以下函数引用自彭博社当从 Sub 过程调用时该函数可以工作但不能作为工作表公式有谁知道为什么 Public Function GetRatesSTATIC As Variant Application DisplayAlerts F
使用 Google.Cloud.BigQuery.V2 实现 BigQuery 加载作业的幂等性

您可以使用 Google Cloud BigQuery V2 中具有 CreateLoadJob 方法的 BigQueryClient 创建 csv 加载作业以从 Google Cloud Storage 中的 csv 文件加载数据如何

使用 Google.Cloud.BigQuery.V2 实现 BigQuery 加载作业的幂等性

使用 Google.Cloud.BigQuery.V2 实现 BigQuery 加载作业的幂等性 的相关文章

随机推荐

热门标签

使用 Google.Cloud.BigQuery.V2 实现 BigQuery 加载作业的幂等性的相关文章