Spark：出现心跳错误后丢失数据

2024-05-11

我有一个在 Spark 集群上运行的 Python 程序，有四个工作线程。它处理一个包含大约 1500 万条记录的巨大 Oracle 表。检查结果后发现大约有600万条记录没有插入。我的写入功能如下：

df.write.format('jdbc').options(
        url=spark_write_url,
        driver='oracle.jdbc.driver.OracleDriver',
        dbtable=dest_table_name,
        user=username,
        password=password).mode('append') \
        .save()

我查了一下大师：

14:20:22 INFO Master: Telling app of lost executor: 1
14:20:22 INFO Master: Telling app of lost worker: worker-20230212103757-1.1.1.1-44269
14:20:22 WARN Master: Removing worker-20230212103834-1.1.1.3-36115 because we got no heartbeat in 60 seconds
14:20:22 INFO Master: Removing worker worker-20230212103834-1.1.1.3-36115 on 1.1.1.3:36115
14:20:22 INFO Master: Telling app of lost executor: 3
14:20:22 INFO Master: Telling app of lost worker: worker-20230212103834-1.1.1.3-36115

另外，我检查工人日志：

 14:19:52 WARN Executor: Issue communicating with driver in heartbeater org.apache.spark.rpc.RpcTimeoutException: Futures timed out after [10000 milliseconds]. 
 This timeout is controlled by spark.executor.heartbeatInterval
at org.apache.spark.rpc.RpcTimeout.org$apache$spark$rpc$RpcTimeout$$createRpcTimeoutException(RpcTimeout.scala:47)
at org.apache.spark.rpc.RpcTimeout$$anonfun$addMessageIfTimeout$1.applyOrElse(RpcTimeout.scala:62)
at org.apache.spark.rpc.RpcTimeout$$anonfun$addMessageIfTimeout$1.applyOrElse(RpcTimeout.scala:58)
at scala.runtime.AbstractPartialFunction.apply(AbstractPartialFunction.scala:38)
at org.apache.spark.rpc.RpcTimeout.awaitResult(RpcTimeout.scala:76)
at org.apache.spark.rpc.RpcEndpointRef.askSync(RpcEndpointRef.scala:103)
at org.apache.spark.executor.Executor.reportHeartBeat(Executor.scala:996)
at org.apache.spark.executor.Executor.$anonfun$heartbeater$1(Executor.scala:212)
at org.apache.spark.executor.Executor$$Lambda$356/1672492577.apply$mcV$sp(Unknown Source)
at scala.runtime.java8.JFunction0$mcV$sp.apply(JFunction0$mcV$sp.java:23)
at org.apache.spark.util.Utils$.logUncaughtExceptions(Utils.scala:1996)
at org.apache.spark.Heartbeater$$anon$1.run(Heartbeater.scala:46)
at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
at java.util.concurrent.FutureTask.runAndReset(FutureTask.java:308)
at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$301(ScheduledThreadPoolExecutor.java:180)
at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:294)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
at java.lang.Thread.run(Thread.java:745)
Caused by: java.util.concurrent.TimeoutException: Futures timed out after [10000 milliseconds]
at scala.concurrent.impl.Promise$DefaultPromise.ready(Promise.scala:259)
at scala.concurrent.impl.Promise$DefaultPromise.result(Promise.scala:263)
at org.apache.spark.util.ThreadUtils$.awaitResult(ThreadUtils.scala:293)
at org.apache.spark.rpc.RpcTimeout.awaitResult(RpcTimeout.scala:75)
... 14 more

我的输出表有主键ID这肯定是独一无二的。但是，当我检查日志时，看到以下错误：

14:20:53,547 - INFO - functions - Dest Table : trx, Exception in Write Spark :An error occurred while calling o2192.save.

：org.apache.spark.SparkException：由于阶段失败而中止作业：阶段274.0中的任务48失败4次，最近一次失败：阶段274.0中丢失任务48.3（TID 10159）（1.1.1.4执行程序0）：java.sql .BatchUpdateException：ORA-00001：违反唯一约束（ID_PK）。

我有三个问题，请您指导一下？

First，Spark Standalone中worker节点丢失时如何管理数据？

Second、Spark如何插入数据？是否批量插入数据？例如，当 Spark 插入一个 Bulk 并且该 Bulk 出现如下错误时，unique constraint violated，Spark忽略Bulk而不插入？

Three，如何在不手动检查结果的情况下确保Spark程序正确完成工作？

非常感谢任何帮助。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Spark：出现心跳错误后丢失数据的相关文章

如何初始化子类型中特征的值？

如果我写 trait T val t 3 val u 1 t Nil class U extends T override val t 2 new U u 它表明了这一点 List 1 0 我应该如何更改上面的代码以使其显示以下内容 Lis
Scala 功能设计模式目录

一周以来我一直在阅读 Scala 编程作者一步一步地介绍了该语言的元素但我仍然很困惑何时使用演员闭包柯里化等功能性的东西我正在寻找功能结构的典型用例或最佳实践的目录我并不是说在 Scala 中重新实现像 GoF 这样的众所周知的
当我们在 Apache Spark 中使用时，无法找到 Set([TOPIC NAME,0])) 的领导者

我们使用 Apache Spark 1 5 1 和 kafka 2 10 0 8 2 1 以及 Kafka DirectStream API 通过 Spark 从 Kafka 获取数据我们使用以下设置在 Kafka 中创建了主题复制因子
Apache Spark 和 scikit_learn 之间的 KMeans 结果不一致

我正在使用 PySpark 对数据集执行聚类为了找到簇的数量我对一系列值 2 20 进行了聚类并找到了wsse 簇内平方和每个值的值k 在这里我发现了一些不寻常的东西根据我的理解当你增加集群数量时 wsse单调递减但我得到的结
Apache Spark 何时发生混洗？

我正在优化 Spark 中的参数并且想确切地了解 Spark 是如何对数据进行洗牌的准确地说我有一个简单的字数统计程序并且想知道spark shuffle file buffer kb如何影响运行时间现在当我将此参数设置得非常高
如何在 AWS Glue 中指定联接类型？

我正在使用 AWS Glue 连接两个表默认情况下它执行INNER JOIN 我想做一个LEFT OUTER JOIN 我参考了 AWS Glue 文档但无法将联接类型传递给Join apply 方法有没有办法在 AWS Glue
PySpark DataFrame 上分组数据的 Pandas 式转换

如果我们有一个由一列类别和一列值组成的 Pandas 数据框我们可以通过执行以下操作来删除每个类别中的平均值 df DemeanedValues df groupby Category Values transform lambda g
将当前类作为 scala 中的参数传递

如何传递当前类作为参数在java中我们这样做 mymethod this class or mymethod MyClass class 如何将 scala 当前类传递给此方法 this getClass or classOf MyCla
Scala 匿名函数中的 return 语句

为什么显式 return 语句使用return关键字在匿名函数中从封闭的命名函数返回而不仅仅是从匿名函数本身返回例如以下程序会导致类型错误 def foo String x Integer gt return x foo 我知道建
对 Spark 数据集中的数字字符串进行排序

假设我有以下内容Dataset productCode amount XX 13 300 XX 1 250 XX 2 410 XX 9 50 XX 10 35 XX 100 870 Where productCode is of Strin
Scala：“递归值...需要类型”，但我只使用 Java 类型

object Rec extends App val outStream new java io ByteArrayOutputStream val out new java io PrintStream new java io Buffe
Jack（Java Android 编译器套件）将如何影响 Scala 开发人员

现在随着公告Jack https source android com source jack html谷歌阐明了 Java 与 Android 相关的可预见的未来但这对 Scala 和其他基于 JVM 的语言开发人员有何影响尤其 Sc
读取不同文件夹深度的多个 csv 文件

我想递归地将给定文件夹中的所有 csv 文件读入 Spark SQLDataFrame如果可能的话使用单一路径我的文件夹结构如下所示我想包含具有一个路径的所有文件 resources first csv resources subfo
如何使用精炼库定义 A 和 B 取决于彼此的类型类？

Problem 我有一个案例类 Passenger 从 A 点出发前往 B 点有效乘客意味着A点不等于B点 Passenger a Int b Int 问题我如何使用设计乘客舱refind https index scala lang
来自 Janino 和 Commons-Compiler 的 Spark java.lang.NoSuchMethodError

我正在构建一个使用 Spark 进行基于随机森林分类的应用程序当尝试运行该程序时我从该行收到异常 StringIndexerModel labelIndexer new StringIndexer setInputCol label
Scala 2.8 中 <:<、<%< 和 =:= 的含义是什么？它们的文档在哪里？

我可以在 API 文档中看到Predef https scala lang org files archive api 2 8 2 scala Predef 24 html它们是通用函数类型 From gt To 的子类但仅此而已嗯什么
SBT插件——编译前执行自定义任务

我刚刚编写了我的第一个 SBT 自动插件它有一个生成设置文件的自定义任务如果该文件尚不存在当显式调用任务时一切都会按预期工作但我希望在使用插件编译项目之前自动调用它无需项目修改其 build sbt 文件有没有办法实现这一点
Map 和 Set 的实际类（不是抽象类，也不是特征类）是什么？

在 Scala 中映射和集合文字可以通过以下方式创建 val m Map 1 gt a 以及引用的类型m字面意思都是Map Int String 然而 scala文档表明Map实际上是一个特征具有需要实现才能实例化的抽象成员 scala
为什么我在 Mac 上看到“java.lang.reflect.InaccessibleObjectException: Unable to make private java.nio.DirectByteBuffer(long,int)accessibl

我已经在工作中愉快地构建代码好几天了但突然我的一个项目不是全部失败并出现此错误消息看看下面的答案吧我是如何修复它的起初我用谷歌搜索看到很多有这个问题的人正在使用 Java 16 但我认为错误我正在使用 Java 11 因为
与文件名中的冒号“：”作斗争

我有以下代码用于加载大量 csv gz 并将它们转储到其他文件夹中并将源文件名作为一列 object DailyMerger extends App def allFiles path File List File val parts

随机推荐

如何从 WinRT StreamSocket 读取所有可用数据并清空 inputStream？

我想在向套接字写入新数据之前读取当前正在等待套接字的所有数据 WinRT中的读取方法都是异步的所以我不能简单地while直到套接字为空由于我确实想丢弃套接字上的数据因此我不想使用读取器而是直接从套接字读取数据IInputStream
改变换行行为

我可以在 TextView 中使用 Spannable 创建具有不同外观下划线删除线等的跨度我怎样才能做同样的事情来改变换行行为特别是我不希望电子邮件地址在中间换行我希望它像一个单词一样 I tried 包裹在一起跨度 http
如何在Python中获取套接字的外部IP？

当我打电话时socket getsockname 在套接字对象上它返回我的机器的内部 IP 和端口的元组但是我想找回我的外部IP 最便宜最有效的方式是什么如果没有外部服务器的配合这是不可能的因为您和另一台计算机之间可能存在任意
CSS 3.0 用户选择属性替换

我正在使用 CSS 3 0 它抱怨用户选择属性不存在有谁知道合适的替代品或替代品是什么 user select is 回到规范 https drafts csswg org css ui 4 propdef user selectCS
预编译头和 Visual Studio

有没有办法设置 Visual Studio 解决方案参数以便它只创建预编译头而不构建整个解决方案具体来说它是一个巨大的 C 解决方案本身有许多项目谢谢仅选择 pch 创建者源文件通常是 stdafx cpp 然后编译该文件 C
[karma-server]：类型错误：无法读取未定义的属性“范围” - CI 环境中的 Angular 单元测试

我们的 CI CD 管道停止处理 ng test 作业并失败并显示以下错误消息 karma server TypeError Cannot read property range of undefined at handleRangeHea
如何从不同的线程访问控件？

如何从创建控件的线程以外的线程访问控件避免跨线程错误这是我的示例代码 private void Form1 Load object sender EventArgs e Thread t new Thread foo t Start p
使用 sapply 的列表和矩阵

我有一个也许是基本的问题我在网上搜索过我在读取文件时遇到问题尽管如此我还是按照 Konrad的建议设法读取了我的文件我很欣赏这一点 How to get R to read in files from multiple subdi
Git 显示更改后的相同文件

当我似乎无法弄清楚更改时 Git 向我显示整个文件已更改这是 cygwin git 但它也发生在 msysgit 中 git version git version 2 1 1 diff lt git show HEAD File cs
无法将参数从 `const char *` 转换为 `char *`

鉴于此代码 void group build int size std string ips Build the LL after receiving the member list from bootstrap head new memb
使用XMLHttpRequest自动网页刷新内存泄漏

问候我一直在为一些使用 8 位微控制器的硬件开发网络界面该网页使用 HTML javascript JSON 和 XHR XMLHttpRequest 进行通信我想做的是创建一个页面使用 setInterval 使用控制器中的新值每
选择initializer_list迭代器定义

Why std initializer list
从内存流播放视频文件

只是好奇看看这是否可能我有一个 Windows 应用程序它从我的电脑上的 avi 文件读取所有字节然后将其存储在 byte 中现在我的内存中有 avi 文件我想直接从内存将其加载到某种视频播放器控件中我尝试过使用 wmplaye
Javascript 警报/消息框中的欧元符号或其他实体

有谁知道我如何在 javascript 警报窗口中显示欧元或其他 html 实体 alert u20AC HTML 实体字符查找 http leftlogic com lounge articles entity lookup
从delphi应用程序调用.net4.0 com服务器后出现错误异常

我们正在将代码库从 BDS2006 迁移到 Rad Studio XE 我们发现了一些非常奇怪的行为如果我们在从 Net4 0 中实现的 COM 服务器创建一些对象后进行无效的浮点运算即除以零我们不会没有得到正常异常即 EDivis
为什么像 BindingList 或 ObservableCollection 这样的类不是线程安全的？

我一次又一次发现自己必须编写 BindingList 和 ObservableCollection 的线程安全版本因为当绑定到 UI 时这些控件无法从多个线程更改我想理解的是why情况就是这样这是设计错误还是故意的问题是设计一个线
IE11 元元素破坏 SVG

我已将 SVG 文件数据直接嵌入到我的 html 中它在 Chrome 和 Firefox 中显示但在 IE11 中根本不显示 SVG 的 Pastebin 链接是http pastebin com eZpLXFfD http past
Webpack中watch编译时加速scss的方法

太长了滚动到底部寻找答案或者将 Webpack 和 Dart Sass VM 结合起来 https github com sass dart sass releases https github com sass dart sass r
在 .NET Core 中从 HttpResponseMessage 转换为 IActionResult

我正在将之前在 NET Framework 中编写的一些代码移植到 NET Core 我有这样的事情 HttpResponseMessage result await client SendAync request if result St
Spark：出现心跳错误后丢失数据

我有一个在 Spark 集群上运行的 Python 程序有四个工作线程它处理一个包含大约 1500 万条记录的巨大 Oracle 表检查结果后发现大约有600万条记录没有插入我的写入功能如下 df write format jdbc

Spark：出现心跳错误后丢失数据

Spark：出现心跳错误后丢失数据 的相关文章

随机推荐

热门标签

Spark：出现心跳错误后丢失数据的相关文章