在 Google Dataproc 集群实例中的 Spark-Submit 上运行应用程序 jar 文件

2023-12-03

我正在运行一个 .jar 文件，其中包含我需要打包在其中的所有依赖项。这种依赖关系之一是com.google.common.util.concurrent.RateLimiter并已经检查过它的类文件是否在此 .jar 文件中。

不幸的是，当我在 google 的 dataproc-cluster 实例的主节点上点击命令 spark-submit 时，我收到此错误：

Exception in thread "main" java.lang.NoSuchMethodError: com.google.common.base.Stopwatch.createStarted()Lcom/google/common/base/Stopwatch;
at com.google.common.util.concurrent.RateLimiter$SleepingStopwatch$1.<init>(RateLimiter.java:417)
at com.google.common.util.concurrent.RateLimiter$SleepingStopwatch.createFromSystemTimer(RateLimiter.java:416)
at com.google.common.util.concurrent.RateLimiter.create(RateLimiter.java:130)
at LabeledAddressDatasetBuilder.publishLabeledAddressesFromBlockstem(LabeledAddressDatasetBuilder.java:60)
at LabeledAddressDatasetBuilder.main(LabeledAddressDatasetBuilder.java:144)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:497)
at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:672)
at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:180)
at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:205)
at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:120)
at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

似乎发生了一些事情，覆盖了我的依赖关系。已经反编译了Stopwatch.class来自此 .jar 的文件并检查该方法是否存在。当我在 google dataproc 实例上运行时，就发生了这种情况。我做到了grep在执行过程中spark-submit我得到了旗帜-cp像这样：

/usr/lib/jvm/java-8-openjdk-amd64/bin/java -cp /usr/lib/spark/conf/:/usr/lib/spark/lib/spark-assembly-1.5.0-hadoop2.7.1.jar:/usr/lib/spark/lib/datanucleus-api-jdo-3.2.6.jar:/usr/lib/spark/lib/datanucleus-rdbms-3.2.9.jar:/usr/lib/spark/lib/datanucleus-core-3.2.10.jar:/etc/hadoop/conf/:/etc/hadoop/conf/:/usr/lib/hadoop/lib/native/:/usr/lib/hadoop/lib/*:/usr/lib/hadoop/*:/usr/lib/hadoop-hdfs/lib/*:/usr/lib/hadoop-hdfs/*:/usr/lib/hadoop-mapreduce/lib/*:/usr/lib/hadoop-mapreduce/*:/usr/lib/hadoop-yarn/lib/*:/usr/lib/hadoop-yarn/*

我能做些什么来解决这个问题吗？

谢谢。

正如您所发现的，Dataproc 在调用 Spark 时会在类路径上包含 Hadoop 依赖项。这样做主要是为了让 Hadoop 输入格式、文件系统等的使用变得相当简单。缺点是您最终将得到 Hadoop 的 guava 版本，即 11.02（请参阅HADOOP-10101).

如何解决这个问题取决于您的构建系统。如果使用 Maven，则可以使用 maven-shade 插件将您的 guava 版本重新定位到新的包名称下。这方面的一个例子可以在GCS Hadoop Connector 的包装，但其关键在于 pom.xml 构建部分中的以下插件声明：

  <plugin>
    <groupId>org.apache.maven.plugins</groupId>
    <artifactId>maven-shade-plugin</artifactId>
    <version>2.3</version>
    <executions>
      <execution>
        <phase>package</phase>
        <goals>
          <goal>shade</goal>
        </goals>
        <configuration>
          <relocations>
            <relocation>
              <pattern>com.google.common</pattern>
              <shadedPattern>your.repackaged.deps.com.google.common</shadedPattern>
            </relocation>
          </relocations>
        </execution>
      </execution>
    </plugin>

类似的重定位可以通过 sbt 的 sbt-assemble 插件、ant 的 jarjar 以及 gradle 的 jarjar 或 Shadow 来完成。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Google Dataproc 集群实例中的 Spark-Submit 上运行应用程序 jar 文件的相关文章

Hibernate注解放置问题

我有一个我认为很简单的问题我见过两种方式的例子问题是为什么我不能将注释放在字段上让我举一个例子 Entity Table name widget public class Widget private Integer id Id G
如何在android上的python kivy中关闭应用程序后使服务继续工作

我希望我的服务在关闭应用程序后继续工作但我做不到我听说我应该使用startForeground 但如何在Python中做到这一点呢应用程序代码 from kivy app import App from kivy uix floatl
如何创建一个显示 Spinners 的 x 和 y 值的表格？

我想创建一个位于图表右侧的表格其中显示 2 列 x 和 y 值已输入到xSpin and ySpin旋转器我已经画了一张我想要桌子放置的位置的图我尝试过在网格窗格布局中使用文本框来创建表格并将值直接输入到文本框网格中但是我无法将它们
是什么决定了从 lambda 创建哪个函数式接口？

请考虑这个例子 import java util function Consumer public class Example public static void main String args Example example new
SAML 服务提供商 Spring Security

当使用预先配置的服务提供者元数据时在 Spring Security 中是否应该有 2 个用于扩展元数据委托的 bean 定义一份用于 IDP 元数据一份用于 SP 元数据
Android在排序列表时忽略大小写

我有一个名为路径的列表我目前正在使用以下代码对字符串进行排序 java util Collections sort path 这工作正常它对我的列表进行排序但是它以不同的方式处理第一个字母的情况即它用大写字母对列表进行排序然后用
OSGi：如果不取消服务会发生什么

这是我获取 OSGi 服务的方式 ServiceReference reference bundleContext getServiceReference Foo class getName Foo foo Foo bundleContex
Java AES 128 加密方式与 openssl 不同

我们遇到了一种奇怪的情况即我们在 Java 中使用的加密方法会向 openssl 生成不同的输出尽管它们在配置上看起来相同使用相同的键和 IV 文本敏捷的棕色狐狸跳过了懒狗加密为 Base64 字符串 openssl A8cMRI
按第一列排序二维数组，然后按第二列排序

int arrs 1 100 11 22 1 11 2 12 Arrays sort arrs a b gt a 0 b 0 上面的数组已排序为 1 100 1 11 2 12 11 22 我希望它们按以下方式排序a 0 b 0 首先如果
我可以使用子接口重新编译公共 API 并保持二进制兼容性吗？

我有一个公共 API 在多个项目中多次使用 public interface Process
如何模拟从抽象类继承的受保护子类方法？

如何使用 Mockito 或 PowerMock 模拟由子类实现但从抽象超类继承的受保护方法换句话说我想在模拟 doSomethingElse 的同时测试 doSomething 方法抽象超类 public abstract clas
画透明圆，外面填充

我有一个地图视图我想在其上画一个圆圈以聚焦于给定区域但我希望圆圈倒转也就是说圆的内部不是被填充而是透明的其他所有部分都被填充请参阅这张图片了解我的意思 http i imgur com zxIMZ png 上半部分显示了我可以
以编程方式在java的resources/source文件夹中创建文件？

我有两个资源文件夹 src 这是我的 java 文件资源这是我的资源文件图像 properties 组织在文件夹包中有没有办法以编程方式在该资源文件夹中添加另一个 properties 文件我尝试过这样的事情 public s
编辑文件名在 JComboBox 中的显示方式，同时保持对文件的访问

我对 Java 很陌生对堆栈溢出也很陌生我正在尝试利用 JMF API 创建一个用 Java 编码的简单媒体播放器到目前为止我已经能够设置一个简单的队列播放列表来使用JComboBox called playListHolder
有没有一种快速方法可以从 Jar/war 中删除文件，而无需提取 jar 并重新创建它？

所以我需要从 jar war 文件中删除一个文件我希望有类似 jar d myjar jar file I donot need txt 的内容但现在我能看到从 Linux 命令行执行此操作的唯一方法不使用 WinRAR Winzip
在 Spring 中重构这个的最佳方法？

private final ExecutorService executorParsers Executors newFixedThreadPool 10 public void parse List
Eclipse 中 Spring MVC 模型对象的 (jsp /jstl) 视图中的代码辅助

在 Spring MVC 中当将对象放置在视图模型中时如下所示 public String getUser Model model fetch user model addAttribute user user return viewN
为什么C++代码执行速度比java慢？

我最近用 Java 编写了一个计算密集型算法然后将其翻译为 C 令我惊讶的是 C 的执行速度要慢得多我现在已经编写了一个更短的 Java 测试程序和一个相应的 C 程序见下文我的原始代码具有大量数组访问功能测试代码也是如此 C 的
为什么这个作业不起作用？

我有课Results which extends ArrayList
调整添加的绘制组件的大小和奇怪的摆动行为

这个问题困扰了我好几天我正在制作一个特殊的绘画程序我制作了一个 JPanel 并添加了使用 Paint 方法绘制的自定义 jComponent 问题是每当我调整窗口大小时所有添加的组件都会消失或者只是不绘制因此我最终会得到一个

随机推荐

如何有条件地合并R中的两个数据框（公共列，条件）

我已经尝试这样做了大约 2 3 天但仍然找不到答案我想做的是我有两个数据框 x y 下面给出了它们的示例 X Response No Tab No Survey Date AC Name Mandal Name Village Name
我可以在 TreeSet 中插入重复的条目。如何克服这个问题

我有一个名为 Employee 的课程其中有employeeName and employeeId作为其成员变量我正在创建新的 Employee 对象然后将其添加到TreeSet我想根据以下内容对其进行排序employeeId 但我认
ASP.NET Web API - 不允许使用 PUT 和 DELETE 动词 - IIS 8

我最近从 Visual Studio 2010 升级到 Visual Studio 2012 RC 安装程序还会安装 IIS 8 Express Visual Studio 现在将其用作默认 Web 服务器 IIS 8 阻止我使用 PUT
CALAyer 子类中的不可动画属性

我定义了一个子类CALayer具有所讨论的可动画属性here 我现在想向该层添加另一个不可设置动画的属性以支持其内部簿记我将新属性的值设置为drawInContext 但我发现下次调用时它总是重置为 0 是因为 Core Animat
对话框窗口选择文件的数量限制？

Python版本 2 7 Tk版本 8 5 参考我之前的问题如何将对话框窗口中选定的文件添加到字典中我正在尝试从对话框窗口中选择 500 个文件并提取它们的名称作为字典的键文件总大小约为200M 我不知道为什么我得到一本空字典但是如
在 C 中强制执行强类型检查（typedef 的类型严格性）

有没有办法对相同类型的 typedef 强制执行显式强制转换我必须处理 utf8 有时我会对字符计数和字节计数的索引感到困惑所以最好有一些 typedef typedef unsigned int char idx t typedef
仅从 YouTube 的 URL 获取视频 ID

如何仅从 youtube 的 URL 获取视频 ID 例如 http www youtube com watch v aPm3QVKlBJg 有时 URL 会在 v 之后包含其他信息例如但我不需要其他信息只需要视频 ID 我只能想到使
如何尽早访问即将到来的 Asp.Net Identity 更改？

由于 Asp Net Identity 的每个版本之间都有很多更改是否有办法尽早访问未来即将发生的更改我们已经开始将夜间构建发布到aspnetwebstacknightly myget feed 目前 1 0 0 RTM 候选版本已经发
WPF：如何自动生成行标题而不仅仅是列标题？

我有一个WPF app with a DataGrid 我在用着AutoGenerateColumns True 填充它因为列数和行数并不总是相同问题是它仅自动生成列标题而不是行标题所以我决定做他们在这里所做的事情 http tech
如何在 Haskell 中产生无穷大？

类似于如何在 Haskell 中生成 NaN 在C中有INFINITY宏定义为math h 再次在http hackage haskell org package ClassyPrelude 0 1 docs Prelude Math
不支持 GLSL 1.30

我已经在具有良好显卡的 ubuntu 系统上成功运行了 gl 程序然而当我在带有图形移动 4 系列的旧英特尔机器上运行它时我收到以下错误 QGLShader compile Vertex 0 1 10 error GLSL 1 30
为什么使用共享库时对象和库的顺序不影响链接？

我有以下源代码 foo h void foo foo cpp include foo h include
检索组成员时出现 Microsoft Graph 3.0 java.net.SocketTimeoutException

我最近将我的应用程序升级为春季启动 2 4 4 微软图 3 0 0 在升级应用程序时我遵循了升级指南我正在使用以下代码检索组成员 public void getGroupMembersWithDevices final IGroup
定义与 IN 运算符一起使用的变量 (T-SQL)

我有一个使用 IN 运算符的 Transact SQL 查询像这样的东西 select from myTable where myColumn in 1 2 3 4 有没有办法定义一个变量来保存整个列表 1 2 3 4 我该如何定义它 d
Windows 版 Git 的官方 GUI 是哪一个？ [关闭]

Closed 这个问题是无关目前不接受答案 Windows 版 Git 的官方 GUI 是哪一个我很困惑git scm and msysgit 我知道有一个来自 github 的 GUI我也想用位桶也适用于私人免费托管我认为 Wind
if 语句中 setState() 的问题

if 语句中的 setState morePage true pageNum 1 if morePage this setState pageNum this state pageNum 1 console log this state p
我的电子邮件总是进入垃圾邮件文件夹[关闭]

Closed 这个问题是无关目前不接受答案在我的服务器中我通过 PHP 发送邮件但我的邮件总是进入垃圾邮件文件夹我做了spf记录但这并不重要我还在这个域中使用谷歌应用服务请帮忙邮件原文 Delivered To email
XPath 和 PHP：无法正常工作

这是我的代码 XML lt lt
Code First 迁移 - Update-database -script 命令生成的 SQL 脚本不起作用

我必须通过 Entity Framework 5 使用以下模型创建一个数据库 public class Post public int PostId get set MaxLength 200 public string Title get
在 Google Dataproc 集群实例中的 Spark-Submit 上运行应用程序 jar 文件

我正在运行一个 jar 文件其中包含我需要打包在其中的所有依赖项这种依赖关系之一是com google common util concurrent RateLimiter并已经检查过它的类文件是否在此 jar 文件中不幸的是当我在

在 Google Dataproc 集群实例中的 Spark-Submit 上运行应用程序 jar 文件

在 Google Dataproc 集群实例中的 Spark-Submit 上运行应用程序 jar 文件 的相关文章

随机推荐

热门标签

在 Google Dataproc 集群实例中的 Spark-Submit 上运行应用程序 jar 文件的相关文章