即使在应用程序中设置核心，Spark UI 也显示 0 核心

2024-02-12

我在运行 Spark Master url 之外的应用程序时遇到了一个奇怪的问题，其中 UI 无限期地报告“等待”的“状态”，因为无论我将核心计数配置为什么，“正在运行的应用程序”表下都会显示 0 个核心是。

我已经使用以下设置配置了我的应用程序，其中spark.max.cores = 2＆spark.default.cores = 2＆内存设置为3GB。该机器是具有超过 24 个核心的企业级服务器。

        SparkConf conf = new SparkConf()
            .setAppName(Properties.getString("SparkAppName"))
            .setMaster(Properties.getString("SparkMasterUrl"))
            .set("spark.executor.memory", Properties.getString("SparkExecMem"))
            .set("spark.cores.max",Properties.getString("SparkCores"))
            .set("spark.driver.memory",Properties.getString("SparkDriverMem"))
            .set("spark.eventLog.enabled", "true")
            .set("spark.deploy.defaultCores",Properties.getString("SparkDefaultCores"));

    //Set Spark context
    JavaSparkContext sc = new JavaSparkContext(conf);
    JavaStreamingContext jssc = new JavaStreamingContext(sc, new Duration(5000));

Spark WebUI 声明使用了零个核心并且无限期等待没有任务运行。该应用程序在运行时或核心期间也不使用任何内存，并且在启动时立即进入等待状态。

Spark-defaults.conf 
spark.yarn.max_executor.failures         3
spark.yarn.applicationMaster.waitTries   10
spark.history.kerberos.keytab    none
spark.yarn.preserve.staging.files        False
spark.yarn.submit.file.replication       3
spark.history.kerberos.principal         none
spark.yarn.historyServer.address         {removed}.{removed}.com:18080
spark.yarn.scheduler.heartbeat.interval-ms       5000
spark.yarn.queue         default
spark.yarn.containerLauncherMaxThreads   25
spark.yarn.driver.memoryOverhead         384
spark.history.ui.port    18080
spark.yarn.services      org.apache.spark.deploy.yarn.history.YarnHistoryService
spark.yarn.max.executor.failures         3
spark.driver.extraJavaOptions     -Dhdp.version=2.2.6.0-2800
spark.history.provider   org.apache.spark.deploy.yarn.history.YarnHistoryProvider
spark.yarn.am.extraJavaOptions    -Dhdp.version=2.2.6.0-2800
spark.yarn.executor.memoryOverhead       384

提交脚本

spark-submit --class {removed}.{removed}.{removed}.sentiment.MainApp --deploy-mode client /path/to/jar

编辑：2016 年 2 月 3 日使用 --master yarn-cluster 运行后，我在纱线日志错误中收到此错误。我还包括了更新的提交配置

提交配置

spark-submit --class com.removed.removed.sentiment.MainApp 
--master yarn-cluster --supervise 
/data04/dev/removed/spark/twitternpi/npi.sentiment-1.0-SNAPSHOT-shaded.jar 
--jars /usr/hdp/2.2.6.0-2800/spark/lib/datanucleus-core-3.2.10.jar,/usr/hdp/2.2.6.0-2800/spark/lib/datanucleus-api-jdo-3.2.6.jar,/usr/hdp/2.2.6.0-2800/spark/lib/datanucleus-rdbms-3.2.9.jar,/usr/hdp/2.2.6.0-2800/spark/lib/spark-1.2.1.2.2.6.0-2800-yarn-shuffle.jar,/usr/hdp/2.2.6.0-2800/spark/lib/spark-assembly-1.2.1.2.2.6.0-2800-hadoop2.6.0.2.2.6.0-2800.jar

错误信息

   ClassLoaderResolver for class "" gave error on creation : {1}
org.datanucleus.exceptions.NucleusUserException: ClassLoaderResolver for class "" gave error on creation : {1}
    at org.datanucleus.NucleusContext.getClassLoaderResolver(NucleusContext.java:1087)
    at org.datanucleus.PersistenceConfiguration.validatePropertyValue(PersistenceConfiguration.java:797)
    at org.datanucleus.PersistenceConfiguration.setProperty(PersistenceConfiguration.java:714)
    at org.datanucleus.PersistenceConfiguration.setPersistenceProperties(PersistenceConfiguration.java:693)
    at org.datanucleus.NucleusContext.<init>(NucleusContext.java:273)
    at org.datanucleus.NucleusContext.<init>(NucleusContext.java:247)
    at org.datanucleus.NucleusContext.<init>(NucleusContext.java:225)

当执行器所需的内存大小由以下设置时，我遇到了这个问题spark.executor.memory in spark-defaults.conf，比 AWS 节点上的更大。但由于你只设置了3.0 GB作为你的内存，我认为你的情况可能还有其他原因。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

即使在应用程序中设置核心，Spark UI 也显示 0 核心的相关文章

Spark 2.1无法在CSV上写入Vector字段

当我将代码从 Spark 2 0 迁移到 2 1 时我偶然发现了与 Dataframe 保存相关的问题这是代码 import org apache spark sql types import org apache spark ml l
Spark：用列的平均值替换数据框中的空值

如何创建 UDF 以编程方式将每列中 Spark 数据框中的空值替换为列平均值例如在示例中数据 col1 空值的值为 2 4 6 8 5 5 5 示例数据 col1 col2 col3 2 null 3 4 3 3 6 5 null
使用 Spark pandas_udf 创建列，具有动态数量的输入列

我有这个 df df spark createDataFrame row a 5 0 0 0 11 0 row b 3394 0 0 0 4543 0 row c 136111 0 0 0 219255 0 row d 0 0 0 0 0
Spark RDD默认分区数

版本 Spark 1 6 2 Scala 2 10 我正在执行以下命令spark shell 我试图查看 Spark 默认创建的分区数量 val rdd1 sc parallelize 1 to 10 println rdd1 getNum
scala/spark 代码不允许在 hive 中添加列

如果源数据有新列我尝试在 Hive 表中添加一列所有新列的检测都运行良好但是当我尝试将列添加到目标表时我收到此错误 for f lt df schema fields if f name chk spark sqlContext
为什么 Databricks Connect Test 无法在 Mac 上运行？

我已经阅读了配置文档databricks connect但运行时仍然出现以下错误databricks connect test 来自终端的错误 java lang NoSuchMethodError org apache spark int
如何抑制spark输出控制台中的“Stage 2===>”？

我有数据帧并试图获取不同的计数并且能够成功获取不同的计数但是每当 scala 程序执行时我都会收到此消息 Stage 2 gt 1 1 2 我如何在控制台中抑制特定的此消息 val countID dataDF select substr
Spark - 如何在本地运行独立集群

是否有可能运行Spark独立集群仅在一台机器上进行本地操作这与仅在本地开发作业基本上不同即local 到目前为止我正在运行 2 个不同的虚拟机来构建集群如果我可以在同一台机器上运行一个独立的集群该怎么办例如三个不同的 JVM 正
任务和分区之间有什么关系？

我能说么 Spark任务的数量等于Spark分区的数量吗执行器运行一次执行器内部的批处理等于一个任务吗每个任务只产生一个分区 1 的重复并行度或可以同时运行的任务数量由以下公式设置 Executor实例的数量配置每个执行器的
使用 Spark DataFrame 获取组后所有组的 TopN

我有一个 Spark SQL DataFrame user1 item1 rating1 user1 item2 rating2 user1 item3 rating3 user2 item1 rating4 如何按用户分组然后返回TopN
PySpark Yarn 应用程序在 groupBy 上失败

我正在尝试在 Yarn 模式下运行一个处理大量数据的作业 2TB 从谷歌云存储读取管道可以总结如下 sc textFile gs path json map lambda row json loads row map toKvPair g
为什么 Spark 比 Hadoop MapReduce 更快

有人可以使用字数统计示例解释一下为什么 Spark 比 MapReduce 更快吗 bafna的答案提供了故事的记忆方面但我想补充另外两个重要事实 DAG和生态系统 Spark 使用惰性求值来形成连续计算阶段的有向无环图 DAG 通过
在 Spark 2.1.0 中启用 _metadata 文件

Spark 2 1 0 中保存空 Parquet 文件似乎已损坏因为无法再次读入它们由于模式推断错误我发现从 Spark 2 0 开始写入 parquet 文件时默认禁用写入 metadata 文件但我找不到重新启用此功能的配置设
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
使用spark phoenix从表中读取rdd分区号为1

当我运行我的火花代码时 val sqlContext spark sqlContext val noact table primaryDataProcessor getTableData sqlContext zookeeper table
Spark：Shuffle Write、Shuffle 溢出（内存）、Shuffle 溢出（磁盘）之间的区别？

我有以下 Spark 工作试图将所有内容保留在内存中 val myOutRDD myInRDD flatMap fp gt val tuple2List ListBuffer String myClass ListBuffer tuple
无法在 virtualenv 中加载 pyspark

我已经在 python virtualenv 中安装了 pyspark 我还安装了新发布的jupyterlabhttp jupyterlab readthedocs io en stable getting started installa
懒惰背景下的变革与行动

正如 Learning Spark 闪电般快速的大数据分析一书中提到的由于 Spark 计算 RDD 的方式不同转换和操作也有所不同在对惰性进行一些解释之后我发现转换和操作都是惰性地进行的那么问题来了这句话的意思是什么对比
为什么我的执行程序核心构建指定了 OOM？

我有一个正在运行的构建DRIVER MEMORY LARGE NUM EXECUTORS 64 and EXECUTOR CORES LARGE 为什么这没有足够的资源来防止我的工作因执行者损失而失败OOM https stackoverf
AWS EMR Spark Python 日志记录

我正在 AWS EMR 上运行一个非常简单的 Spark 作业但似乎无法从我的脚本中获取任何日志输出我尝试过打印到 stderr from pyspark import SparkContext import sys if name m

随机推荐

如何使用自定义行为设置折叠工具栏的背景以适合整个屏幕

我正在关注一个很好的存储库它展示了如何使折叠工具栏的自定义行为WhatsApp 个人资料折叠工具栏 https github com anton46 WhatsApp ProfileCollapsingToolbar 我不喜欢的是当工具
HTML 选取框在 iOS 5.1 中不工作

请看下面的函数 void loadHTMLinWebView objWebView UIWebView alloc initWithFrame CGRectMake 0 0 self frame size width self frame
淘汰赛换行值绑定

我在用Mathias Bynen 的占位符代码 https github com mathiasbynens jquery placeholder我想将它与淘汰赛一起使用如果我做一个简单的自定义绑定如下所示 ko bindingHand
Win RT XAML 中的布尔到可见性转换器第一次无法工作

今天在 Windows RT Windows 商店应用程序的 XAML 中工作时很奇怪当IsValid true从我的视图模型设置我的布尔到可见性转换器第一次不起作用我的路径保持隐藏但随后确实显示正确的可见性这是一个错误还是可能
Android Scrollview 具有 videoview 会出现问题

我有一个位于滚动视图内的视频视图当我滚动滚动视图时视频视图不会随之滚动就好像它的位置是固定的一样这是我的布局
如何从 C# 中的 URL 下载文件？

从 URL 路径下载文件的简单方法是什么 using var client new WebClient client DownloadFile http example com file song a mpeg a mpeg
量角器需要密码才能登录 => 不安全？

我开始使用 Protractor 进行 e2e 测试要测试某些页面我首先需要登录现在我有这部分用于输入密码 var passInput element by id Passwd passInput sendKeys test 现在当
如何获取 eq() 值？

这可能吗为了让我得到eq 价值例如如果我单击li eq 2 var x会变成2 这是代码 numbers ul li click function x this eq val alert x The index what is thi
从 Uri 转换位图返回 null [重复]

这个问题在这里已经有答案了在我的 Android 应用程序中我使用 Google 驱动器来选择图像和文件对于文件我的代码在大多数情况下都运行良好不幸的是在某些情况下图像导入不起作用图像位图返回空值下面是我用来将内容 URI
我们如何处理 BDD 场景的微小排列？

我喜欢 BDD 开发方法但我遇到了一个问题即该方法能走多远这条来自 ThoughtWorks 的最新评论Radar http thoughtworks fileburst com assets thoughtworks tech ra
使用 Guice AOP 在 Jersey 中进行方法拦截

是否可以使用 Guice AOP 拦截 Jersey 资源上的带注释的方法我已经成功配置了 Guice 与 Jersey 的依赖注入集成没有任何问题但是我配置的拦截器根本没有拦截我带注释的方法 web xml
在 Bootstrap 3 的弹出窗口中放置一个表单？ [复制]

这个问题在这里已经有答案了如何在 Bootstrap 3 中的弹出窗口中放置表单 a href class btn btn lg btn danger title Click It a 它给出了如下效果我想在它的体内放置一个形式我们怎
Rails 与非 Rails 数据库设计

完全新手研究 Rails Rails 是否可以与不符合 Rails 默认命名和设计约定的只读模式一起使用例如我的数据库架构具有使用字符串列作为唯一主键的基表例如名为 Jobs 的基表可能具有定义为 Jobs Job 的唯一主键并且
IntelliJ Idea - 在调试器中搜索值

我需要知道是否可以在 IntelliJ Idea 的调试器中搜索值示例您有一个巨大的对象树您需要找到设置为相同特定值的字符串变量有什么办法可以做到这一点吗展开此树以便您可以看到所有这些字符串然后开始输入您要搜索的内容快速搜索应
在嵌套片段中使用 OptionsMenu

我使用在我的主机活动中实现的 NavigationDrawer 模式菜单活动我的导航有 3 个项目项目 1 项目 2 项目 3 每个项目都绑定到一个片段当我单击 Item 1 时我显示了一个片段 A 它实现了具有多个片段嵌套片段
访问抽象类 (Scala) 中构造函数创建的字段

我有一个实现一种方法的抽象类我如何访问参数internalValue 由抽象类构造函数设置 abstract class Value internalValue Int def equal v Value Boolean def notE
如何查询以二进制形式存储在数据库中的 UUID（JPA/Hibernate/MySQL）

我有一个基于 Java JPA Hibernate MySQL 的应用程序我想使用 UUID 进行对象标识但我想确保数据库性能不会受到影响我发现了这篇很棒的博客文章JPA 和 UUID 主键 http www thebinaryidi
如何在ag-grid中动态设置行高和列宽

我已经使用它来尝试适应列和行的宽度如何在ag grid中动态设置行高和列宽请在typescript中提供git hub代码我假设您想根据行的内容设置行高步骤 1 将 getRowHeight 属性设置为 JavaScript 函数
在编译时强制存在无参构造函数 (Java)

我有一堂课有点像这样 public class Test private final List
即使在应用程序中设置核心，Spark UI 也显示 0 核心

我在运行 Spark Master url 之外的应用程序时遇到了一个奇怪的问题其中 UI 无限期地报告等待的状态因为无论我将核心计数配置为什么正在运行的应用程序表下都会显示 0 个核心是我已经使用以下设置配置了我的应用程序

即使在应用程序中设置核心，Spark UI 也显示 0 核心

即使在应用程序中设置核心，Spark UI 也显示 0 核心 的相关文章

随机推荐

热门标签

即使在应用程序中设置核心，Spark UI 也显示 0 核心的相关文章