YARN 作业历史记录不可访问

2024-03-19

我正在使用来自源代码的最新 hadoop 版本 3.0.0。我已经启动并运行了时间轴服务，并配置了 hadoop 以将其用于作业历史记录。但是，当我单击资源管理器 UI 中的历史记录时，出现以下错误：-

HTTP ERROR 404

Problem accessing /jobhistory/job/job_1444395439959_0001. Reason:

    NOT_FOUND

有人可以指出我在这里缺少什么吗？以下是我的yarn-site.xml：-

<configuration>

<!-- Site specific YARN configuration properties -->
<property>
  <description>The hostname of the Timeline service web application.</description>
  <name>yarn.timeline-service.hostname</name>
  <value>0.0.0.0</value>
</property>
<property>
  <description>Address for the Timeline server to start the RPC server.</description>
  <name>yarn.timeline-service.address</name>
  <value>${yarn.timeline-service.hostname}:10200</value>
</property>

<property>
  <description>The http address of the Timeline service web application.</description>
  <name>yarn.timeline-service.webapp.address</name>
  <value>${yarn.timeline-service.hostname}:8188</value>
</property>

<property>
  <description>The https address of the Timeline service web application.</description>
  <name>yarn.timeline-service.webapp.https.address</name>
  <value>${yarn.timeline-service.hostname}:8190</value>
</property>

<property>
  <description>Handler thread count to serve the client RPC requests.</description>
  <name>yarn.timeline-service.handler-thread-count</name>
  <value>10</value>
</property>
<property>
  <description>Indicate to ResourceManager as well as clients whether
  history-service is enabled or not. If enabled, ResourceManager starts
  recording historical data that Timelien service can consume. Similarly,
  clients can redirect to the history service when applications
  finish if this is enabled.</description>
  <name>yarn.timeline-service.generic-application-history.enabled</name>
  <value>true</value>
</property>

<property>
  <description>Store class name for history store, defaulting to file system
  store</description>
  <name>yarn.timeline-service.generic-application-history.store-class</name>
  <value>org.apache.hadoop.yarn.server.applicationhistoryservice.FileSystemApplicationHistoryStore</value>
</property>
<property>
     <description>URI pointing to the location of the FileSystem path where the history will be persisted.</description>
     <name>yarn.timeline-service.generic-application-history.fs-history-store.uri</name>
     <value>/tmp/yarn/system/history</value>
</property>
<property>
     <description>T-file compression types used to compress history data.</description>
     <name>yarn.timeline-service.generic-application-history.fs-history-store.compression-type</name>
     <value>none</value>
</property>



 <property>
     <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  <property>
    <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
    <value>org.apache.hadoop.mapred.ShuffleHandler</value>
  </property>
</configuration>

和我的mapred-site.xml

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>localhost:10200</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>localhost:8188</value>
</property>
<property>
<name>mapreduce.job.emit-timeline-data</name>
<value>true</value>
</property>
</configuration>

JPS 输出：

6022 NameNode
27976 NodeManager
27859 ResourceManager
6139 DataNode
6310 SecondaryNameNode
28482 ApplicationHistoryServer
29230 Jps

如果您想通过 YARN RM Web UI 查看日志，则需要启用日志聚合。为此，您需要在yarn-site.xml中设置以下参数：

  <property>
      <name>yarn.log-aggregation-enable</name>
      <value>true</value>
  </property>
  <property>
     <name>yarn.nodemanager.remote-app-log-dir</name>
     <value>/app-logs</value>
  </property>
  <property>
      <name>yarn.nodemanager.remote-app-log-dir-suffix</name>
      <value>logs</value>
  </property>

如果不启用日志聚合，则网管会将日志存储在本地。通过上述设置，日志将聚合在 HDFS 中的“/app-logs/{username}/logs/”处。在此文件夹下，您可以找到迄今为止运行的所有应用程序的日志。同样，日志保留由配置参数“yarn.log-aggregation.retain-seconds”（保留聚合日志的时间）决定。

当 MapReduce 应用程序运行时，您可以从 YARN 的 Web UI 访问日志。应用程序完成后，日志将通过 Job History Server 提供。

另外，在yarn-site.xml中设置以下配置参数：

<property>
  <name>yarn.log.server.url</name>
  <value>http://{job-history-hostname}:8188/jobhistory/logs</value>
</property>

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

hadoopyarn

YARN 作业历史记录不可访问的相关文章

Pig 10.0 - 将元组分组并在 foreach 中合并包

我在用着Pig 10 0 我想在 foreach 中合并包假设我有以下内容visitors alias a b 1 2 3 4 a d 1 3 6 a e 7 z b 1 2 3 我想对第一个字段上的元组进行分组并将包与一组语义合并以获
Talend 和 Apache Spark？

我对 Talend 和 Apache Spark 在大数据生态系统中的定位感到困惑因为 Apache Spark 和 Talend 都可以用于 ETL 有人可以用一个例子解释一下吗 Talend 是一种基于工具的大数据方法通过内置组件支
hive 添加分区语句忽略前导零

我在 hdfs 上有文件夹 user test year 2016 month 04 dt 25 000000 0 需要将上面的分区路径添加到test table 命令 ALTER TABLE test ADD IF NOT EXISTS
无法验证 serde：org.openx.data.jsonserde.jsonserde

我编写了这个查询来在配置单元上创建一个表我的数据最初是 json 格式所以我已经下载并构建了 serde 并添加了它运行所需的所有 jar 但我收到以下错误 FAILED Execution Error return code 1 fr
Sqoop 导出分区的 Hive 表

我在尝试导出分区的 Hive 表时遇到了一些问题这是否完全受支持我尝试用谷歌搜索并找到一张 JIRA 票证 sqoop export connect jdbc mysql localhost testdb table sales exp
将 Apache Zeppelin 连接到 Hive

我尝试将我的 apache zeppelin 与我的 hive 元存储连接起来我使用 zeppelin 0 7 3 所以没有 hive 解释器只有 jdbc 我已将 hive site xml 复制到 zeppelin conf 文件夹
公平调度器和容量调度器有什么区别？

我是 Hadoop 世界的新手想了解公平调度程序和容量调度程序之间的区别另外我们什么时候应该使用每一个请简单地回答一下因为我在网上读了很多东西但从中得到的不多公平调度是一种为作业分配资源的方法使得所有作业随着时间的推移平均获得
适用于 Python 3.x 的 Hive 客户端

是否可以使用 Python 3 x 连接到 hadoop 并运行 hive 查询我正在使用Python 3 4 1 我发现可以按照这里写的方式完成 https cwiki apache org confluence display Hiv
与文件名中的冒号“：”作斗争

我有以下代码用于加载大量 csv gz 并将它们转储到其他文件夹中并将源文件名作为一列 object DailyMerger extends App def allFiles path File List File val parts
如何有效地将数据从 Kafka 移动到 Impala 表？

以下是当前流程的步骤 Flafka http blog cloudera com blog 2014 11 flafka apache flume meets apache kafka for event processing 将日志写入
无法在 Presto 中读取数据 - 在 Hive 中可以读取数据

我有一个 Hive DB 我创建了一个与 Parquet 文件类型兼容的表 CREATE EXTERNAL TABLE default table date date udid string message token string PAR
如何在Hadoop中序列化List集合对象？

有没有办法在 Hadoop 中序列化 java 集合 The Writable接口仅适用于 Java 原语我有以下类属性 private String keywords private List
我如何判断我的 Spark 工作是否有进展？

我有一个正在运行的 Spark 作业YARN它似乎只是挂起并且没有进行任何计算这是当我这样做时纱线所说的yarn application status
如何用snappy解压hadoop的reduce输出文件尾？

我们的 hadoop 集群使用 snappy 作为默认编解码器 Hadoop作业减少输出文件名就像part r 00000 snappy JSnappy 无法解压缩文件 bcz JSnappy 需要以 SNZ 开头的文件归约输出文件以某种
Hive 聚集在多个列上

据我所知当配置单元表聚集在一列上时它会执行该分桶列的哈希函数然后将该行数据放入其中一个桶中每个桶都有一个文件即如果有 32 个桶那么 hdfs 中就有 32 个文件将 clustered by 放在多个列上意味着什么例如假
Spark/Yarn：HDFS 上不存在文件

我在 AWS 上设置了 Hadoop Yarn 集群有 1 个主服务器和 3 个从服务器我已经验证我有 3 个活动节点在端口 50070 和 8088 上运行我在客户端部署模式下测试了 Spark 作业一切正常当我尝试使用 Spa
Protobuf RPC 在 Hadoop 2.2.0 单节点服务器上不可用？

我正在尝试在按照本教程安装的本地单节点集群上运行 hadoop 2 2 0 mapreduce 作业 http codesfusion blogspot co at 2013 10 setup hadoop 2x 220 on ubuntu
匿名类上的 NotSerializedException

我有一个用于过滤项目的界面 public interface KeyValFilter extends Serializable public static final long serialVersionUID 7069537470113
通过 Java 连接 Apache Drill

在 Apache Drill 的 Wiki 中我只能看到通过 SqlLine 客户端运行的查询除了 REST API 之外是否有任何编程方式可以在 Drill 中运行查询有任何示例或指示吗或者它与使用 JDBC 驱动程序运行 SQ
使用 Hive 计算文本变量的单词频率

我有一个变量每一行都是一个句子例子 Row1 Hey how are you Rwo2 Hey Who is there 我希望输出是按单词分组的计数 Example Hey 2 How 1 are 1 我正在使用 split a bi

随机推荐

如何让 sphinx 在构建 html 时查找 virtualenv 中的模块？

我想使用 virtualenv 而不是我机器上的本机环境来构建 html 文档我已经进入 virtualenv 但当我运行时make html我收到错误消息提示模块无法导入 Iknow这些错误是由于该模块在我的本机环境中不可用造成的如
我可以为 Istio 预置的经典 AWS ELB 定义子域吗？

我将 Istio 部署在 AWS EKS 托管的 Kubernetes 集群中这创建了一个名为 istio ingressgateway 的 LoadBalancer 类型的 Kubernetes 服务其外部主机名为 redacted
未找到基表或视图：1146 表

Error 照亮数据库 QueryException 42S02 SQLSTATE 42S02 未找到基表或视图 1146 表 mmictltd admins 不存在 SQL select fromadmins where email 电
当我尝试更新实体框架中的模型时，为什么会出现“无法更新实体集，因为它有 DefiningQuery...”异常？

使用实体框架借助 LINQ to SQL 进行更新时会引发异常 System Data UpdateException Unable to update the EntitySet t emp because it has a Defin
Java 中有类似 PHP 的三元运算符的简短版本吗？

在 PHP 中三元运算符有一个简短的版本 expr1 expr2 expr3 变成 expr1 expr3 简短版本返回 true 时 expr1 的结果和 false 时 expr3 的结果这允许很酷的代码可以根据自己的当前状态填充变
用两个 CGPoints SpriteKit Swift 创建一条线

我正在尝试制作一个简单的应用程序您触摸一个点无论您触摸哪里精灵都会沿着一条线穿过该点到达屏幕边缘我想绘制连接精灵原点它的起点和您触摸的点的线段以及精灵原点和屏幕边缘终点之间的线段这样我就可以可视化路径精灵以及原点触摸点和终
如何防止 Visual Studio 2012 扩展 MSBuild 4 通配符？

我最近将我们的构建平台从基于 rake 的古老构建别问认真的迁移到使用 msbuild 的构建平台因为我们的许多团队成员不使用 Visual Studio 再次强调不要问他们习惯于将 cs 文件放入项目文件夹中然后让它神奇地作
带参数导航返回的 React Router 需要双击

简单的问题当我处于例如 dashboard路由器我点击路由器并尝试返回 dashboard它对葡萄酒有效但是从什么时候开始 users userID我导航到另一个路由器 users userID路由器并尝试返回我需要单击后退按钮两次
R：在数据框或矩阵中使用 t.test 函数[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案询问代码的问题必须对所解决的问题表现出最低限度的了解包括尝试的解决方案为什么它们不起作用以及预期结果也可以看看 Stack Over
c# httpwebrequest getResponse() 冻结并挂起我的程序

我试图使用 httpwebrequest 在远程服务器上使用类似于休息的服务从第一次执行本身开始我的代码就挂起了程序然后我尝试将它作为控制台应用程序以确保它与程序本身无关但没有运气 string credentialsJson u
TreeView — 选定的节点样式不会出现在选定的节点上

我的代码是
Java 项目的 SLOC

我需要一个免费工具来计算 Java 项目的 SLOC 我只需要以下指标 SLOC 注释行数可选地javadoc 指标可选地按文件类型 java js css html xml 等对统计信息进行排序 Bonus 100 Java 我不喜
Python Base 36 编码

如何在 Python 中以 36 为基数对整数进行编码然后再次解码您尝试过维基百科的示例代码吗 def base36encode number alphabet 0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ
Django TypeError：没有主键值的模型实例是不可散列的

我有我的models py如下 class Article models Model date models DateTimeField null True blank True title models TextField default
如何根据用户摘要生成随机 5 位数字

大家好我尝试根据用户总摘要生成 50 个 5 位数字例如用户给出 500000 然后我需要随机数 5 位乘 50 个数字等于 500000 我尝试了这个但它不是 5 位数字 int balane 500000 int nums 50
双向git镜像

我有兴趣将本地 git 存储库设置为远程存储库的镜像我读过一些可能相关的帖子但主要区别是我需要对两个存储库具有读写访问权限大多数时候用户将针对 Repo A 进行工作但有时他们会针对 Repo B 进行工作并且这些需要通过服务器
统计某个时间段之前和之后存在的值

我有以下简单的表格您也可以在SQL Fiddle here http www sqlfiddle com 9 74d8fb 3 CREATE TABLE Orders Customer TEXT Order Date DATE INSER
带有 CSS 的 GWT Html 文件

当我使用 GWT 插件创建新项目时它会为我创建一个框架项目在html文件中有一条注释说考虑内联 CSS 以减少请求的文件数量为什么我要考虑使用内联CSS 我很难将 css 放在单独的文件中而不是内联会减少文件的大小吗不是吗答案
检查 Wicket 中的用户代理

我使用的是 wicket 1 5 但我无法在getClientInfo 方法 WebRequest RequestCycle get getRequest 我在其他地方看到了这段代码 WebClientInfo clientInfo Web
YARN 作业历史记录不可访问

我正在使用来自源代码的最新 hadoop 版本 3 0 0 我已经启动并运行了时间轴服务并配置了 hadoop 以将其用于作业历史记录但是当我单击资源管理器 UI 中的历史记录时出现以下错误 HTTP ERROR 404 Probl

YARN 作业历史记录不可访问

YARN 作业历史记录不可访问 的相关文章

随机推荐

热门标签

YARN 作业历史记录不可访问的相关文章