hadoop集群优化(三):开启日志汇聚服务

2023-10-27

说明

hadoop平台有大量组件,上线后yarn执行全平台任务,各任务日志分散在集群各节点,为了高效追踪任务执行状态,确认异常时问题,hadoop提供了日志汇聚服务,并提供yarn页面查看,默认版本该功能关闭,需要配置开启。

分享

操作

修改配置

  • 登录hadoop102,修改文件 /opt/module/hadoop-3.3.4/etc/hadoop/yarn-site.xml 增加如下配置
  <!--开启日志聚集功能-->
  <property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
  </property>

  <!-- 设置日志聚集服务器地址 -->
  <property>
    <name>yarn.log.server.url</name>
    <value>http://hadoop102:19888/jobhistory/logs</value>
  </property>

  <!-- 设置日志保留时间,单位秒 -->
  <property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
  </property>

分发

  • hadoop102 控制台执行:xsync /opt/module/hadoop-3.3.4/etc/hadoop/yarn-site.xml

重启集群

hadoop 自身脚本

  • 关闭NodeManager、ResourceManager、HistoryServer

    • hadoop102 关闭historyServer服务:mapred --daemon stop historyserver
    • hadoop103 关闭yarn并重启: /opt/module/hadoop-3.3.4/sbin/stop-yarn.sh
  • 启动:

    • hadoop103 启动yarn:/opt/module/hadoop-3.3.4/sbin/start-yarn.sh
    • hadoop102 启动历史服务器: mapred --daemon start historyserver

自定义脚本

  • 使用自定脚本 myhadoop,重启整个集群:myhadoop restart

总结

  • 日志记录程序执行信息,是追踪程序异常的重要依据,所有这个配置很关键,某些时候,程序本地环境测试ok,上线因为集群环境或数据引发异常,只能通过日志追踪修正。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

hadoop集群优化(三):开启日志汇聚服务 的相关文章

  • 我可以在没有 Hadoop 的情况下使用 Spark 作为开发环境吗?

    我对大数据和相关领域的概念非常陌生 如果我犯了一些错误或拼写错误 我很抱歉 我想了解阿帕奇火花 http spark apache org 并使用它仅在我的电脑中 在开发 测试环境中 由于Hadoop包含HDFS Hadoop分布式文件系统
  • 更改 Spark Streaming 中的输出文件名

    我正在运行一个 Spark 作业 就逻辑而言 它的性能非常好 但是 当我使用 saveAsTextFile 将文件保存在 s3 存储桶中时 输出文件的名称格式为 part 00000 part 00001 等 有没有办法更改输出文件名 谢谢
  • Hadoop 推测任务执行

    在Google的MapReduce论文中 他们有一个备份任务 我认为这与Hadoop中的推测任务是一样的 推测任务是如何实现的 当我启动一项推测任务时 该任务是从一开始就作为较旧且缓慢的任务开始 还是从较旧的任务到达的位置开始 如果是这样
  • Spark 写入 hdfs 无法使用 saveAsNewAPIHadoopFile 方法

    我在 CDH 5 2 0 上使用 Spark 1 1 0 并试图确保我可以读取和写入 hdfs 我很快意识到 textFile 和 saveAsTextFile 调用旧的 api 并且似乎与我们的 hdfs 版本不兼容 def testHD
  • hive 添加分区语句忽略前导零

    我在 hdfs 上有文件夹 user test year 2016 month 04 dt 25 000000 0 需要将上面的分区路径添加到test table 命令 ALTER TABLE test ADD IF NOT EXISTS
  • 是否可以使用 Java 读写 Parquet,而不依赖 Hadoop 和 HDFS?

    我一直在寻找这个问题的解决方案 在我看来 如果不引入对 HDFS 和 Hadoop 的依赖 就无法在 Java 程序中嵌入读写 Parquet 格式 它是否正确 我想在 Hadoop 集群之外的客户端计算机上进行读写 我开始对 Apache
  • 在蜂巢中出现错误

    当我连接到 ireport 时 如果说在 hive shell 中显示表 则会出现此错误 元数据错误 java lang RuntimeException 无法实例化 org apache hadoop hive metastore Hiv
  • Hadoop-reducer 如何获取数据?

    据我所知 映射器为每个减速器生成 1 个分区 减速器如何知道要复制哪个分区 假设有 2 个节点运行用于字数统计程序的映射器 并且配置了 2 个缩减器 如果每个映射节点生成 2 个分区 并且两个节点中的分区都可能包含相同的单词作为键 那么减速
  • 适用于 Python 3.x 的 Hive 客户端

    是否可以使用 Python 3 x 连接到 hadoop 并运行 hive 查询 我正在使用Python 3 4 1 我发现可以按照这里写的方式完成 https cwiki apache org confluence display Hiv
  • Python 包安装:pip 与 yum,还是两者一起安装?

    我刚刚开始管理 Hadoop 集群 我们使用 Bright Cluster Manager 直至操作系统级别 CentOS 7 1 然后使用 Ambari 以及适用于 Hadoop 的 Hortonworks HDP 2 3 我不断收到安装
  • 如何有效地将数据从 Kafka 移动到 Impala 表?

    以下是当前流程的步骤 Flafka http blog cloudera com blog 2014 11 flafka apache flume meets apache kafka for event processing 将日志写入
  • 使用 Java API 在 Hadoop 中移动文件?

    我想使用 Java API 在 HDFS 中移动文件 我想不出办法做到这一点 FileSystem 类似乎只想允许在本地文件系统之间移动 但我想将它们保留在 HDFS 中并将它们移动到那里 我错过了一些基本的东西吗 我能想到的唯一方法是从输
  • Impala:如何查询具有不同模式的多个镶木地板文件

    在 Spark 2 1 中我经常使用类似的东西 df spark read parquet path to my files parquet 即使具有不同的模式 也可以加载镶木地板文件的文件夹 然后我使用 SparkSQL 对数据帧执行一些
  • 如何对 RDD 进行分区

    我有一个文本文件 其中包含大量由空格分隔的随机浮动值 我正在将此文件加载到 scala 中的 RDD 中 这个RDD是如何分区的 另外 是否有任何方法可以生成自定义分区 以便所有分区都具有相同数量的元素以及每个分区的索引 val dRDD
  • Hive 聚集在多个列上

    据我所知 当配置单元表聚集在一列上时 它会执行该分桶列的哈希函数 然后将该行数据放入其中一个桶中 每个桶都有一个文件 即如果有 32 个桶 那么 hdfs 中就有 32 个文件 将 clustered by 放在多个列上意味着什么 例如 假
  • 伪模式下没有名称节点错误

    我是hadoop新手 正处于学习阶段 根据 Hadoop Definitve 指南 我已将 hadoop 设置为伪分布式模式 一切正常 昨天我什至能够执行第三章中的所有示例 今天 当我重新启动我的unix并尝试运行start dfs sh然
  • 将数据从 .txt 文件加载到 Hive 中以 ORC 形式存储的表

    我有一个数据文件位于 txt格式 我正在使用该文件将数据加载到 Hive 表中 当我将文件加载到类似表中时 CREATE TABLE test details txt visit id INT store id SMALLINT STORE
  • MapReduce 中的分区到底是如何工作的?

    我认为我总体上对 MapReduce 编程模型有一定的了解 但即使在阅读了原始论文和其他一些来源之后 我仍然不清楚许多细节 特别是关于中间结果的分区 我将快速总结到目前为止我对 MapReduce 的理解 我们有一个可能非常大的输入数据集
  • 通过Oozie命令行指定多个过滤条件

    我正在尝试通过命令行搜索一些特定的 oozie 作业 我使用以下语法进行相同的操作 oozie jobs filter status RUNNING status KILLED 但是 该命令仅返回正在运行的作业 而不是已杀死的作业 需要帮助
  • Hadoop fs 查找块大小?

    在 Hadoop fs 中如何查找特定文件的块大小 我主要对命令行感兴趣 例如 hadoop fs hdfs fs1 data 但看起来这并不存在 有Java解决方案吗 The fsck其他答案中的命令列出了块并允许您查看块的数量 但是 要

随机推荐

  • C++ 用两个栈实现一个队列

    首先我们要看看栈和队列的特点 栈的特点 先进后出 队列的特点 先进先出 队列的出队顺序与栈的出栈是相反的 我们把数据压入第一个栈 如果再把这个栈里面的元素依次压入第二个栈 此时栈2里面的元素的顺序 相当于对一组数据进行了两次倒序 此时对第二
  • python 的继承重写和 super函数

    1 super函数实现父类方法的继承和重写 class Car1 def init self color weight self color color self wheel 4 self weight weight self speed
  • 防止连接Mysql超时,JDBC探活配置

    我们知道Mysql有两个关于连接超时的参数 默认为8小时 MySQL gt show global variables like timeout wait timeout 28800 非交互连接等待时间 interactive timeou
  • php 检测用户名已存在错误,验证用户名时出现PHP错误

    我正在使用PHP构建一个网站 我需要验证用户输入的名称是否正确 由于JavaScript是客户端的 我不能完全依赖它 所以这是我的服务器端函数来验证用户名 function validate name name name trim name
  • Intellij IDEA安装YAML插件

    1 下载插件 http pan baidu com s 1nvgECTN 2 安装插件 Intellij IDEA File gt Settings gt Plugins gt Install plugin from disk gt 选择插
  • Mac下安装Metaspoit

    Mac下安装Metaspoit 在mac下安装的方式 1 先去官网上下载对应的dmg文件 想要不花钱的话就可以对应的去 下载社区版本的 连接 https osx metasploit com metasploitframework late
  • PhpStorm 上面的git集成用法

    phpStrom这个php的 IDE完美的集合了git 对于有些对命令行不是很熟悉的同学来说 这可以带来很大的帮助 下面我给大家说一下具体的用法 1 我们提交自己的代码 a 在我们的项目上 右击 如图所示 相当于 git add 这个大家都
  • 使用DS18B20模块的Arduino模拟温度计

    有时 我们需要在项目中添加一个温度指示器 因此 在本篇文章中 您将学习如何使用Arduino和DS18B20温度传感器制作一款模拟温度计 DS18B20模块 首先 Maxim DS18B20数字温度计提供9位至12位摄氏温度测量 并具有报警
  • linux机试题,智一面之荣耀机试题 2021.04 ~05

    记录下最近面试的算法题 题目记得不是特别清楚了 大致描述 一 2021 04 17荣耀机试 1 数组排序 题目描述 输入多个数字 按数字从小到大排序 输入描述 多个整数 保证都在int范围内 用空格隔开 输出描述 从小到大的值 用空格隔开
  • qt 带复选框的下拉列表

    参考 Qt之QComboBox定制 核心思想 void QComboBox setView QAbstractItemView itemView void QComboBox setModel QAbstractItemModel mode
  • pandas dataframe类型数据的反转(reverse)

    data iloc 1
  • 瀑布流实现的三种方法js jq css3

    一 样式 div div class box div class pic img src images 1 jpg div div div class box div class pic img src images 2 jpg div d
  • LeetCode 题解——岛屿数量

    大家好 我是前端西瓜哥 今天我们做一道经典算法题 岛屿数量 LeetCode 上对应题目为 200 题 https leetcode cn com problems number of islands 这道题归属于岛屿问题 是有固定套路的
  • selenium处理各类滑块验证码

    selenium处理各类滑块验证码 滑动验证码 案例展示 实现 滑块拼图验证码 案例展示 实现 滑块拼图验证码 Canvas 案例展示 实现 滑动验证码 案例展示 这种只要用鼠标点击并移动指定距离就可以完成验证 x轴 实现 coding u
  • I2C总线时序以及ACK和NACK(NAK),SCL被从机拉低?

    1 I2C协议详解及裸机程序分析 简书 通俗易懂 根据上图 我们首先设置IICCON 来设置时钟 时钟源是PCLK 是50MHZ 太快了我们需要设置这个分频系数 把时钟降低 降低到我们想要的SCL 然后我们要发出start信号 我们需要设置
  • VUE >>> /deep/ ::v-deep

    深层样式 gt gt gt 别名 deep v deep 给父元素添加 类名 需要 借助于深层样式 gt gt gt 只可使用于css deep 如果有scoped 但 不使用第三方css扩展语言 可以使用 v deep 使用scss或者其
  • vue 地图坐标相互转换(GCJ-02,BD-09,WGS84)百度,火星,高德等坐标相互转换(最全代码,开箱即用)

    封装好的 js 代码 GCJ 02 中国坐标偏移标准 Google Map 高德 腾讯使用 BD 09 百度坐标偏移标准 Baidu Map使用 百度坐标 WGS 84 是国际标准 GPS坐标 Google Earth使用 或者GPS模块
  • 详解 先序树遍历VS递归树形结构

    通常树形结构的存储 是在子节点上存储父节点的编号来确定各节点的父子关系 如图 与之对应的表数据 department 部门表结构 id 部门编号 name 部门名称 level 所在树层级 parent id 上级部门编号 1 问题来了 传
  • cartographer当机器人不动时,同时收到landmark,如何解决定位问题?

    上一次 我们通过修改代码 实现了当机器人静止不动时 不再向后端发送回环检测 即不再向后端添加node 这样造成的结果就是 如果有landmark同时发送过来 也不会立即进行后端优化 如何解决这个问题呢 我给出了一种解决办法 如下 1 为前端
  • hadoop集群优化(三):开启日志汇聚服务

    文章目录 说明 分享 操作 修改配置 分发 重启集群 hadoop 自身脚本 自定义脚本 总结 说明 hadoop平台有大量组件 上线后yarn执行全平台任务 各任务日志分散在集群各节点 为了高效追踪任务执行状态 确认异常时问题 hadoo