我可以动态重命名oozie作业名称吗

2024-03-25

我们有一个 Hadoop 服务，其中有多个应用程序。我们需要通过重新执行相同的工作流程来处理每个应用程序的数据。这些计划在一天的同一时间执行。问题是，当这些作业运行时，很难知道作业正在为哪个应用程序运行/失败/成功。当然，我可以打开作业配置并了解它，但这确实需要时间，因为有数十个应用程序在该服务下运行。

oozie 中是否有任何选项可以在执行作业时动态传递工作流（或其一部分）的名称，例如

oozie job -run -config <filename> -name "<NameIWishToGive>"
OR
oozie job -run -config <filename> -nameSuffix "<MyApplicationNameUnderTheService>"

另外，我们不希望创建多个作业文件夹来单独执行，因为这会导致太多的复制粘贴。

请建议。

在我看来，您应该能够仅使用作业配置中设置的属性。

我能够通过执行以下操作获得动态名称。

这是我的工作流程.xml 的示例：

<workflow-app xmlns="uri:oozie:workflow:0.2" name="map-reduce-wf-${environment}">
...
</workflow-app>

在我的 job.properties 中我有：

...
environment=test
...

最终名称为：“map-reduce-wf-test”

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

oozie

我可以动态重命名oozie作业名称吗的相关文章

java.io.IOException: EnsureRemaining: 仅剩余 0 个字节，尝试读取 1

我在 giraph 中的自定义类方面遇到一些问题我制作了 VertexInput 和 Output 格式但总是收到以下错误 java io IOException ensureRemaining Only bytes remaining
如何直接将一个mapper-reducer的输出发送到另一个mapper-reducer而不将输出保存到hdfs中

问题最终解决检查底部的我的解决方案最近我尝试运行 Mahout in Action 的第 6 章列表 6 1 6 4 中的推荐示例但我遇到了一个问题我用谷歌搜索但找不到解决方案问题是我有一对映射器减速器 public fina
Sqoop 导出分区的 Hive 表

我在尝试导出分区的 Hive 表时遇到了一些问题这是否完全受支持我尝试用谷歌搜索并找到一张 JIRA 票证 sqoop export connect jdbc mysql localhost testdb table sales exp
将 Spark 添加到 Oozie 共享库

默认情况下 Oozie 共享 lib 目录提供 Hive Pig 和 Map Reduce 的库如果我想在 Oozie 上运行 Spark 作业最好将 Spark lib jar 添加到 Oozie 的共享库而不是将它们复制到应用程序
更改 Hadoop 中的数据节点数量

如何改变数据节点的数量即禁用和启用某些数据节点来测试可扩展性说得更清楚一点我有4个数据节点我想一一实验1 2 3 4个数据节点的性能是否可以只更新名称节点中的从属文件临时停用节点的正确方法创建一个排除文件这列出了您想要删除
Hadoop-reducer 如何获取数据？

据我所知映射器为每个减速器生成 1 个分区减速器如何知道要复制哪个分区假设有 2 个节点运行用于字数统计程序的映射器并且配置了 2 个缩减器如果每个映射节点生成 2 个分区并且两个节点中的分区都可能包含相同的单词作为键那么减速
Mapreduce shuffle 阶段出现内存不足错误

我在运行时遇到奇怪的错误类似字数统计映射缩减程序我有一个包含 20 个从站的 hadoop 集群每个从站都有 4 GB RAM 我将 Map 任务配置为 300MB 堆 Reduce 任务槽为 1GB 我每个节点有 2 个映射槽和 1
Python 包安装：pip 与 yum，还是两者一起安装？

我刚刚开始管理 Hadoop 集群我们使用 Bright Cluster Manager 直至操作系统级别 CentOS 7 1 然后使用 Ambari 以及适用于 Hadoop 的 Hortonworks HDP 2 3 我不断收到安装
Impala：如何查询具有不同模式的多个镶木地板文件

在 Spark 2 1 中我经常使用类似的东西 df spark read parquet path to my files parquet 即使具有不同的模式也可以加载镶木地板文件的文件夹然后我使用 SparkSQL 对数据帧执行一些
如何对 RDD 进行分区

我有一个文本文件其中包含大量由空格分隔的随机浮动值我正在将此文件加载到 scala 中的 RDD 中这个RDD是如何分区的另外是否有任何方法可以生成自定义分区以便所有分区都具有相同数量的元素以及每个分区的索引 val dRDD
如何用snappy解压hadoop的reduce输出文件尾？

我们的 hadoop 集群使用 snappy 作为默认编解码器 Hadoop作业减少输出文件名就像part r 00000 snappy JSnappy 无法解压缩文件 bcz JSnappy 需要以 SNZ 开头的文件归约输出文件以某种
以编程方式读取 Hadoop Mapreduce 程序的输出

这可能是一个基本问题但我在谷歌上找不到答案我有一个映射缩减作业它在其输出目录中创建多个输出文件我的 Java 应用程序在远程 hadoop 集群上执行此作业作业完成后需要使用以下命令以编程方式读取输出org apache had
Hive 聚集在多个列上

据我所知当配置单元表聚集在一列上时它会执行该分桶列的哈希函数然后将该行数据放入其中一个桶中每个桶都有一个文件即如果有 32 个桶那么 hdfs 中就有 32 个文件将 clustered by 放在多个列上意味着什么例如假
将数据从 .txt 文件加载到 Hive 中以 ORC 形式存储的表

我有一个数据文件位于 txt格式我正在使用该文件将数据加载到 Hive 表中当我将文件加载到类似表中时 CREATE TABLE test details txt visit id INT store id SMALLINT STORE
AWS EMR 引导操作为 sudo

我需要更新 etc hosts适用于我的 EMR 集群 EMR AMI 4 3 中的所有实例整个脚本无非就是 bin bash echo e ip1 uri1 gt gt etc hosts echo e ip2 uri2 gt gt e
Hadoop 超立方体

嘿我正在启动一个基于 hadoop 的超立方体具有灵活的维度数有人知道这方面现有的方法吗我刚刚发现PigOLAP草图 http wiki apache org pig PigOLAPSketch 但没有代码可以使用它另一种方法是Z
Hadoop 减速器数量配置选项优先级

以下3个设置reduce数量的选项的优先级是什么换句话说如果三者都设置了会考虑哪一个呢 Option1 setNumReduceTasks 2 within the application code Option2 D mapredu
如何解决 java.lang.RuntimeException: PipeMapRed.waitOutputThreads(): subprocess failed with code 2？

我正在尝试在 Hadoop 环境中执行 NLTK 以下是我用于执行的命令 bin hadoop jar HADOOP HOME contrib streaming hadoop streaming 1 0 4 jar input user
从机上的 DiskErrorException - Hadoop 多节点

我正在尝试处理来自 hadoop 的 XML 文件在对 XML 文件调用字数统计作业时出现以下错误 13 07 25 12 39 57 INFO mapred JobClient Task Id attempt 201307251234
关于 Hadoop 和压缩输入文件的非常基本的问题

我已经开始研究 Hadoop 如果我的理解是正确的我可以处理一个非常大的文件它会被分割到不同的节点上但是如果文件被压缩那么文件就无法分割并且需要由单个节点处理有效地破坏了运行一个mapreduce 一个并行机器集群我的问题是

随机推荐

使用增量计数器在 Couchbase 集群中生成唯一密钥

我听到的关于 Couchbase 和其他 NoSQL 数据库的最常见问题是如何为记录生成唯一键或者更具体地说如何复制常见关系数据库的自动增量功能 Couchbase 中经常提到的解决方案是增量函数您可以在数字键上调用增量它将按顺序生
改变 html 滑块按钮滚动时的颜色

在这里我有我的简单滑块理论上将用于根据滑块位置控制步进电机的运动我想让它将托管的网站看起来专业所以我花了很长时间试图找出如何在滚动时更改按钮颜色这是因为电机控制我的锅炉温度所以视觉表示temp 会很好但我的问题是改变 css 值
尝试编译 Chromium 时出错

我尝试使用命令ninja C out Debug chrome编译 Chromium 然而错误消息指出 ninja error loading build ninja the system cannot find the file spe
存根/模拟方法的问题进行数据库调用

我在使用 MockitoJUnitRunner 模拟 JDBC 调用时遇到问题不知何故 Mockito 并没有嘲笑实际的调用即使我在测试类中有下面的子行 when readOnlyJdbcTemplate query anyString
使用 PHP 进行地理定位

有没有办法得到lat long into PHP在单个文件解决方案中通常使用JS我会用它来纯粹JS解决方案但现在我需要中的值PHP变量
如何从backbone.js中的模型获取数组元素

我有以下代码 Person new Backbone Model data age 27 name alamin 现在我怎样才能得到这个值 person new Person person get 请给我一个解决方案如果您使用此模型 P
将 BNF 转换为 Parsec 程序有什么技巧吗？

匹配函数调用链的 BNF 如x y z expr term T T expr T EMPTY term expr VAR 将其转换为秒差距程序看起来很棘手 term Parser Term term parens expr lt gt v
通过 docker Volumes 从主机连接到 docker postgres 套接字

我正在使用以下内容docker compose yml file version 3 5 services db image postgres latest volumes tmp postgresql var run postgresql
如何获取postgresql中正在运行的查询的执行计划？

我有一个未优化的查询它在一天中的不同时间运行一系列不同的执行时间从 1 分钟到 14 小时不等 CPU 利用率内存和数据库上的其他并发负载保持不变什么会导致这种变化请注意自动真空过程在午夜运行并且性能在早上显着提高我的断言是
如何在启用 Visual Studio 环境的情况下运行 SublimeText

OVERVIEW 现在我的 Windows 任务栏上有这 2 个程序 SublimeText3 目标 D software SublimeText 3 x64 sublime text exe VS2015 x64 本机工具命令提示符目标
为什么我们可以有未使用的函数，但不能有未使用的变量？

未使用的变量会阻止编译这是一件好事但编译器并不真正关心未使用的函数有解释吗变量和函数之间的行为似乎是一致的即使未使用两者都允许在包级范围内使用此代码片段编译没有任何问题 package main var v int unuse
我可以在 Spring 应用程序中同时使用 GlobalMethodSecurityConfiguration 和 WebSecurityConfigurerAdapter

我的应用程序同时具有 GlobalMethodSecurityConfiguration 和 WebSecurityConfigurerAdapter 配置类我的实现如下 My 全局方法安全配置实现 Configuration Enabl
EventGrid 与 EventHub

我正在开发一个服务结构应用程序想要从此应用程序发布一些事件并在另一个应用程序中订阅或处理这些发布事件我尝试过 EventGrid 概念并观察到发布和处理事件时存在延迟所以现在我正在寻找其他替代方案例如 EventHub 或队列
当返回值绑定到调用函数中的 const 引用时，它的生命周期如何扩展到调用函数的范围？

如果从函数返回一个值而不是引用然后将其绑定到调用函数中的 const 引用则其生命周期将扩展到调用函数的范围所以情况A const BoundingBox Player GetBoundingBox void return Bou
在 iOS 8 UITableView heightForHeaderInSection 中不是可选的

我刚刚注意到在 iOS 8 中以编程方式定义的 tableview 必须定义节内标题高度另外viewForHeaderInSection 否则默认高度将为 0 并且部分标题不会出现在 iOS 7 中即使在部分标题下出现节内标题高度没
Jersey 客户端的 URL 编码问题

我需要拨打这样的服务电话我遇到的问题是 value1 和 value2 最终被编码这使得服务调用失败例如 value1 类似于 a b b c 2 它基本上包含特殊字符我猜测这是服务需要解决的问题正确处理解码编码字符我认为它目前
SimpleHTTPServer 和 SocketServer

我创建了一个处理程序 Python 脚本如下所示 import SimpleHTTPServer import SocketServer PORT 8000 Handler SimpleHTTPServer SimpleHTTPRequ
在python中独立运行多个while true循环

本质上我有 2 while True 在我的代码中循环两个循环都在最后但是当我运行代码时只有第一个循环while True 循环开始运行第二个循环被忽略例如 while True print hi while True prin
在 PostgreSQL 中，我们如何判断表的每个索引是否是聚簇的？ [复制]

这个问题在这里已经有答案了在 PostgreSQL 中我们如何判断表的每个索引是否是聚簇的这对应于在MySQL中我们如何判断表的索引是否是聚集索引 https stackoverflow com questions 51182951
我可以动态重命名oozie作业名称吗

我们有一个 Hadoop 服务其中有多个应用程序我们需要通过重新执行相同的工作流程来处理每个应用程序的数据这些计划在一天的同一时间执行问题是当这些作业运行时很难知道作业正在为哪个应用程序运行失败成功当然我可以打开作业配置

我可以动态重命名oozie作业名称吗

我可以动态重命名oozie作业名称吗 的相关文章

随机推荐

热门标签

我可以动态重命名oozie作业名称吗的相关文章