如何使用 oozie 安排 sqoop 操作

2023-12-08

我是 Oozie 的新手，只是想知道 - 如何使用 Oozie 安排 sqoop 作业。我知道 sqoop 操作可以添加为 Oozie 工作流程的一部分。但是我如何安排 sqoop 操作并让它每隔 2 分钟或每天晚上 8 点自动运行一次（只是一个 cron 作业）？

您需要创建包含开始、结束和频率的 coordinator.xml 文件。这是一个例子

<coordinator-app name="example-coord" xmlns="uri:oozie:coordinator:0.2"

             frequency="${coord:days(7)}"
             start="${start}"
             end=  "${end}"

             timezone="America/New_York">

  <controls>
    <timeout>5</timeout>
  </controls>

  <action>
    <workflow>
        <app-path>${wf_application_path}</app-path>
    </workflow>
  </action>
</coordinator-app>

然后创建 coordinator.properties 文件，如下所示：

host=namenode01
nameNode=hdfs://${host}:8020

wf_application_path=${nameNode}/oozie/deployments/example
oozie.coord.application.path=${wf_application_path}

start=2013-07-13T07:00Z
end=2013-09-31T23:59Z

将您的 coordinator.xml 文件上传到 hdfs，然后使用类似的内容提交您的协调器作业

oozie job -config coordinator.properties -run

检查文档http://oozie.apache.org/docs/3.3.2/CoordinatorFunctionalSpec.html它包含一些示例。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

oozie

如何使用 oozie 安排 sqoop 操作的相关文章

Hadoop 作业失败，资源管理器无法识别 AttemptED

我正在尝试在 Oozie 工作流程中聚合一些数据但是聚合步骤失败我在日志中发现了两个有趣的点第一个是一个似乎重复出现的错误容器完成后它会被终止但会以非零退出代码 143 退出它完成了 2015 05 04 15 35 12 0
构建oozie：未知主机repository.codehaus.org

我正在尝试构建从此处下载的 Oozie 4 2 0 http ftp cixug es apache oozie 4 2 0 oozie 4 2 0 tar gz 启动构建后 bin mkdistro sh DskipTests 我收到此错
Distcp - 容器运行超出物理内存限制

我已经在 distcp 上苦苦挣扎了好几天我发誓我已经用谷歌搜索得够多了这是我的用例 USE CASE 我在某个位置有一个主文件夹 hdfs 根目录有很多子目录深度不固定和文件容量 200 000 个文件 30 GO 我只需要为
org.apache.hadoop.mapreduce.counters.LimitExceededException：计数器太多：121 max=120

我正在运行一个 hadoop 作业来自 oozie 它有很少的计数器和多输出我收到如下错误 org apache hadoop mapreduce counters LimitExceededException 计数器太多 121 ma
E0701 OOZIE 工作流程中的 XML 架构错误

以下是我的workflow xml
错误：E0708：E0708：无效转换

使用这个tutorial https blogs oracle com datawarehousing entry building simple workflows in oozie我为配置单元脚本创建了工作流程但当我运行以下命令时出现
如何强制协调员行动以特定频率实现？

我想知道是否有可能如何强制协调员定期具体化或实例化工作流程即使先前实例化的工作流程尚未完成让我解释我有一个简单的协调员如下所示
oozie 中 Hive 操作的作业队列

我有一个 oozie 工作流程我正在提交所有配置单元操作
Oozie Hive 动作挂起，心跳永远

我试图通过我在 Hue 中创建的 Oozie 工作流程运行 Hive 操作但该操作永远心跳并且不会执行 Hive SQL 我读过其他关于心跳永远的文章但这篇文章似乎发生在不同的时刻即在解析 SQL 语句之后我检查了集群中每个节点
oozie java api提交作业，kerberos身份验证错误

我有 hadoop 2 7 集群 oozie 4 0 1 以安全模式运行使用 kerberos 一切都很好我可以使用 cli 命令提交作业如下所示基尼特我的用户 oozie工作 ooziehttps 10 1 130 10 2100
Oozie 不断将旧版本的 httpcore jar 添加到类路径中

我不断收到异常因为 Oozie 将错误版本的 httpcore jar 添加到类路径中我尝试了不同的选项例如 oozie launcher mapreduce task classpath user precedence oozie
是否可以只用一名协调员启动一些 oozie 工作流程？

我不确定是否可以使用这个好工具来实现我想要的目的我有很多工作流程这些工作流程可以是依赖的也可以是非依赖的示例 workflow1 工作流程 xml job properties workflow2 工作流程 xml job prop
如何在oozie作业中指定多个libpath？

我的 oozie 工作使用 2 个 jarx jar and y jar以下是我的 job properties 文件 oozie libpath lib oozie use system libpath true 当两个 jar 都位于
Sqoop 自由格式查询导致 Hue/Oozie 中的参数无法识别

我正在尝试使用自由格式查询运行 sqoop 命令因为我需要执行聚合它作为 Oozie 工作流程通过 Hue 界面提交以下是命令和查询的缩小版本处理命令时 query 语句用引号引起来会导致查询的每个部分被解释为无法识别的参数如
oozie Sqoop 操作无法将数据导入到 hive

我在执行 oozie sqoop 操作时遇到问题在日志中我可以看到 sqoop 能够将数据导入到临时目录然后 sqoop 创建 hive 脚本来导入数据将临时数据导入配置单元时失败在日志中我没有收到任何异常下面是我正在使用的 sq
Oozie SSH 操作

Oozie SSH 操作问题 Issue 我们正在尝试在集群的特定主机上运行一些命令我们为此选择了 SSH Action 我们面对这个 SSH 问题已经有一段时间了这里真正的问题可能是什么请指出解决方案 logs AUTH FAILE
处理 oozie 工作流程中的循环

我有一个 oozie 用例用于检查输入数据可用性并根据数据可用性触发 MapReduce 作业所以我编写了一个 shell 脚本来检查输入数据并在 oozie 中为其创建了一个 ssh 操作输入数据检查的重试次数和重试间隔应该是可配
有没有办法在 Oozie 中全局使用 config-default.xml ？

来自文档 https oozie apache org docs 4 1 0 WorkflowFunctionalSpec html a4 Parameterization of Workflows config default xml必须
sqoop 通过 oozie 导出失败

我正在尝试将数据导出到mysql from hdfs通过sqoop 我可以通过 shell 运行 sqoop 并且它工作正常但是当我通过调用oozie 它出现以下错误并失败我还包括了罐子没有描述性日志 sqoop脚本 export c
如何捕获 Oozie Spark 输出

有没有办法捕获spark的输出然后将其输入到shell上我们当前正在使用 scala 创建 jar 文件并希望我们的 Spark 输出成为 shell 输入我的想法是使用 wf actionData spark XXXX var 我只

随机推荐

获取 405 method not allowed 异常

我有一个 jquery 脚本从 gi thub 下载可以删除实体以下是脚本 document ready function var restful init function elem elem on click function e
Karma 无法在 Team City 版本上启动 IE

Karma 在 Team City 下运行时无法启动 IE 我可以登录服务器并从命令行运行测试但 IE 在 Team City 中总是失败 Step 6 6 INFO karma Karma v0 12 37 server started
在加载表视图中的所有单元格后，重新加载表视图单元格内的集合视图

我正在尝试在表视图中的每个表视图单元格内实现集合视图但无法在正确的时间重新加载集合视图看起来集合视图在加载所有表视图单元格后会重新加载自身而不是每次新单元格出队到表视图时就像我试图做到的那样 func tableView table
使用 std::async 执行的任务会阻塞，就像使用 future 一样

我很难理解为什么以下代码块 std async std launch async std this thread sleep for 5s this line will not execute until above task finish
如何在使用 C++ 创建的测验程序中插入倒计时器？

5 分的 10 个问题都需要在规定的时间内回答所以应该显示每题消耗的时间n剩余时间有人可以帮忙吗一个可移植的 C 解决方案是使用chrono steady clock来测量时间这在 C 11 的头文件中可用
如何在Haskell中解释callCC？

在Scheme中执行从a获得的延续call cc有效地跳回初始调用抄送并恢复保存的调用堆栈我刚刚开始学习 Haskell 我正在尝试弄清楚如何理解callCC 那就是尝试去理解callCC就对方案的理解而言call cc 实施callC
自定义控件数据绑定 wpf

目前正在实现一个自定义控件我想直接从我的 viewModel 绑定一些值而不使用 xaml 我可以做这个
Latex中@符号是什么意思

例如 def if nch mpty 1 def temp a 1 ifx temp a empty def f nch def 1 2 if nch mpty 2 f nch gbl def 1 leavevmode else f nch
将寄存器值读入 C 变量 [重复]

这个问题在这里已经有答案了我记得看到过一种使用扩展 gcc 内联汇编来读取寄存器值并将其存储到 C 变量中的方法但我一辈子都不记得如何形成 asm 语句编者注这种使用本地寄存器asm变量的方法是现在被 GCC 记录为不支持它通常
Microsoft Graph API：尝试检索租户策略时出现 403 Forbidden 错误

我正在尝试使用 Microsoft Graph API 检索在 Azure AD 门户上为我的租户创建的策略据我从图形 API 文档中了解到所有策略 CRUD 操作都需要一个范围目录 AccessAsUser All 此范围转换为权限以
log4j 选择错误的属性文件

我的类路径中有 2 个 log4j properties 文件我需要它们其中一个是我正在使用的库所必需的另一个是我的代码使用的库当我运行我的 jar 文件时它能够读取库使用的属性但它不会读取我自己的属性文件如何让它读取我的 l
找不到与给定名称匹配的资源（在“paddingBottom”处，值为“@dimen/activity_vertical_margin”）

我试图构建一个导航抽屉我从某个网站复制了代码但在其中一个 XML 中收到此错误找不到与给定名称匹配的资源在 paddingBottom 处值为 dimen 活动垂直边距如何摆脱这个错误
带有 .js 扩展名的 Webpack/ts-loader 导入无法解析

我的目录结构如下 projectRoot project server src pom xml project ui tsconfig json src file ts imports file js 我的问题是project server
错误：ORA-00907：缺少右括号 - 您能帮助解决问题吗

select regexp substr replace replace replace CA CO IL KS chr 40 chr 41 chr 39 1 level as division from dual connect by l
使用 Node.js 自动将文本写入控制台

我需要使用 SSH 和 Node js 脚本克隆 GitHub 存储库 var exec require child process exec exec git clone email protected jquery jquery git
如何仅对具有特定属性集的元素使用 querySelectorAll？

我正在尝试使用document querySelectorAll对于所有具有value属性集页面上还有其他复选框没有value设置并且每个复选框的值都不同但 ID 和名称并不唯一例子
HtmlUnit 按钮单击

我正在尝试在 www meetme com 上发送消息但不知道该怎么做我可以在评论区域中输入消息但单击发送按钮不会执行任何操作我究竟做错了什么当我登录并按登录按钮时页面确实发生了变化一切都很好有人有任何想法或线索吗 Ht
什么是对象/关系不匹配

我是java新手正在阅读有关对象关系映射的内容我在此链接上发现了术语对象关系不匹配休眠谁能用 Java 解释一下什么是对象关系不匹配我也读到过黑客攻击网站但无法正确获得它用示例进行解释将是值得赞赏的 Hibernate 是
Heroku 应用程序坚持使用 HTTPS - 为什么？

我有一个有趣的小问题 Heroku 上的一个应用程序被配置为使用Heroku SSL 测试版但无论我做什么它似乎都想使用 HTTPS 浏览器错误 I have redirect to protocol gt http status gt
如何使用 oozie 安排 sqoop 操作

我是 Oozie 的新手只是想知道如何使用 Oozie 安排 sqoop 作业我知道 sqoop 操作可以添加为 Oozie 工作流程的一部分但是我如何安排 sqoop 操作并让它每隔 2 分钟或每天晚上 8 点自动运行一次只是一

如何使用 oozie 安排 sqoop 操作

如何使用 oozie 安排 sqoop 操作 的相关文章

随机推荐

热门标签

如何使用 oozie 安排 sqoop 操作的相关文章