如何从HDFS文件系统执行hadoop jar？

2024-01-09

我总是从本地文件系统执行作业，如下所示

hadoop jar /home/usr/jar/myjar.jar com.test.TestMain

如何执行相同的命令，但 myjar.jar 将位于 hdfs 中？

就像是

hadoop jar hdfs:///home/usr/jar/myjar.jar com.test.TestMain

但这当然是行不通的...

hadoop fs -copyToLocal hdfs:///home/usr/jar/myjar.jar /tmp/myjar.jar && hadoop jar /tmp/myjar.jar com.test.TestMain

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

如何从HDFS文件系统执行hadoop jar？的相关文章

如何从hdfs读取文件[重复]

这个问题在这里已经有答案了我在 project1目录下的hadoop文件系统中有一个文本文件名mr txt 我需要编写 python 代码来读取文本文件的第一行而不将 mr txt 文件下载到本地但我无法从 hdfs 打开 mr tx
HDFS 中的文件数量与块数量

我正在运行单节点 hadoop 环境当我跑的时候 hadoop fsck user root mydatadir block 我真的对它给出的输出感到困惑 Status HEALTHY Total size 998562090 B Tot
更改 Spark Streaming 中的输出文件名

我正在运行一个 Spark 作业就逻辑而言它的性能非常好但是当我使用 saveAsTextFile 将文件保存在 s3 存储桶中时输出文件的名称格式为 part 00000 part 00001 等有没有办法更改输出文件名谢谢
如何跟踪hadoop中哪个数据块在哪个数据节点？

如果复制一个数据块会复制到哪个数据节点是否有任何工具可以显示复制块存在的位置如果您知道文件名则可以通过 DFS 浏览器查找转到您的 namenode Web 界面说浏览文件系统并导航到您感兴趣的文件在页面底部将列出文件中
2n + 1 法定人数是什么意思？

我在描述 HBase 的 Zookeeper 配置时遇到过这个问题但我对这个术语并不熟悉 N 与我的 HBase 集群中的节点数量有关系吗或者我应该在 Zookeeper 集群中使用的节点数量 2f 1是指你所需要的可靠性可用性水平
无法在 Hadoop Map-Reduce 作业中加载 OpenNLP 句子模型

我正在尝试将 OpenNLP 集成到 Hadoop 上的 Map Reduce 作业中从一些基本的句子分割开始在地图函数中运行以下代码 public AnalysisFile analyze String content InputS
Spark 和 Python 使用自定义文件格式/生成器作为 RDD 的输入

我想问一下 Spark 中输入的可能性我可以看到从http spark apache org docs latest programming guide html http spark apache org docs latest pro
如何按行扩展数组值！！使用 Hive SQL

我有一个有 4 列的表其中一列项目类型是 ARRAY 其他是字符串 ID items name loc id1 item1 item2 item3 item4 item5 Mike CT id2 item3 item7 item4 i
Hadoop 上的 Sqoop：NoSuchMethodError：com.google.common.base.Stopwatch.createStarted() [重复]

这个问题在这里已经有答案了我在 Google Cloud DataProc 上的 hadoop 上运行 sqoop 以通过 Cloud SQL 代理访问 postgresql 但遇到 Java 依赖项错误 INFO First Cloud
更改 Hadoop 中的数据节点数量

如何改变数据节点的数量即禁用和启用某些数据节点来测试可扩展性说得更清楚一点我有4个数据节点我想一一实验1 2 3 4个数据节点的性能是否可以只更新名称节点中的从属文件临时停用节点的正确方法创建一个排除文件这列出了您想要删除
无法在 Windows 10 中启动 Spark Master

我是 Spark 新手我正在尝试手动启动 master 在 Windows 10 中使用 MINGW64 当我这样做时 Downloads spark 1 5 1 bin hadoop2 4 spark 1 5 1 bin hadoop2
Hadoop-reducer 如何获取数据？

据我所知映射器为每个减速器生成 1 个分区减速器如何知道要复制哪个分区假设有 2 个节点运行用于字数统计程序的映射器并且配置了 2 个缩减器如果每个映射节点生成 2 个分区并且两个节点中的分区都可能包含相同的单词作为键那么减速
全部配对图表上的所有路径

这可能是一个没有最佳解决方案的问题假设我有一个有向图不知道它是否有循环循环检测将是这个问题的方面之一给定一组顶点可能是数百万个顶点我需要计算给定图的所有唯一对之间的所有不同路径没有重复顶点的路径我该如何应对这种情况让我们看
以不同用户身份运行 MapReduce 作业

我有一个与 Hadoop 交互的 Web 应用程序 Cloudera cdh3u6 特定的用户操作应在集群中启动新的 MapReduce 作业该集群不是一个安全集群但它使用简单的组身份验证因此如果我以自己的身份通过 ssh 连接到它
如何在Hadoop中序列化List集合对象？

有没有办法在 Hadoop 中序列化 java 集合 The Writable接口仅适用于 Java 原语我有以下类属性 private String keywords private List
更改spark_temporary目录路径

是否可以更改 temporarySpark在写入之前保存临时文件的目录特别是由于我正在编写表的单个分区因此我希望临时文件夹位于分区文件夹内是否可以由于其实现原因无法使用默认的 FileOutputCommiter FileOut
在 Apache Spark 上下文中，内存数据存储意味着什么？

我读到 Apache Spark 将数据存储在内存中然而 Apache Spark 旨在分析大量数据又称大数据分析在这种情况下内存数据存储的真正含义是什么它可以存储的数据是否受到可用 RAM 的限制它的数据存储与使用HDFS的A
Protobuf RPC 在 Hadoop 2.2.0 单节点服务器上不可用？

我正在尝试在按照本教程安装的本地单节点集群上运行 hadoop 2 2 0 mapreduce 作业 http codesfusion blogspot co at 2013 10 setup hadoop 2x 220 on ubuntu
Hadoop - 直接从 Mapper 写入 HBase

我有一个 hadoop 作业其输出应写入 HBase 我并不真正需要减速器我想要插入的行类型是在映射器中确定的如何使用 TableOutputFormat 来实现此目的从所有示例中我看到的假设是 reducer 是创建 Put 的
没有函数映射到名称“coord:formatTime”

我正在尝试使用 oozie 中的以下内容获取当前时间戳

随机推荐

Kotlin - 将 Float 转换为 Double 同时保持精度

在科特林中123 456是一个有效的Double然而值123 456F toDouble 结果是123 45600128173828 大概就是两者之间处理精度的方式我希望能够在两者之间自由转换特别是对于这样的情况 123 456F g
如何从 Laravel 中的请求获取 Bearer 令牌

我期望来自所有传入请求的 JWT 令牌它应该包含在请求标头中例如 Authorization gt Bearer some token here 我想获取这个令牌并验证它这就是我正在尝试的 token request gt heade
密文指的是不存在的客户主密钥，

我有一个lambda它访问S3 之前这个 lambda 程序运行良好但最近我更改了S3的KMS密钥或其他一些安全组设置 lambda源代码没有改变出现错误我猜这个lambda and S3不在 VPC 上因此安全组不相关那么和
如何使用反射调用通用异步方法

public interface IBar public class Bar IBar public class Bar2 IBar public interface IFoo Task
我可以创建从 firestore 读取但写入实时数据库的 firestore 事务吗？

来自文档 https firebase google com docs firestore manage data transactions关于firestore批量写入和事务我的理解是事务原子文档在读取之后写入因此所有读取操作都必须
getElementsByClassName 与 querySelectorAll

如果我使用 var temp document querySelectorAll class for var i 0 max temp length i
在 Pandas 中，如何将日期字符串转换为日期时间对象并将它们放入 DataFrame 中？

import pandas as pd date stngs 2008 12 20 2008 12 21 2008 12 22 2008 12 23 a pd Series range 4 index range 4 for idx dat
如何将光标移动到ckeditor5中的文本末尾

ckeditor5 当我使用editor editing view focus 光标在文本的开头如何将光标移动到文本的结尾为此请在编辑器模型 https ckeditor com docs ckeditor5 latest frame
Google 地图 V3 API - 超出查询限制，但只有 1 个请求

最近当我发送单个地理编码请求时我开始从 Google Map API 收到超出查询限制状态响应我真的很困惑为什么会发生这种情况我绝对没有达到每日 2 500 条请求的限制另外如果我只是简单地发布我的请求 http maps
MySQL 是否有命令删除除 PRIMARY 索引之外的所有索引？

我有一个数据库表有一个索引其中键名为 PRIMARY 类型为 BTREE 唯一为 YES 打包为 NO 列为 ID 基数为 728 排序规则为 A 我有一个在页面加载时运行的脚本该脚本将条目添加到 MySQL 数据库表中并从数据库表
使用 Qt 从 SQLite 中选择

我尝试在 Linux 上的 Qt 4 5 3 上处理 SQLite 数据库我已经创建了数据库然后我尝试在 Qt 上执行选择 db QSqlDatabase addDatabase QSQLITE db setDatabaseName
是否可以在 PHP 接口中创建可选方法？

我正在开发一个 PHP 项目我有几个需要实现接口的类有些类不需要实现接口中定义的所有方法是否可以仅以更干净的方式实现某些方法接口指定了方法must由实现它的类来实现你不能跳过一些尽管你可以创建额外的你可以做的就是将你的接口分成
在 Java 8 中扩展 List

我经常想将一个列表映射到另一个列表例如如果我有一个人员列表并且我想要他们的姓名列表我想要这样做 GOAL List
cd 程序文件错误：找不到位置参数

PS C gt cd Program Files 当我发出这个命令时我不知道为什么但它不接受Program Files 相同的命令在中运行得很好cmd 这是它显示的错误 Set Location A positional paramet
装饰基于类的视图的两种方法有什么区别？

我正在编写一个继承自 ListView 的视图并尝试将该视图限制为登录用户 https docs djangoproject com en dev topics class based views decorating in urlcon
创建 HUE 颜色条

我正在创建一个颜色选择器现在我需要创建一个 HUE 颜色条创建它的一种方法是通过 XAML 中的渐变停止点例如
方案和浅绑定

define make lambda x lambda y cons x list y let x 7 p make 4 cons x p 0 我是计划和函数式程序的新手所以我对遍历程序有点笨拙但我知道如果我使用深度绑定该程序将返回
如何使用函数进行模板模板参数推导？

考虑一组函数例如 template lt class Fun gt void A const Fun template lt class Fun gt void B const Fun template lt class Fun gt v
GWT 1.6 项目战争布局 - 混合源代码和编译器生成的工件？

刚刚完成了一个基于 GWT 1 5 的项目我正在考虑如何迁移到 1 6 我很惊讶地发现 GWT 似乎想将其编译输出写入 war 目录通常在该目录中将项目置于源代码控制之下这背后的原因是什么谷歌真的认为这是个好主意吗是否有解决方法可
如何从HDFS文件系统执行hadoop jar？

我总是从本地文件系统执行作业如下所示 hadoop jar home usr jar myjar jar com test TestMain 如何执行相同的命令但 myjar jar 将位于 hdfs 中就像是 hadoop jar

如何从HDFS文件系统执行hadoop jar？

如何从HDFS文件系统执行hadoop jar？ 的相关文章

随机推荐

热门标签

如何从HDFS文件系统执行hadoop jar？的相关文章