访问 HDFS 中文件的 URI

2024-03-30

我已经使用 Ambari 设置了一个包含 3 个节点的集群。

现在我想使用客户端应用程序访问 HDFS 中的文件。

我可以在 Ambari 的数据节点下找到所有节点 URI。

我需要使用什么 URI + 端口来访问文件？我使用的是默认安装过程。

默认端口为“8020”。

您可以通过 3 种不同的方式访问“hdfs”路径。

只需使用“/”作为根路径

For e.g.

E:\HadoopTests\target>hadoop fs -ls /
Found 6 items
drwxrwxrwt   - hadoop  hdfs          0 2015-08-17 18:43 /app-logs
drwxr-xr-x   - mballur hdfs          0 2015-11-24 15:36 /tmp
drwxrwxr-x   - mballur hdfs          0 2015-10-20 15:27 /user

使用“hdfs:///”

For e.g.

E:\HadoopTests\target>hadoop fs -ls hdfs:///
Found 6 items
drwxrwxrwt   - hadoop  hdfs          0 2015-08-17 18:43 hdfs:///app-logs
drwxr-xr-x   - mballur hdfs          0 2015-11-24 15:36 hdfs:///tmp
drwxrwxr-x   - mballur hdfs          0 2015-10-20 15:27 hdfs:///user

使用“hdfs://{NameNodeHost}:8020/”

例如

E:\HadoopTests\target>hadoop fs -ls hdfs://MBALLUR:8020/
Found 6 items
drwxrwxrwt   - hadoop  hdfs          0 2015-08-17 18:43 hdfs://MBALLUR:8020/app-logs
drwxr-xr-x   - mballur hdfs          0 2015-11-24 15:36 hdfs://MBALLUR:8020/tmp
drwxrwxr-x   - mballur hdfs          0 2015-10-20 15:27 hdfs://MBALLUR:8020/user

在本例中，“MBALLUR”是我的名称节点主机的名称。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

HDFS

ambari

访问 HDFS 中文件的 URI 的相关文章

一个目录中有多少个子目录？

如何查找HDFS中指定目录下的子目录数量当我做hadoop fs ls mydir 我收到 Java 堆空间错误因为目录太大但我感兴趣的是该目录中的子目录数量我试过 gsamaras gwta3000 hadoop fs find
Spark on 纱线概念理解

我试图了解 Spark 如何在 YARN 集群客户端上运行我心里有以下问题是否需要在yarn集群的所有节点上都安装spark 我认为应该是因为集群中的工作节点执行任务并且应该能够解码由驱动程序发送到集群的 Spark 应用程序中的代码
知道hadoop中数据节点的磁盘空间吗？

有没有一种方法或任何命令可以让我了解每个数据节点的磁盘空间或总集群磁盘空间我尝试了命令 dfs du h 但似乎我没有权限对许多目录执行它因此无法获取实际的磁盘空间 From UI http namenode 50070 dfsheal
Hadoop 框架中使用的属性的完整列表

我正在对 Hadoop 框架进行一些研究我想问一下框架中可以使用的属性例如 io sort mb io sort record percent etc 我可以参考这个框架的整个属性列表吗非常希望有人能帮助我另外我想问一下 io s
hdfs - ls：本地异常失败：com.google.protobuf.InvalidProtocolBufferException：

我正在尝试使用以下内容列出我在 hdfs 中的目录 ubuntu ubuntu hadoop fs ls hdfs 127 0 0 1 50075 ls Failed on local exception com google protob
如何在Hadoop中设置数据块大小？改变它有好处吗？

如果我们可以更改 Hadoop 中的数据块大小请告诉我如何操作更改块大小是否有利如果是请告诉我为什么以及如何更改如果没有请告诉我为什么以及如何您可以随时更改块大小除非dfs blocksize参数在 hdfs site xm
什么是“HDFS 写入管道”？

当我阅读 hadoop 权威指南时我坚持以下句子写入reduce输出确实会消耗网络带宽但仅作为与普通 HDFS 写入管道消耗的量差不多问题 1 能帮我更详细地理解上面这句话吗 2 HDFS写入管道是什么意思当文件写入 HDFS
HDFS 复制因子更改

如果集群中的复制因子发生变化例如从 5 更改为 3 并且集群重新启动旧文件块会发生什么情况它们是否会被视为过度复制并被删除或者复制因子仅适用于新文件这意味着旧文件块被复制 5 次新文件块重新启动后被复制 3 次如果集群不重
Namenode-HDFS 出现“连接被拒绝”错误（Hadoop 问题）

当我们看到使用时我的所有节点都已启动并运行jps命令但我仍然无法连接到 hdfs 文件系统每当我点击Browse the filesystem在 Hadoop Namenode localhost 8020 页面上我得到的错误是Co
HDFS如何计算可用块？

假设块大小为 128MB 则集群有 10GB 因此大约 80 个可用块假设我创建了 10 个小文件这些文件总共占用磁盘上 128MB 块文件校验和复制和 10 个 HDFS 块如果我想向HDFS添加另一个小文件那么HDFS使用
格式化 HDFS 时出现 UnknownHostException

我已经使用以下命令在伪分布式模式下在 CentOS 6 3 64 位上安装了 CDH4指示 https ccp cloudera com display CDH4DOC Installing CDH4 on a Single Linux N
gzip 文件如何存储在 HDFS 中

HDFS存储支持压缩格式来存储压缩文件我知道 gzip 压缩不支持夹板现在假设该文件是一个 gzip 压缩文件其压缩大小为 1 GB 现在我的问题是该文件将如何存储在 HDFS 中块大小为 64MB 由此link http com
如何从java通过hdfs协议访问hadoop？

我找到了一种通过以下方式连接到hadoop的方法hftp 并且工作正常只读 uri hftp 172 16 xxx xxx 50070 System out println uri uri Configuration conf new C
为什么map任务总是运行在单节点上

我有一个具有 4 个节点的完全分布式 Hadoop 集群当我将作业提交给 Jobtracker 时 Jobtracker 认为 12 个映射任务对我的工作来说很酷但奇怪的事情发生了这 12 个映射任务始终在单个节点上运行而不是在整个
hadoop 连接在端口 9000 上被拒绝

我想设置一个伪分布式模式的hadoop集群进行开发由于端口 9000 上的连接被拒绝尝试启动 hadoop 集群失败这些是我的配置非常标准站点核心 xml
使用 Python3 与 HDFS 交互的最佳模块是什么？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我看到有 hdfs3 snakebite 和其他一些哪一个支持最好且最全面据我所知可能性并不像人们想象的那么多但我建议使用官方的Pyth
使用Spring批处理从HDFS读取文件

我必须编写一个 Spring 批处理它将从 HDFS 读取文件并更新 MySQL DB 中的数据 HDFS 中的源文件包含一些 CSV 格式的报告数据有人能给我举一个从 HDFS 读取文件的例子吗 Thanks The FlatFile
非 hdfs 文件系统上的 hadoop/yarn 和任务并行化

我已经实例化了 Hadoop 2 4 1 集群并且发现运行 MapReduce 应用程序的并行化方式会有所不同具体取决于输入数据所在的文件系统类型使用 HDFS MapReduce 作业将生成足够的容器以最大限度地利用所有可用内存
运行 Sqoop 导入和导出时如何找到最佳映射器数量？

我正在使用 Sqoop 版本 1 4 2 和 Oracle 数据库运行 Sqoop 命令时例如这样 sqoop import fs
以编程方式读取 Hadoop Mapreduce 程序的输出

这可能是一个基本问题但我在谷歌上找不到答案我有一个映射缩减作业它在其输出目录中创建多个输出文件我的 Java 应用程序在远程 hadoop 集群上执行此作业作业完成后需要使用以下命令以编程方式读取输出org apache had

随机推荐

将 List 转换为 IEnumerable

我仍在学习一些 c 的东西但我找不到这个问题的答案假设我有一个实现 MyInterface 的 MyObject 列表 public class MyObject IMyInterface public List
异常值返回 NA

我使用下面的函数使用 3 sd 查找异常值但在结果中我得到了异常值和 NA 值异常值中不应该有 NA 值对吗我如何解决它 findingoutlier lt function data cutoff 3 na rm TRUE sd
我尝试在 Pygame 中绘制一个矩形，但颜色闪烁......为什么？

所以我再次尝试 Pygame 仍然是初学者我尝试绘制一个矩形但颜色只是闪烁橙色表面青绿色为什么会发生这种情况这是代码片段 from pygame import from sys import while True init fo
json对象中的put方法将值添加到json对象的第一个；

考虑下面的代码 JSONObject json new JSONObject json put one 1 json put two 2 json put three 3 如果我打印 jsonobject 它会像这样打印 three 1 t
运行 Flask 应用程序时 AWS cloud9 超时

大家好我正在尝试使用 Flask 设置 AWS cloud9 环境来开发 Web 应用程序我是 AWS Flask 的新手并且遇到了一个问题 IDE 环境和在浏览器中预览应用程序之间似乎存在问题我使用的是 Chrome 但也在 IE
试试！＆尝试？有什么区别，什么时候使用？

In 斯威夫特2 0 http ahmedabdurrahman com 2015 08 22 swift 2 0 Apple引入了一种新的错误处理方式 do try catch 几天前 Beta 6 中引入了一个更新的关键字 try 另外
如果窗口大小调整为更大的分辨率，则销毁 iDangerous Swiper 或在调整大小为更小的分辨率时调用它

我在用着危险的狙击手 http www idangero us sliders swiper 对于我的网站分辨率较低我是这样称呼它的 var resolution 670 if window width lt resolution va
Docker for Windows 构建添加了用于 COPY 的前缀 `/var/lib/docker/tmp/` ？

我已经安装了适用于 Windows 的 Docker 并使用 Visual Studio 2017 创建了一个具有 docker 支持的新 Asp net core 应用程序我尚未进行任何更改但是 docker build 报了以下错误
在 Angular4 中构建时，如何将所有字形放置到一个文件夹中？

我有一个使用 cli 命令创建的应用程序我的 angular cli json 文件看起来像这样 schema node modules angular cli lib config schema json project name li
将 DLL 引用添加到 VB.NET 项目

首先这个问题看起来确实与另一篇文章非常相似将 DLL lame enc dll 引用添加到我的项目中 https stackoverflow com questions 5762755 add the dll lame enc dll r
如何在 VS Code 中禁用 Java 代码的错误突出显示？

我需要在 VS Code 中禁用 Java 文件中的错误突出显示 VS Code 尝试检查 Groovy 文件同时认为它是 Java 文件 As you can see in the picture all imports after t
获取 Android NDK 的 C 预处理器的架构类型 (ABI)

我正在尝试根据所选的 ABI 库控制 Android NDK 项目中的 C 代码首先我希望 NDK 库方法用字符串回答所使用的 ABI 我做了几次尝试但都未能提供结果在Application mk中我定义APP ABI 全部 And
如何将表格的行按升序排列并同时保存表格？

我想通过按现有表的升序排列行来创建一个新表我尝试使用的代码是 SELECT INTO new table FROM existing table ORDER BY col1 col2 但是新表不显示行的任何升序排列谁能告诉我这段代码有
POS 在 Trello API 中的实际含义是什么

我正在使用 dillenmeisters Trello Net API Wrapper 并且在每个Card它有一个POS属性我认为这是它在列表中的位置但数字似乎是任意的范围从 4 到 5 位数字无论如何是否有足够的理由来放置一
Laravel 中按总和列关系排序

我有这个控制器它从帖子表中抓取帖子中的每个帖子posts表与另一个表有 hasMany 关系likes 控制器 public function getDashboard posts Post orderBy created at des
为什么多次使用相同的 vue 指令会调用所有指令的更新？

我创建了一个 vue 指令将其附加到同一页面上的多个输入元素并且注意到当我开始输入其中一个元素时页面中的所有元素都会触发 update 事件对于我更新的特定元素我原以为只有一个事件我的问题是有没有办法防止事件触发或过滤事件以
IAB 错误您已经拥有该商品

I m now developing a small game with Google s in app billing service 我参考了Google示例项目的Trivial Drive 我想问一下您从 Google Play 购买
TortoiseSVN：使用 SVN 签出对话框“仅此项目”选项后添加其他文件

我们部门正计划在 Tortoise SVN 中使用 SVN Checkout 选项在该对话框中我们选择仅此项目选项然后单击选择项目按钮并选择我们要签出的所有相关文件假设用户犯了一个错误忘记签出重要文件返回并从主干中选择该
Netty中如何发送带有POST参数的请求？

我正在尝试在 Netty 中发送带有 POST 参数的请求我搜索了 Netty API Google 和这里 Stack Overflow 但没有找到什么好的办法这可能是我糟糕的搜索技巧的错如果是这样我道歉有没有什么API可以轻松
访问 HDFS 中文件的 URI

我已经使用 Ambari 设置了一个包含 3 个节点的集群现在我想使用客户端应用程序访问 HDFS 中的文件我可以在 Ambari 的数据节点下找到所有节点 URI 我需要使用什么 URI 端口来访问文件我使用的是默认安装过程默认端

访问 HDFS 中文件的 URI

访问 HDFS 中文件的 URI 的相关文章

随机推荐

热门标签