如何检索 Hdfs 文件中的复制因子信息？

2024-01-07

我已为文件设置复制因子，如下所示：

hadoop fs -D dfs.replication=5 -copyFromLocal file.txt /user/xxxx

When a NameNode重新启动，它确保复制不足的块被复制。因此，文件的复制信息被存储（可能在nameNode）。我怎样才能得到这些信息？

尝试使用命令hadoop fs -stat %r /path/to/file，它应该打印复制因子。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

replication

Hadoop2

如何检索 Hdfs 文件中的复制因子信息？的相关文章

Sqoop - 绑定到 YARN 队列

因此使用 MapReduce v2 您可以使用绑定到某些 YARN 队列来管理资源和优先级基本上通过使用 hadoop jar xyz jar D mapreduce job queuename QUEUE1 input output
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
处理 oozie 工作流程中的循环

我有一个 oozie 用例用于检查输入数据可用性并根据数据可用性触发 MapReduce 作业所以我编写了一个 shell 脚本来检查输入数据并在 oozie 中为其创建了一个 ssh 操作输入数据检查的重试次数和重试间隔应该是可配
Hadoop 推测任务执行

在Google的MapReduce论文中他们有一个备份任务我认为这与Hadoop中的推测任务是一样的推测任务是如何实现的当我启动一项推测任务时该任务是从一开始就作为较旧且缓慢的任务开始还是从较旧的任务到达的位置开始如果是这样
hive 添加分区语句忽略前导零

我在 hdfs 上有文件夹 user test year 2016 month 04 dt 25 000000 0 需要将上面的分区路径添加到test table 命令 ALTER TABLE test ADD IF NOT EXISTS
如何找到 JAR：/home/hadoop/contrib/streaming/hadoop-streaming.jar

我正在练习有关 Amazon EMR 的复数视角视频教程我被困住了因为我收到此错误而无法继续 Not a valid JAR home hadoop contrib streaming hadoop streaming jar 请注意
在 Hadoop MapReduce 中为二进制文件创建自定义 InputFormat 和 RecordReader

我正在编写一个 M R 作业该作业处理以二进制格式编写的大型时间序列数据文件如下所示此处换行以提高可读性显然实际数据是连续的 TIMESTAMP 1 TIMESTAMP 1 TIMESTAMP 2 TIMESTAMP 2 TIME
将 Spark 添加到 Oozie 共享库

默认情况下 Oozie 共享 lib 目录提供 Hive Pig 和 Map Reduce 的库如果我想在 Oozie 上运行 Spark 作业最好将 Spark lib jar 添加到 Oozie 的共享库而不是将它们复制到应用程序
更改 Hadoop 中的数据节点数量

如何改变数据节点的数量即禁用和启用某些数据节点来测试可扩展性说得更清楚一点我有4个数据节点我想一一实验1 2 3 4个数据节点的性能是否可以只更新名称节点中的从属文件临时停用节点的正确方法创建一个排除文件这列出了您想要删除
将 Apache Zeppelin 连接到 Hive

我尝试将我的 apache zeppelin 与我的 hive 元存储连接起来我使用 zeppelin 0 7 3 所以没有 hive 解释器只有 jdbc 我已将 hive site xml 复制到 zeppelin conf 文件夹
Hadoop-reducer 如何获取数据？

据我所知映射器为每个减速器生成 1 个分区减速器如何知道要复制哪个分区假设有 2 个节点运行用于字数统计程序的映射器并且配置了 2 个缩减器如果每个映射节点生成 2 个分区并且两个节点中的分区都可能包含相同的单词作为键那么减速
Python 包安装：pip 与 yum，还是两者一起安装？

我刚刚开始管理 Hadoop 集群我们使用 Bright Cluster Manager 直至操作系统级别 CentOS 7 1 然后使用 Ambari 以及适用于 Hadoop 的 Hortonworks HDP 2 3 我不断收到安装
与文件名中的冒号“：”作斗争

我有以下代码用于加载大量 csv gz 并将它们转储到其他文件夹中并将源文件名作为一列 object DailyMerger extends App def allFiles path File List File val parts
如何强制 Spark 执行代码？

我如何强制 Spark 执行对 map 的调用即使它认为由于其惰性求值而不需要执行它我试过把cache 与地图调用但这仍然没有解决问题我的地图方法实际上将结果上传到 HDFS 所以它并非无用但 Spark 认为它是无用的简短回
Impala：如何查询具有不同模式的多个镶木地板文件

在 Spark 2 1 中我经常使用类似的东西 df spark read parquet path to my files parquet 即使具有不同的模式也可以加载镶木地板文件的文件夹然后我使用 SparkSQL 对数据帧执行一些
ETL informatica 大数据版（非云版）可以连接到 Cloudera Impala 吗？

我们正在尝试在 Informatica 大数据版本不是云版本上进行概念验证我发现我们可能能够使用 HDFS Hive 作为源和目标但我的问题是 Informatica 是否连接到 Cloudera Impala 如果是这样我们是否
如何在Hadoop中序列化List集合对象？

有没有办法在 Hadoop 中序列化 java 集合 The Writable接口仅适用于 Java 原语我有以下类属性 private String keywords private List
Protobuf RPC 在 Hadoop 2.2.0 单节点服务器上不可用？

我正在尝试在按照本教程安装的本地单节点集群上运行 hadoop 2 2 0 mapreduce 作业 http codesfusion blogspot co at 2013 10 setup hadoop 2x 220 on ubuntu
WebSphere 中跨 JVM 的会话复制

我们建立了一个基础设施其中网络服务器是集群的而应用程序服务器不是 Web 服务器根据循环策略将请求路由到应用程序服务器在这种情况下一个应用程序服务器中可用的会话数据在另一应用程序服务器中不可用无论如何是否可以使来自第一个应用程序
如何修复“任务尝试_201104251139_0295_r_000006_0 未能报告状态 600 秒”。

我编写了一个 MapReduce 作业来从数据集中提取一些信息该数据集是用户对电影的评分用户数量约25万电影数量约30万地图的输出是

随机推荐

采用什么策略来监控后台用户位置？

我想要在后台跟踪用户位置目的是当他靠近他的一位朋友时向他发出警报所以我从CLLocationManager 据我所知即使用户重新启动 Iphone 或终止应用程序这也是让应用程序了解位置更新的唯一可靠方法 startMonitori
确定 swf 是否处于“调试”播放器或模式

有没有办法使用 Flash CS3 AS3 来确定发布的 swf 是在调试播放器中运行还是在 Flash 的调试模式下运行我知道 Flex 提供了设置不同构建目标发布调试的能力并且您可以使用类似的东西CONFIG debug fo
setApplicationContext(ApplicationContext applicationContext) 从未调用过

我试图获取 Spring 应用程序上下文然后调用其方法 getBean beanName 来获取特定的 bean 但出现空指针异常表明上下文为空当我在 setApplicationContext 方法中放置一个断点时我发现这个方法永
webpack 和 django 找不到静态文件

问题是我可以在浏览器上访问应用程序但不能访问静态资产 js jsx 和图像我正在使用的技术 django webpack loader 0 2 4 React 0 14 Django 1 8 5 Python 2 7 Django 静态
在无选项卡模式下将一个选项卡打开为浮动窗口

我看过03 无鼠标驱动开发作者 Hadi Hariri http vimeo com 98922030并关闭选项卡总的来说它工作得很好但我发现了一个问题我正在使用 2 个外部显示器我想在 IntelliJ 中打开一个类进行编辑
Microsoft ReportViewer 2012 参考

我在 WINDIR Assembly 中有 Microsoft ReportViewer WinForms 版本 11 0 0 0 publickeytoken 89845dcd8080cc91 实际文件版本是11 0 3412 0 我安装
是否有一个*非常*轻量级的 .net IDE？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案有谁知道 net 有一个好的轻量级 IDE 吗很多时候我打开 VS 并创建一个新项目只是为了看看某行代码是否可以编译测试一个快速方
为什么 myInstance = nil 而不是 self.myInstance = nil？

我为什么要使用在我的 dealloc 方法中 myInstance release 代替 self myInstance release myInstance nil代替self myInstance nil 虽然我们使用self myI
在 Java 中执行简单异步任务的最佳方法？

我想异步调用一个与主线程分开执行某些操作的函数我是 Java 并发方面的新手所以我问执行这样的操作的最佳方法是什么 for File myFile files MyFileService resize myfile lt this sh
使用 Cache.Add 时，如果键已存在，是否会引发异常，还是会静默失败？

我到处都读到如果 Add 方法已经存在它就会失败但它会抛出异常还是会默默失败我正在编写一个多线程 Web 应用程序它不应该存在如果我覆盖缓存将会导致问题因此我无法使用 Insert 方法这是我可以做的事情吗 try Htt
使用 Java 的 HttpUrlConnection PATCH 请求

我正在尝试执行 http PATCH 请求但总是收到 404 错误所以可能我的连接设置不正确 URL url new URL MyPath HttpURLConnection conn HttpURLConnection url ope
NASM x86 16 位寻址模式[重复]

这个问题在这里已经有答案了我在指向地址并在我的情况下写入字节大小的变量时遇到问题这给了我错误错误无效的有效地址 mov byte AX byte 0x0 经过一番尝试和错误后我测试了相同的结果但使用的是 EAX 这编译得很好 m
Phonegap Facebook 连接插件设置

我正在使用phonegap插件连接到facebook 这个 https github com phonegap build FacebookConnect https github com phonegap build FacebookCo
Vitamio 示例错误 - java.lang.UnsatisfiedLinkError：无法加载 vinit findLibrary 返回 null

我在运行 vitamio sample 时遇到问题https github com yixia VitamioBundle https github com yixia VitamioBundle 我正在使用 Android Studio
单一来源文档工具[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案 What OSS http en wikipedia org wiki Open source sof
从向量中提取连续序列

我有一个名为 v 的向量其中包含正值负值以及零问题是如何提取在列表中所有连续的正数序列即用零分隔的正数序列这是v v lt c 75 09619 38 31229 0 57 17792 65 55923 108 52735
如何在 Keycloak 身份验证之前调用 javax.servlet.Filter

我们使用resteasy开发了一个REST API 部署在 Wildfly 10 中基本上这些 REST API 是从另一个应用程序内部调用的并且端点使用 keycloak 进行保护但一个端点暴露给外部各方该端点也使用 keycl
如何以编程方式将多个源添加到 HTML5 音频标记？

许多示例演示了嵌套在音频标签中的多个源标签作为克服不同浏览器之间编解码器兼容性的方法像这样的东西
eclipse：“重新索引存储库工作区”或“计算存储库工作区的 Git 状态”

我正在使用 eclipse Juno 昨天我注意到我的计算机变得非常热我检查了CPU使用率发现它是100 Eclipse 是罪魁祸首忙着重新索引存储库工作区半小时后还没完成我的机器快要融化了我搜索并发现了这些类似的问题重新索
如何检索 Hdfs 文件中的复制因子信息？

我已为文件设置复制因子如下所示 hadoop fs D dfs replication 5 copyFromLocal file txt user xxxx When a NameNode重新启动它确保复制不足的块被复制因此文件的复

热门标签