Hadoop集群节点数

2024-01-01

我正在尝试设置 Hadoop 多节点集群。

当我启动集群时，这是我在控制台中的响应。

hduser@hadoop-master:/usr/local/hadoop$ /usr/local/hadoop/sbin/start-dfs.sh
Starting namenodes on [hadoop-master]
hadoop-master: starting namenode, logging to /usr/local/hadoop/logs/hadoop-hduser-namenode-hadoop-master.out
hadoop-master: starting datanode, logging to /usr/local/hadoop/logs/hadoop-hduser-datanode-hadoop-master.out
hadoop-child: starting datanode, logging to /usr/local/hadoop/logs/hadoop-hduser-datanode-hadoop-child.out
Starting secondary namenodes [0.0.0.0]
0.0.0.0: starting secondarynamenode, logging to /usr/local/hadoop/logs/hadoop-hduser-secondarynamenode-hadoop-master.out
hduser@hadoop-master:/usr/local/hadoop$ jps
21079 NameNode
21258 DataNode
21479 SecondaryNameNode
21600 Jps
hduser@hadoop-master:/usr/local/hadoop$ /usr/local/hadoop/sbin/start-yarn.sh
starting yarn daemons
starting resourcemanager, logging to /usr/local/hadoop/logs/yarn-hduser-resourcemanager-hadoop-master.out
hadoop-child: starting nodemanager, logging to /usr/local/hadoop/logs/yarn-hduser-nodemanager-hadoop-child.out
hadoop-master: starting nodemanager, logging to /usr/local/hadoop/logs/yarn-hduser-nodemanager-hadoop-master.out
hduser@hadoop-master:/usr/local/hadoop$ jps
21079 NameNode
21258 DataNode
22117 Jps
21815 NodeManager
21479 SecondaryNameNode
21658 ResourceManager

您可以看到一个 datanode 正在 hadoop-child 机器中启动。

现在，当我尝试获取所有节点信息时。我没有看到所有节点都被显示。

hduser@hadoop-master:/usr/local/hadoop$ bin/hdfs dfsadmin -report
Configured Capacity: 21103243264 (19.65 GB)
Present Capacity: 17825124352 (16.60 GB)
DFS Remaining: 17821085696 (16.60 GB)
DFS Used: 4038656 (3.85 MB)
DFS Used%: 0.02%
Under replicated blocks: 0
Blocks with corrupt replicas: 0
Missing blocks: 0
Missing blocks (with replication factor 1): 0

-------------------------------------------------
Live datanodes (1):

Name: 127.0.0.1:50010 (localhost)
Hostname: localhost
Decommission Status : Normal
Configured Capacity: 21103243264 (19.65 GB)
DFS Used: 4038656 (3.85 MB)
Non DFS Used: 3278118912 (3.05 GB)
DFS Remaining: 17821085696 (16.60 GB)
DFS Used%: 0.02%
DFS Remaining%: 84.45%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Sun Feb 26 17:13:04 UTC 2017

我需要在这里查看master和child的信息。我有 1 个主节点和 1 个子节点。

********************使固定*******

根据弗兰克的说法，这就是修复的方式。

编辑 /etc/config 文件并给出主 IP 地址和子 IP 地址。

更改了以下 2 行

127.0.0.1 localhost hadoop-master
961.118.98.183 hadoop-child

到（在两个节点中）

127.0.0.1 localhost 
961.118.99.251 hadoop-master
961.118.98.183 hadoop-child

2.按以下顺序重新启动集群..应重新格式化数据节点。

format will remove only the meta, the datanode's data directories will still be using the old namenode's identity which wil cause the datanode to fail(so delete the directories).

Can you please this order.. 
1) stop the cluster 
2) rm -rf /path/to/datanode/data/dir (in both nodes) 
3) hadoop namenode -format
4) START cluste

设置多节点环境时，namenode和resourcemanager地址必须明确定义。

将此属性添加到core-site.xml在两个节点中，

<property>
  <name>fs.defaultFS</name>
  <value>hdfs://hadoop-master:8020</value>
</property>

还有这个在yarn-site.xml,

<property>
  <name>yarn.resourcemanager.hostname</name>
  <value>hadoop-master</value>
</property>

确保在/etc/hosts所有节点的文件，IP地址和主机名映射完成。

Note:如果服务正在运行，请停止它们并添加这些属性，然后再重新启动它们。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

Hadoop集群节点数的相关文章

Sqoop - 绑定到 YARN 队列

因此使用 MapReduce v2 您可以使用绑定到某些 YARN 队列来管理资源和优先级基本上通过使用 hadoop jar xyz jar D mapreduce job queuename QUEUE1 input output
处理 oozie 工作流程中的循环

我有一个 oozie 用例用于检查输入数据可用性并根据数据可用性触发 MapReduce 作业所以我编写了一个 shell 脚本来检查输入数据并在 oozie 中为其创建了一个 ssh 操作输入数据检查的重试次数和重试间隔应该是可配
从 HDFS 传出文件

我想将文件从 HDFS 传输到另一台服务器的本地文件系统该服务器不在 hadoop 集群中而是在网络中我本可以这样做 hadoop fs copyToLocal
java.io.IOException: EnsureRemaining: 仅剩余 0 个字节，尝试读取 1

我在 giraph 中的自定义类方面遇到一些问题我制作了 VertexInput 和 Output 格式但总是收到以下错误 java io IOException ensureRemaining Only bytes remaining
无法验证 serde：org.openx.data.jsonserde.jsonserde

我编写了这个查询来在配置单元上创建一个表我的数据最初是 json 格式所以我已经下载并构建了 serde 并添加了它运行所需的所有 jar 但我收到以下错误 FAILED Execution Error return code 1 fr
Sqoop 导出分区的 Hive 表

我在尝试导出分区的 Hive 表时遇到了一些问题这是否完全受支持我尝试用谷歌搜索并找到一张 JIRA 票证 sqoop export connect jdbc mysql localhost testdb table sales exp
运行 Sqoop 导入和导出时如何找到最佳映射器数量？

我正在使用 Sqoop 版本 1 4 2 和 Oracle 数据库运行 Sqoop 命令时例如这样 sqoop import fs
Hive：在查询中将 array 转换为 array

我有两张桌子 create table a 1 array
公平调度器和容量调度器有什么区别？

我是 Hadoop 世界的新手想了解公平调度程序和容量调度程序之间的区别另外我们什么时候应该使用每一个请简单地回答一下因为我在网上读了很多东西但从中得到的不多公平调度是一种为作业分配资源的方法使得所有作业随着时间的推移平均获得
Hadoop-reducer 如何获取数据？

据我所知映射器为每个减速器生成 1 个分区减速器如何知道要复制哪个分区假设有 2 个节点运行用于字数统计程序的映射器并且配置了 2 个缩减器如果每个映射节点生成 2 个分区并且两个节点中的分区都可能包含相同的单词作为键那么减速
Python 包安装：pip 与 yum，还是两者一起安装？

我刚刚开始管理 Hadoop 集群我们使用 Bright Cluster Manager 直至操作系统级别 CentOS 7 1 然后使用 Ambari 以及适用于 Hadoop 的 Hortonworks HDP 2 3 我不断收到安装
无法在 Presto 中读取数据 - 在 Hive 中可以读取数据

我有一个 Hive DB 我创建了一个与 Parquet 文件类型兼容的表 CREATE EXTERNAL TABLE default table date date udid string message token string PAR
更改spark_temporary目录路径

是否可以更改 temporarySpark在写入之前保存临时文件的目录特别是由于我正在编写表的单个分区因此我希望临时文件夹位于分区文件夹内是否可以由于其实现原因无法使用默认的 FileOutputCommiter FileOut
在 Google Cloud Dataproc 环境中使用 Hadoop 流式处理运行 python map reduce 作业时出错

我想使用 hadoop 流方法在 Google Cloud Dataproc 中运行 python map reduce 作业我的map reduce python脚本输入文件和作业结果输出位于Google Cloud Storage中
将数据从 .txt 文件加载到 Hive 中以 ORC 形式存储的表

我有一个数据文件位于 txt格式我正在使用该文件将数据加载到 Hive 表中当我将文件加载到类似表中时 CREATE TABLE test details txt visit id INT store id SMALLINT STORE
MapReduce 中的分区到底是如何工作的？

我认为我总体上对 MapReduce 编程模型有一定的了解但即使在阅读了原始论文和其他一些来源之后我仍然不清楚许多细节特别是关于中间结果的分区我将快速总结到目前为止我对 MapReduce 的理解我们有一个可能非常大的输入数据集
没有函数映射到名称“coord:formatTime”

我正在尝试使用 oozie 中的以下内容获取当前时间戳
Hadoop 超立方体

嘿我正在启动一个基于 hadoop 的超立方体具有灵活的维度数有人知道这方面现有的方法吗我刚刚发现PigOLAP草图 http wiki apache org pig PigOLAPSketch 但没有代码可以使用它另一种方法是Z
Hadoop 减速器数量配置选项优先级

以下3个设置reduce数量的选项的优先级是什么换句话说如果三者都设置了会考虑哪一个呢 Option1 setNumReduceTasks 2 within the application code Option2 D mapredu
如何使用 log4j 自定义附加程序在 HDFS 上创建日志？

Overview 我们希望使用 log4j 记录 Spark 作业活动并将日志文件写入 HDFS Java 8 Spark 2 4 6 Scala 2 1 2 Hadoop 3 2 1 我们无法找到本地 apache log4j 附加程序

随机推荐

哪些 Rust 数据结构是不确定的

编写智能合约时确保使用的所有数据结构都是确定性的非常重要具体来说如果HashMap or HashSet使用 Rust 标准库是否存在可能的非确定性由于 Wasm 运行时无法访问非确定性输入因此整个执行是确定性的 HashSet
Entity Framework 5.0 PostgreSQL (Npgsql) 默认连接工厂

我试图首先使用 PostgreSQL Npgsql 提供程序获取 EF 5 0 代码我通过 NuGet 安装了 Npgsql 2 0 12 1 尽管引用的程序集是 2 0 12 0 我在 app config 中声明了 Npgsql 默
mmap：强制 64K 对齐

我正在将由我为 Windows 编写的项目移植到移动平台我需要相当于VirtualAlloc 朋友自然的就是mmap 然而有两个显着差异返回的地址VirtualAlloc保证是所谓的倍数分配粒度 dwAllocationGran
在 SQLalchemy 中过滤左连接

使用 SQLalchemy 我想执行左外连接并且过滤掉在连接表中确实有匹配的行我正在发送推送通知所以我有一个Notification桌子这意味着我也有一个ExpiredDeviceId用于存储不再有效的 device id 的表我不
强制标准输出编码为 UTF8

我希望从我的 C 项目中另一个应用程序的标准输出流中解析 UTF8 字符使用默认方法从进程的标准输出流读取时 ANSI 范围之外的字符会被损坏现在根据微软的说法我需要做的是设置StandardOutputEncoding 如果 St
将 hibernate 添加到 netbeans 中的现有 Web 应用程序中？

我在 netbeans 中创建了一个 Web 应用程序它运行良好现在出于学习目的我想使用 hibernate 进行数据库交互我可以在 netbeans 中使用 hibernate 创建一个新项目但我不知道如何在现有项目中添加 hi
Javascript getImageData for canvas html5

我已经把头发扯下来了我得到了这个工作认为我可以承担不保存这个版本的费用然后我打破了构建线路myImageData context getImageData 0 0 canvas width canvas height 似乎打破
PHP进程间通信监控消息队列

我正在开发一个项目为排行榜和其他几个位置生成统计数据我的目标是尽可能实时因此我实现了一个用于消息队列的 RabbitMQ 服务器在前端我有一个 Nodejs 设置用于将信息提供给正在观看它的客户在同一台服务器上我有一个 PH
InvalidOperationException：内容类型不正确：ASP.NET Core

我有两种表格一种用于登录一种用于注册它们都在同一视图上并使用同一模型我正在使用控制器处理表单提交我在访问登录页面时收到以下错误 InvalidOperationException Incorrect Content Type 完整
Custom.css 在 32.0.1700.76 m Google Chrome 更新中停止工作

我使用此网站上的 Google 开发者工具的一些主题 http devthemez com themes chrome developer tools http devthemez com themes chrome developer t
如何将元素数组转换为 NodeList？

首先第一件事是这不是问如何将 NodeList 转换为数组这是相反的为了保持一致性我想创建一个返回 NodeList 的函数就像document querySelectorAll does 这是我当前的代码 var toNodeL
如何使用reason-react有条件地在JSX中设置HTML属性？

我想渲染一个 HTML 复选框其选中状态由数据控制给出一个接收一个无状态组件item type label string checked bool Like so let component ReasonReact statelessC
删除 MySQL 表中的重复条目[重复]

这个问题在这里已经有答案了我有一个有几千行的表该表包含两列 name and email 我有几个重复的行例如约翰史密斯电子邮件受保护 cdn cgi l email protection 约翰史密斯电子邮件受保护 cdn
有没有办法影响 AlchemyAPI 情感分析

我使用 AlchemyAPI 进行文本分析我想知道是否有办法影响 API 结果或根据要求对其进行微调我试图分析互联网上可用的不同呼叫中心对话了解情绪即客户是否不满意生气因此对话是否消极对于十分之九的对话它给出的情绪是积极的
无法解析：com.google.code.gson:gson.2.2.2

我将项目从 eclipse 导入到 android studio 并在将项目与 gradle 文件同步后收到上述消息我是 android studio 的新手不知道如何解决这个错误以下是 Gradle 文件 apply plugin
Bitbucket 上的 Git：始终要求输入密码，即使在上传我的公共 SSH 密钥后也是如此

我上传了我的 ssh id rsa pub to Bitbucket 的 SSH 密钥 https bitbucket org account ssh keys as 解释了 https confluence atlassian com b
Windows Phone 8.1 设备 (Lumia 930) 和 VS2013 调试仅适用于禁用 WiFi

当 Windows Phone 8 1 应用程序启动进行部署和调试时 VS2013 中出现错误错误 1 错误 DEP6100 发生以下意外错误在 boostrapping 阶段连接到设备 SmartDeviceException 部署
Flutter 自动完成功能在 VSCode 中不适用于包

我将整个 flutter 项目移动到一个新文件夹一切运行正常自动完成功能适用于 flutter 中的构建文件例如 Container Column 但是当我尝试使用包例如提供者时我需要进入 pub dev 页面并复制导入手动导
word2vec - 什么是最好的？添加、连接或平均词向量？

我正在研究循环语言模型为了学习可用于初始化语言模型的词嵌入我使用 gensim 的 word2vec 模型训练后 word2vec 模型为词汇表中的每个单词保存两个向量单词嵌入输入隐藏矩阵的行和上下文嵌入隐藏输出矩阵的列
Hadoop集群节点数

我正在尝试设置 Hadoop 多节点集群当我启动集群时这是我在控制台中的响应 hduser hadoop master usr local hadoop usr local hadoop sbin start dfs sh Starti

Hadoop集群节点数

Hadoop集群节点数 的相关文章

随机推荐

热门标签

Hadoop集群节点数的相关文章