hadoop实践（三）hadoop 集群配置

2023-10-27

第一步：集群规划

master 192.168.136.140
slave1 192.168.136.151
slave2 192.168.136.152

第二步：配置环境变量：

1） vi /etc/profile 在最后面添加如下代码：

export JAVA_HOME=/usr/java/jdk1.7.0_80
export JAVA_BIN=/usr/java/jdk1.7.0_80/bin
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export JAVA_HOME JAVA_BIN PATH CLASSPATH
export HADOOP_HOME=/opt/hadoop/hadoop-2.6.4 
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:</span></span>

使之生效：[root@master dfs]# source /etc/profile

2）vi /etc/hosts文件在最后面添加如下内容：

[root@master dfs]# vim /etc/hosts
127.0.0.1 localhost
192.168.136.140 master.hadoop
192.168.136.151 slave1.hadoop
192.168.136.152 slave2.hadoop

第三步：配置hadoop （master 192.168.136.140）

使用hadoop用户，进入目录/opt/hadoop/hadoop-2.6.4/etc/hadoop

1) [hadoop@master hadoop]$ vim core-site.xml

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/hadoop/tmp</value>
<description>Abase for other temporary directories.</description>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master.hadoop:9000</value>
</property>
<property>
<name>io.file.buffer.size</name>
<value>4096</value>
</property>
</configuration>

2) vim hadoop-env.sh 和 yarn-env.sh 在开头添加如下环境变量(一定要添加切勿少了)

export JAVA_HOME=/usr/java/jdk1.7.0_80

3）vim hdfs-site.xml

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:///usr/hadoop/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:///usr/hadoop/dfs/data</value>
</property>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>

<property>
<name>dfs.nameservices</name>
<value>hadoop-cluster1</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>master.hadoop:50090</value>
</property>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
</configuration>

4) vim mapred-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
<final>true</final>
</property>

<property>
<name>mapreduce.jobtracker.http.address</name>
<value>master.hadoop:50030</value>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>master.hadoop:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>master.hadoop:19888</value>
</property>
<property>
<name>mapred.job.tracker</name>
<value>http://master.hadoop:9001</value>
</property>
</configuration>

5）vim yarn-site.xml

<?xml version="1.0"?>
<configuration>

<property>
<name>yarn.resourcemanager.hostname</name>
<value>master.hadoop</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>master.hadoop:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>master.hadoop:8030</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>master.hadoop:8031</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>master.hadoop:8033</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>master.hadoop:8088</value>
</property>
</configuration>

第五步单机验证

1）如果没有启动进程（start-all.sh）

执行： [hadoop@master sbin]$ hadoop dfsadmin -report

正常是报告连接不上端口:9000

16/06/12 15:28:41 DEBUG ipc.Client: Connecting to master.hadoop/192.168.136.140:9000
16/06/12 15:28:41 DEBUG ipc.Client: closing ipc connection to master.hadoop/192.168.136.140:9000: Connection refused
java.net.ConnectException: Connection refused
at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method)
at sun.nio.ch.SocketChannelImpl.finishConnect(SocketChannelImpl.java:744)
at org.apache.hadoop.net.SocketIOWithTimeout.connect(SocketIOWithTimeout.java:206)
at org.apache.hadoop.net.NetUtils.connect(NetUtils.java:530)

2) 进程已经启动（start-all.sh）

执行： [hadoop@master sbin]$ hadoop dfsadmin -report

补充说明：本人系统，上面1）情况下在执行时，开始并没有认识到进程没有启动，排查中发现另外一个问题：

补充-1）增加debug调试
[hadoop@master hadoop-2.6.4]$ export HADOOP_ROOT_LOGGER=DEBUG,console
[hadoop@master hadoop-2.6.4]$
[hadoop@master hadoop-2.6.4]$ hadoop dfsadmin -report
。。。。
16/06/12 12:59:11 DEBUG util.NativeCodeLoader: Failed to load native-hadoop with error: java.lang.UnsatisfiedLinkError: /opt/hadoop/hadoop-2.6.4/lib/native/libhadoop.so.1.0.0: /lib64/libc.so.6: version `GLIBC_2.14' not found (required by /opt/hadoop/hadoop-2.6.4/lib/native/libhadoop.so.1.0.0)
。。。。。

注意到这里有 `GLIBC_2.14' not found

补充-2）查看系统版本：
[hadoop@master hadoop-2.6.4]$ ll /lib64/libc.so.6
lrwxrwxrwx. 1 root root 12 Apr 28 14:43 /lib64/libc.so.6 -> libc-2.12.so

因此，去查找解决办法：

坑啊！！！
补充-3）解决

到网站http://ftp.gnu.org/gnu/glibc/
下载glibc-2.14.tar.bz2
下载glibc-linuxthreads-2.5.tar.bz2
[root@master soft]# tar -jxvf /home/hadoop/soft/glibc-2.14.tar.bz2
[root@master soft]# cd glibc-2.14/
[root@masterglibc-2.14]# tar -jxvf /home/hadoop/soft/glibc-linuxthreads-2.5.tar.bz2
[root@master glibc-2.14]# cd .. #必须返回上级目录
[root@master glibc-2.14]# export CFLAGS="-g -O2" #加上优化开关，否则会出现错误
[root@master soft]# ./glibc-2.14/configure --prefix=/usr --disable-profile --enable-add-ons --with-headers=/usr/include --with-binutils=/usr/bin
[root@master soft]# make #编译，执行很久，可能出错，出错再重新执行
[root@master soft]# make install #安装，必须root用户执行
#验证版本是否升级
[root@master soft]# ll /lib64/libc.so.6
lrwxrwxrwx 1 root root 12 Jun 25 02:07 /lib64/libc.so.6 -> libc-2.14.so #显示2.14

注意两台slaves也需要如法炮制

第六步：集群配置

1） master上

进入/opt/hadoop/hadoop-2.6.4/etc/hadoop目录， hadoop用户

[hadoop@master hadoop]$ vim slaves
slave1.hadoop
slave2.hadoop

2）登录：master将hadoop整个的copy到另外两台机器上面

scp -r /opt/hadoop/hadoop-2.6.4 192.168.136.151:/opt/hadoop/hadoop-2.6.4
scp -r /opt/hadoop/hadoop-2.6.4 192.168.136.152:/opt/hadoop/hadoop-2.6.4

3）配置两位两台机器上面的下面两个文件配置。
/etc/hosts
/ets/profile
配置内容和master一致

4）将三台机器的防火墙关闭掉：
root用户下：service iptables stop

到此：整个三台Hadoop的集群的机器算是配置完成了；

第七步：集群验证

master上验证：

[hadoop@master hadoop]$ jps
119213 ResourceManager
119544 Jps
118968 NameNode

说明：本机一开始NameNode 没有，显然是有问题，后面解决（解决方法看后面补充）

slave1 上验证：

[hadoop@slave1 hadoop-2.6.4]$ jps
59295 Jps
59045 DataNode
59150 NodeManager

slave2 上验证：

[hadoop@slave2 hadoop]$ jps
59201 NodeManager
59096 DataNode
59345 Jps

登录web验证：

http://192.168.136.140:8088/cluster/nodes

http://192.168.136.140:50070/dfshealth.html#tab-overview

这两个网址能顺利打开，就表示ok

+++++++++++++++++++++++++++++++++++++

补充一:NameNode 没有正常启动的解决

首先查log：

2016-06-12 13:25:46,764 FATAL org.apache.hadoop.hdfs.server.namenode.NameNode: Failed to start namenode.
org.apache.hadoop.hdfs.server.common.InconsistentFSStateException: Directory /usr/hadoop/dfs/name is in an inconsistent state: storage directory does not exist or is not accessible.
at org.apache.hadoop.hdfs.server.namenode.FSImage.recoverStorageDirs(FSImage.java:314)
at org.apache.hadoop.hdfs.server.namenode.FSImage.recoverTransitionRead(FSImage.java:202)
at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.loadFSImage(FSNamesystem.java:1022)

/usr/hadoop/dfs/name 看来是没有，手工验证一下，确实不会自己创建，有点弱智。重新创建这该用户。

再次启动，还是报错，但是错误变化了：

2016-06-12 15:20:04,608 INFO org.apache.hadoop.hdfs.server.common.Storage: Lock on /usr/hadoop/dfs/name/in_use.lock acquired by nodename 116900@master.hadoop
2016-06-12 15:20:04,611 WARN org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Encountered exception loading fsimage
java.io.IOException: NameNode is not formatted.
at org.apache.hadoop.hdfs.server.namenode.FSImage.recoverTransitionRead(FSImage.java:212)
at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.loadFSImage(FSNamesystem.java:1022)
at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.loadFromDisk(FSNamesystem.java:741)

NameNode is not formatted. 于是格式化一下，具体命令：

[hadoop@master hadoop-2.6.4]$ bin/hadoop namenode -format
DEPRECATED: Use of this script to execute hdfs command is deprecated.
Instead use the hdfs command for it.

16/06/12 15:25:49 INFO namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG: host = master.hadoop/192.168.136.140
STARTUP_MSG: args = [-format]
STARTUP_MSG: version = 2.6.4

。。。。。

最后再次重新启动 start-all.sh 注意格式化前最好先stop-all.sh

+++++++++++++++++++++++++++++++++++++

补充二： master 执行jps 只看到2个进程

[hadoop@master hadoop]$ jps
119213 ResourceManager
119544 Jps
118968 NameNode

缺少了secondarynamenode进程，排除了好久，才发现start-all.sh里面就没有secondarynamenode启动项目，补充后执行正常启动，再次执行jps

[hadoop@master ~]$ jps
3303 ResourceManager
3871 Jps
3677 SecondaryNameNode
3058 NameNode

hadoop-daemons.sh --config $HADOOP_CONF_DIR --hosts secondarynamenode start secondarynamenode

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

hadoop实践（三）hadoop 集群配置的相关文章

运行时异常：java.lang.NoSuchMethodException：tfidf$Reduce.()

如何解决这个问题 tfidf是我的主类为什么运行jar文件后会出现这个错误 java lang RuntimeException java lang NoSuchMethodException tfidf Reduce
如何创建 HIVE 表来读取分号分隔值

我想创建一个 HIVE 表该表将以分号分隔的值读取但我的代码不断给出错误有没有人有什么建议 CREATE TABLE test details Time STRING Vital STRING sID STRING PARTITION
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
如何跟踪hadoop中哪个数据块在哪个数据节点？

如果复制一个数据块会复制到哪个数据节点是否有任何工具可以显示复制块存在的位置如果您知道文件名则可以通过 DFS 浏览器查找转到您的 namenode Web 界面说浏览文件系统并导航到您感兴趣的文件在页面底部将列出文件中
Hadoop 推测任务执行

在Google的MapReduce论文中他们有一个备份任务我认为这与Hadoop中的推测任务是一样的推测任务是如何实现的当我启动一项推测任务时该任务是从一开始就作为较旧且缓慢的任务开始还是从较旧的任务到达的位置开始如果是这样
java.lang.ClassNotFoundException：找不到类 org.apache.hadoop.fs.azurebfs.SecureAzureBlobFileSystem

我是 Spark 和 Kubernetes 世界的新手我使用 docker image tool sh 实用程序使用与 Hadoop 3 2 捆绑在一起的官方 Spark 3 0 1 构建了 Spark docker 映像我还为 Jup
从 HDFS 传出文件

我想将文件从 HDFS 传输到另一台服务器的本地文件系统该服务器不在 hadoop 集群中而是在网络中我本可以这样做 hadoop fs copyToLocal
Hadoop Windows 设置。运行 WordCountJob 时出错：“任何本地目录中都没有可用空间”

我正在按照此视频教程尝试在我的计算机上设置 hadoop 如何在 Windows 10 上安装 Hadoop https www youtube com watch v zujpglKP0Nw 我已经成功设置它从 sbin 目录执行 st
运行 Sqoop 导入和导出时如何找到最佳映射器数量？

我正在使用 Sqoop 版本 1 4 2 和 Oracle 数据库运行 Sqoop 命令时例如这样 sqoop import fs
在 Hadoop MapReduce 中为二进制文件创建自定义 InputFormat 和 RecordReader

我正在编写一个 M R 作业该作业处理以二进制格式编写的大型时间序列数据文件如下所示此处换行以提高可读性显然实际数据是连续的 TIMESTAMP 1 TIMESTAMP 1 TIMESTAMP 2 TIMESTAMP 2 TIME
公平调度器和容量调度器有什么区别？

我是 Hadoop 世界的新手想了解公平调度程序和容量调度程序之间的区别另外我们什么时候应该使用每一个请简单地回答一下因为我在网上读了很多东西但从中得到的不多公平调度是一种为作业分配资源的方法使得所有作业随着时间的推移平均获得
Python 包安装：pip 与 yum，还是两者一起安装？

我刚刚开始管理 Hadoop 集群我们使用 Bright Cluster Manager 直至操作系统级别 CentOS 7 1 然后使用 Ambari 以及适用于 Hadoop 的 Hortonworks HDP 2 3 我不断收到安装
如何有效地将数据从 Kafka 移动到 Impala 表？

以下是当前流程的步骤 Flafka http blog cloudera com blog 2014 11 flafka apache flume meets apache kafka for event processing 将日志写入
Hive NVL 不适用于列的日期类型 - NullpointerException

我正在使用 HDFS 上的 MapR Hive 发行版并面临以下问题如果表的列类型是日期类型则NVL https cwiki apache org confluence display Hive LanguageManual UDF
将数据从 .txt 文件加载到 Hive 中以 ORC 形式存储的表

我有一个数据文件位于 txt格式我正在使用该文件将数据加载到 Hive 表中当我将文件加载到类似表中时 CREATE TABLE test details txt visit id INT store id SMALLINT STORE
Hadoop - 直接从 Mapper 写入 HBase

我有一个 hadoop 作业其输出应写入 HBase 我并不真正需要减速器我想要插入的行类型是在映射器中确定的如何使用 TableOutputFormat 来实现此目的从所有示例中我看到的假设是 reducer 是创建 Put 的
没有函数映射到名称“coord:formatTime”

我正在尝试使用 oozie 中的以下内容获取当前时间戳
匿名类上的 NotSerializedException

我有一个用于过滤项目的界面 public interface KeyValFilter extends Serializable public static final long serialVersionUID 7069537470113
MapReduce 中 1 个任务的减速器数量

在典型的 MapReduce 设置如 Hadoop 中 1 个任务使用多少个减速器例如计算单词数我对 Google MapReduce 的理解意味着只涉及 1 个减速器那是对的吗例如单词计数会将输入分为 N 个块并且 N 个
Hadoop fs 查找块大小？

在 Hadoop fs 中如何查找特定文件的块大小我主要对命令行感兴趣例如 hadoop fs hdfs fs1 data 但看起来这并不存在有Java解决方案吗 The fsck其他答案中的命令列出了块并允许您查看块的数量但是要

随机推荐

基于深度图与RGB图--＞点云数据

在这里记录一下以备后续查阅输入对齐的深度图与RGB图输出点云数据 include
React 源碼解析 - Hooks 系列

React 源碼解析 Hooks 系列前言正文調用 React Hook 到底背後發生了什麼初探 Hooks 源碼 Dispatcher useState Hook Hook 的實現 Hook 在 Mount 階段 useState
STM32CubeMX5.6.1生成的代码无启动文件

丢失启动文件使用这个版本的CubeMX 生成的代码里面没有对应的启动文件编译报错展开图片在Drivers CMSIS文件夹下面没有启动文件编译不通过报错No section matches selector no sectio
微信小程序云开发：上传图片、视频到云存储指定目录并渲染到页面上

该文章功能为主样式为次页面展示前期准备在云开发控制台的云存储环境中创建新建img文件夹和video文件夹 wxml
C 标准库 - 《limits.h》

原文链接 https www runoob com cprogramming c standard library limits h html 简介 limits h 头文件决定了各种变量类型的各种属性定义在该头文件中的宏限制了各种变量类
python控制系统操作-tqdm模块在终端控制台cmd中实现程序进度条的显示和控制（分别通过for循环和while循环实现）

python控制系统操作 tqdm模块在终端控制台cmd中实现程序进度条的显示和控制分别通过for循环和while循环实现 1 for循环控制推荐使用因为可以正常显示运行的时间手动迭代进度条 from time import sle
Telink泰凌微TLSR8258蓝牙开发笔记（一）

一开发环境搭建 1 1 软件开发环境 1 1 1 开发的IDE IDE下载链接 1 1 2 烧录工具 DBT下载地址 1 1 3 蓝牙SDK 蓝牙SDK下载地址 1 2 硬件开发环境 8258开发板烧录工具一套二运行例程并使能打印
Leetcode 122:买卖股票二

题目描述题目连接与第一次的题目相比可以多次买卖等情况只要求出最大利润即可可以将一次买卖分为过个过程即可 1 2 3 4 5 比如正常情况下是第一天买进第五天卖出但这个过程可以分解为多次买进卖出在第一天买进第二天卖出获得利
Meshlab源码编译 VS2013+QT5.8.0

有了前面的配置基础 VS2013 QT5 8 0配置接下来我们来编译源码 1 下载meshlab源码我以 meshlab 32bit v 1 3 3 为例利用它的源代码 MeshLabSrc AllInc v133 tgz 详细给出编
关于TypeError: decode() argument ‘encoding‘ must be str, not None 的三种解决方法

使用Scrapy Redis时有一个常见的错误可能会让你烦恼不已 TypeError decode argument encoding must be str not None 这是因为Scrapy Redis在从Redis队列中读取请求
Fiddler新版全平台适配抓包，关键还免费，再也不用费劲找破解版了

Fiddler Everywhere是适用于macOS Windows和Linux的安全且现代化的web调试代理他可以捕获检查监视计算机与Internet之间的所有HTTP S 流量并且可以mock请求并诊断网络问题这种方法既简
水仙花数(c语言程序实现）

描述请判断一个数是不是水仙花数其中水仙花数定义各个位数立方和等于它本身的三位数输入有多组测试数据每组测试数据以包含一个整数n 100 lt n lt 1000 输入0表示程序输入结束输出如果n是水仙花数就输出Yes 否则输出N
里面如何配置库_沙龙回顾

随着自动驾驶技术不断发展 Apollo 已经从研发走向量产产品落地作为 Apollo 开源软件平台的一部分 Apollo Cyber RT处于底层的实时操作系统 RTOS 和算法模块之间能够在保证高吞吐的情况下又能低延迟的实时响应上层
thinkbook14+（thinkbook16+）屏幕亮度忽明忽暗

thinkbook14 thinkbook16 在断开电源线的情况下屏幕会时不时忽明忽暗非常恶心查了半天才在贴吧找到如何解决这个问题开始菜单里搜索英特尔显卡控制中心在系统选项里有个功率功率里有个显示器节能关掉就好了
Hyperledger Fabric 入门笔记（三）Fabric V2.4 环境搭建

文章目录前言一基本概念 1 1 虚拟机 1 2 虚拟机软件二虚拟机相关 2 1 VirualBox7安装Ubuntu 2 2 Vmware安装Ubuntu 2 3 Ubuntu的使用 2 3 1 软件包管理器 2 3 1 1 yu
vue汉字转拼音-pinyin.js

需求用户在输入姓和名字的时候由于姓拼音和名拼音为字母容易输错于是就有了自动生成拼音这个需求 npm install安装的四种用法 save和 save dev npm install xxx 安装项目到项目目录下不会将模块
软件工程基础知识-软件质量

软件质量是指反映软件系统或软件产品满足规定或隐含要求的能力的特征和特性全体软件质量保证是为保证软件系统或软件产品充分满足用户要求的质量而进行的有计划有组织的活动其目的是生产该质量的软件一软件质量特性二软件质量保证三软件评审
spring集成Junit4配置

这两天做Web开发发现通过Spring进行对象管理之后做测试变得复杂了因为所有的Bean都需要在applicationContext xml中加载好之后再通过 Resource去取得如果每次都要整个业务流做的差不多了再去测试这样
OpenCV-Python图形图像处理专栏文章目录

前往老猿Python博客 https blog csdn net LaoYuanPython 注 1 部分文章前面标星号表示文章为付费专栏文章 2 本专栏的伴生付费专栏 https blog csdn net LaoYuanPython a
hadoop实践（三）hadoop 集群配置

第一步集群规划 master 192 168 136 140 slave1 192 168 136 151 slave2 192 168 136 152 第二步配置环境变量 1 vi etc profile 在最后面添加如下代码 exp

hadoop实践（三）hadoop 集群配置

hadoop实践（三）hadoop 集群配置 的相关文章

随机推荐

热门标签

hadoop实践（三）hadoop 集群配置的相关文章