配置hadoop各个节点之间免密码登录实践笔记

2023-11-03

前言：

最近在搭建Hadoop环境需要设置无密码登陆，所谓无密码登陆其实是指通过证书认证的方式登陆，使用一种被称为"公私钥"认证的方式来进行ssh登录。

在linux系统中,ssh是远程登录的默认工具,因为该工具的协议使用了RSA/DSA的加密算法.该工具做linux系统的远程管理是非常安全的。telnet,因为其不安全性,在linux系统中被搁置使用了。

" 公私钥"认证方式简单的解释:首先在客户端上创建一对公私钥（公钥文件：~/.ssh/id_rsa.pub；私钥文件：~/.ssh/id_rsa）。然后把公钥放到服务器上（~/.ssh/authorized_keys）, 自己保留好私钥.在使用ssh登录时,ssh程序会发送私钥去和服务器上的公钥做匹配.如果匹配成功就可以登录了。

0-我们需要为每一台机器编辑hosts文件使主机名和主机ip映射关联起来 :vi /etc/hosts-->在里面添加所有节点的ip 主机名，类似如下格式：

172.18.1.244 server244

172.18.1.246 server246

172.18.1.249 server249

添加完成后，再加上实现ssh免密码登录后就会在用户主目录下的.ssh文件夹下生成一个known_hosts文件

1-实现ssh免密码登陆之前首先得要保证你的电脑安装了ssh及sshd，并且确认本机sshd的配置文件( 需要root权限)，我们先来编辑 vi /etc/ssh/sshd_config,

找到以下内容，并去掉注释符”#“

    RSAAuthentication yes
    PubkeyAuthentication yes
    AuthorizedKeysFile      .ssh/authorized_keys

如果修改了sshd配置文件需要重启sshd服务 (需要root权限):在centos7之前可以通过service sshd restart重启，但是在centos7版本以上的输入service sshd restart它会重定向到一个新的命令，我们复制重定向的命令执行即可达到sshd重启的目的。

2-配置SSH的无密码登录可以首先新建专用用户hadoop进行操作，在此我们为每一个节点新建相同的hadoop用户，执行新建用户命令:adduser hadoop，接着为hadoop用户设置密码 passwd hadoop回车输入密码即可。

3-接着我们以hadoop用户身份登录:su hadoop,进入hadoop的家目录 cd /home/hadoop,输入：ssh-keygen -t rsa -P '',回车，会提示你保存生成的密码的位置，回车的话默认保存在当前目录下的.ssh文件夹下面，这样/home/hadoop/.ssh文件夹下面就有id_rsa和id_pub2个文件，然后我们把id_rsa.pub这个公钥文件追加到 authorized_keys文件中。

解释一下，第一条生成ssh密码的命令，-t 参数表示生成算法，有rsa和dsa两种；-P表示使用的密码，这里使用‘‘空字符串表示无密码。

第二条命令将生成的密钥写入authorized_keys文件。

这时输入 ssh localhost，弹出写入提示后回车，便可无密码登录本机（如果还是提示要输入密码则执行修改文件authorized_keys的权限（权限的设置非常重要,因为不安全的设置安全设置,会让你不能使用RSA功能）：

修改authorized_keys文件权限的命令是: chmod 600 ~/.ssh/authorized_keys

）。同理，将authorized_keys文件通过 scp命令拷贝到其它主机相同目录下，则可无密码登录其它机器。拷贝的命令如下：

scp authorized_keys hadoop@172.18.1.246:/home/hadoop/.ssh

正常情况下上面几步执行完成后，从主机A所在机器向主机A、主机B所在机器发起ssh连接，只有在第一次登录时需要输入密码，以后则不需要。

此时，只是实现了某一个节点登录自己和其他节点免密码，我们还需要以同样的方式实现其他的节点登录其它节点，就如同刚刚我们为这个节点设置的那样，也就是我们需要为其他节点生成公钥和私钥，然后把公钥保存(其实是追加)在authorized_keys文件中，接着把这个authorized_keys文件scp拷贝到其他所有节点，这样所有节点之间都可以实现和其他节点免密码登录，包括登录自己。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

大数据

Hadoop

配置hadoop各个节点之间免密码登录实践笔记的相关文章

将数据从 oracle 移动到 HDFS，处理并从 HDFS 移动到 Teradata

我的要求是将数据从 Oracle 移至 HDFS 处理HDFS上的数据将处理后的数据移至 Teradata 还需要每 15 分钟执行一次整个处理源数据量可能接近50GB 处理后的数据也可能相同在网上搜索了很多之后我发现 PRARO
猪的组连接等效吗？

试图在 Pig 上完成这个任务寻找 MySQL 的 group concat 等效项例如在我的表中我有以下内容 3fields userid clickcount pagenumber 155 2 12 155 3 133 155
处理 oozie 工作流程中的循环

我有一个 oozie 用例用于检查输入数据可用性并根据数据可用性触发 MapReduce 作业所以我编写了一个 shell 脚本来检查输入数据并在 oozie 中为其创建了一个 ssh 操作输入数据检查的重试次数和重试间隔应该是可配
Pig 10.0 - 将元组分组并在 foreach 中合并包

我在用着Pig 10 0 我想在 foreach 中合并包假设我有以下内容visitors alias a b 1 2 3 4 a d 1 3 6 a e 7 z b 1 2 3 我想对第一个字段上的元组进行分组并将包与一组语义合并以获
Hadoop 推测任务执行

在Google的MapReduce论文中他们有一个备份任务我认为这与Hadoop中的推测任务是一样的推测任务是如何实现的当我启动一项推测任务时该任务是从一开始就作为较旧且缓慢的任务开始还是从较旧的任务到达的位置开始如果是这样
无法在 Hadoop Map-Reduce 作业中加载 OpenNLP 句子模型

我正在尝试将 OpenNLP 集成到 Hadoop 上的 Map Reduce 作业中从一些基本的句子分割开始在地图函数中运行以下代码 public AnalysisFile analyze String content InputS
Hadoop NoSuchMethodError apache.commons.cli

我在用着hadoop 2 7 2我用 IntelliJ 做了一个 MapReduce 工作在我的工作中我正在使用apache commons cli 1 3 1我把库放在罐子里当我在 Hadoop 集群上使用 MapReduceJob
从 HDFS 传出文件

我想将文件从 HDFS 传输到另一台服务器的本地文件系统该服务器不在 hadoop 集群中而是在网络中我本可以这样做 hadoop fs copyToLocal
java.io.IOException: EnsureRemaining: 仅剩余 0 个字节，尝试读取 1

我在 giraph 中的自定义类方面遇到一些问题我制作了 VertexInput 和 Output 格式但总是收到以下错误 java io IOException ensureRemaining Only bytes remaining
如何找到 JAR：/home/hadoop/contrib/streaming/hadoop-streaming.jar

我正在练习有关 Amazon EMR 的复数视角视频教程我被困住了因为我收到此错误而无法继续 Not a valid JAR home hadoop contrib streaming hadoop streaming jar 请注意
无法验证 serde：org.openx.data.jsonserde.jsonserde

我编写了这个查询来在配置单元上创建一个表我的数据最初是 json 格式所以我已经下载并构建了 serde 并添加了它运行所需的所有 jar 但我收到以下错误 FAILED Execution Error return code 1 fr
Hive：在查询中将 array 转换为 array

我有两张桌子 create table a 1 array
适用于 Python 3.x 的 Hive 客户端

是否可以使用 Python 3 x 连接到 hadoop 并运行 hive 查询我正在使用Python 3 4 1 我发现可以按照这里写的方式完成 https cwiki apache org confluence display Hiv
Python 包安装：pip 与 yum，还是两者一起安装？

我刚刚开始管理 Hadoop 集群我们使用 Bright Cluster Manager 直至操作系统级别 CentOS 7 1 然后使用 Ambari 以及适用于 Hadoop 的 Hortonworks HDP 2 3 我不断收到安装
使用 Java API 在 Hadoop 中移动文件？

我想使用 Java API 在 HDFS 中移动文件我想不出办法做到这一点 FileSystem 类似乎只想允许在本地文件系统之间移动但我想将它们保留在 HDFS 中并将它们移动到那里我错过了一些基本的东西吗我能想到的唯一方法是从输
Impala：如何查询具有不同模式的多个镶木地板文件

在 Spark 2 1 中我经常使用类似的东西 df spark read parquet path to my files parquet 即使具有不同的模式也可以加载镶木地板文件的文件夹然后我使用 SparkSQL 对数据帧执行一些
如何对 RDD 进行分区

我有一个文本文件其中包含大量由空格分隔的随机浮动值我正在将此文件加载到 scala 中的 RDD 中这个RDD是如何分区的另外是否有任何方法可以生成自定义分区以便所有分区都具有相同数量的元素以及每个分区的索引 val dRDD
更改spark_temporary目录路径

是否可以更改 temporarySpark在写入之前保存临时文件的目录特别是由于我正在编写表的单个分区因此我希望临时文件夹位于分区文件夹内是否可以由于其实现原因无法使用默认的 FileOutputCommiter FileOut
伪模式下没有名称节点错误

我是hadoop新手正处于学习阶段根据 Hadoop Definitve 指南我已将 hadoop 设置为伪分布式模式一切正常昨天我什至能够执行第三章中的所有示例今天当我重新启动我的unix并尝试运行start dfs sh然
没有函数映射到名称“coord:formatTime”

我正在尝试使用 oozie 中的以下内容获取当前时间戳

随机推荐

nsga2多目标优化之核心知识点（快速非支配排序、拥挤距离、精英选择策略）详解（python实现）

文章目录一多目标优化算法简介 1 基本知识二 NSGA2算法 1 基本原理 2 快速非支配排序 2 1快速非支配排序 python实现 3 拥挤距离 3 1 拥挤距离python 实现 4 精英选择策略 4 1 精英选择策略pytho
安装系统时出现 Windows无法打开所需的文件 C:\Sources\install.wim 的解决办法

使用U盘安装Win10的时候出现 Windows无法打开所需的文件 C Sources install wim 错误代码 0x8007000D 这是由于启动盘里 install wim 文件不正确造成的新Win10 镜像文件一般都大于4
MySQL数据库应用（8）DML语句之insert知识

一往表中插入数据 1 命令语法 insert into lt 表名 gt lt 字段名1 gt lt 字段名n gt values 值1 值n 2 新建一个简单的测试表test create table test id int 4 not
linux 源码包mysql,linux 下 mysql源码包的安装--

linux 下 mysql源码包的安装 9页本资源提供全文预览点击全文预览即可全文预览如果喜欢文档就下载吧查找使用更方便哦 9 9 积分 linux 下 MySQL源码包的安装 gt gt linux 下 MySQL源码包的安装实
电路基础学习笔记2：LRC振荡电路

LRC振荡电路 1 概述 LRC 振荡电路是一种基本的振荡电路由电感L 电容C 电阻R组成可以产生稳定的交流电信号在LRC振荡电路中电感和电容通过共振的方式相互作用导致电荷周期性地从电容器到电感器和反向流动从而产生周期性的电流和
制作瀑布

使用的瀑布模型瀑布模型使用的材质 Demo WaterFall mat Demo WaterFall shadergraph 最终效果
python3（七）os模块

os模块 OS模块简单的来说它是一个Python的系统编程的操作模块可以处理文件和目录这些我们日常手动需要做的操作可以查看OS模块的帮助文档 import os 导入os模块 help os 查看os模块帮助文档里面详细的模块相关函数
if判断条件的优化写法

优化后可读性可维护性更好了 if分支越多体现越明显文章目录优化前简单判断优化简单判断优化前复杂判断优化复杂判断优化前简单判断 function getUserDescribe name if name 小刘 con
区块链运行机制简介

区块链简介区块链技术是构建比特币区块链网路与交易信息加密传输的基础技术其解决的核心问题是如何在缺少可信任中央节点和可信任通道的情况下分布在网络中的节点如何达成共识区块链被定义为一个分布式的账本即每个区块链的节点都拥有系统所有交易的
信令服务器接收到状态码,在蜂窝通信网络中请求连接的方法和设备专利_专利查询 - 天眼查...

1 一种包含转换器服务逻辑模块0 的网络部件045 所述转换器服务逻辑模块 255 被安排成在操作上分别经由第一通信链路075 与通信接入点 270 耦接经由第二通信链路与自动配置服务器ACS逻辑模块 MO 耦接以及经由第三通信链路与
Pandas 中的 read_excel() 读取 excel 数据详细参数用法

前言 read excel 参数说明 pandas 中读取 excel 数据的 pd read excel pandas read excel io sheet name 0 header 0 names None index col No
jQuery 事件 - mouseover() 方法
【UE4】Replay游戏回放 for UE4.26

前言 UE4 26的回放教程最近有用到 So梳理了整个构建流程希望能帮到你结尾有视频版教程时长较长 1 准备工作创建一个UE4C 项目添加第一人称和第三人称功能包关闭引擎找到项目目录 ContentDir Config De
【windows系统同时安装配置不同版本java环境】，以及双击jar包问题总结

1 下载jdk 官方网站 Java Downloads Oraclehttps www oracle com java technologies downloads我这边需要运行冰蝎是需要一个java8的环境以及原有的高版本的java环境
JS 函数

JS 函数关键字形式的函数
Mysql 中级篇-索引

123
C++ 基本的7种数据类型和4种类型转换（C++复习向p3）

文章目录基本内置类型存储范围 typedef 声明新名字 enum 枚举类型类型转换基本内置类型 bool char int float double void wchar t short int 存储范围可以这样 sizeof
全卷积网络（FCN）与图像分割

从图像分类到图像分割卷积神经网络 CNN 自2012年以来在图像分类和图像检测等方面取得了巨大的成就和广泛的应用 CNN的强大之处在于它的多层结构能自动学习特征并且可以学习到多个层次的特征较浅的卷积层感知域较小学习到一些局部区域的
CentOs7 修复引导启动

一修复MBR MBR Master Boot Record主引导记录硬盘的0柱面 0磁头 1扇区称为主引导扇区其中446Byte是bootloader 64Byte为Partition table 剩下的2Byte为magic num
配置hadoop各个节点之间免密码登录实践笔记

前言最近在搭建Hadoop环境需要设置无密码登陆所谓无密码登陆其实是指通过证书认证的方式登陆使用一种被称为公私钥认证的方式来进行ssh登录在linux系统中 ssh是远程登录的默认工具因为该工具的协议使用了RSA DSA的加密

配置hadoop各个节点之间免密码登录实践笔记

配置hadoop各个节点之间免密码登录实践笔记 的相关文章

随机推荐

热门标签

配置hadoop各个节点之间免密码登录实践笔记的相关文章