【头歌】Hadoop开发环境搭建

2023-10-26

本来不想写这个了，就为了搞这实验截图，又得敲一遍这个代码。代码量真的大，我真的是吐了呀。MD。
大家反正写过，直接粘贴是最佳选择，没必要自己再做一遍

第1关：配置开发环境 - JavaJDK的配置

任务描述
本关任务：配置 JavaJDK 。

相关知识
配置开发环境是我们学习一门 IT 技术的第一步， Hadoop 是基于 Java 开发的，所以我们学习 Hadoop 之前需要在 Linux 系统中配置 Java 的开发环境。

编程要求
根据上述步骤，配置好 Hadoop 开发环境，点击评测即可。

提示：如果出现文件解压大小限制的情况，可以使用 ulimit -f 1000000 命令来解除限制。

开始你的任务吧，祝你成功！

mkdir /app
cd /opt
ll
tar -zxvf jdk-8u171-linux-x64.tar.gz
mv jdk1.8.0_171/ /app
vim /etc/profile

# 按i进入编辑模式后将下列代码粘贴进去
#----------------------------------------------------------
JAVA_HOME=/app/jdk1.8.0_171
CLASSPATH=.:$JAVA_HOME/lib/tools.jar
PATH=$JAVA_HOME/bin:$PATH

export JAVA_HOME CLASSPATH PATH
#----------------------------------------------------------
# 按Esc后输入 :wq 退出

source /etc/profile
java -version

第2关：配置开发环境 - Hadoop安装与伪分布式集群搭建

任务描述
本关任务：安装配置 Hadoop 开发环境。

这关真的巨麻烦，要再第一关的基础上配置，要过就两关一起，不然浪费时间

编程要求
根据上述步骤，配置好Hadoop开发环境，点击评测即可。

提示：如果出现文件解压大小限制的情况，可以使用 ulimit -f 1000000 命令来解除限制。

开始你的任务吧，祝你成功！

cd /opt
ll
tar -zxvf hadoop-3.1.0.tar.gz -C /app
cd /app
ll
mv hadoop-3.1.0 hadoop3.1
ll
ssh-keygen -t rsa -P ''
#上面这行代码输入后再次输入 回车 即可，不需要额外输入
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 600 ~/.ssh/authorized_keys

接下来会涉及很多修改文件操作

ctrl+shift+v 可以粘贴
最好了解一下linux的修改文件操作，有三种模式

vim /etc/ssh/sshd_config
# 替换 按i 进入编辑模式后
#----------------------------------------------------------
# 找到
RSAAuthentication yes # 启用 RSA 认证
PubkeyAuthentication yes # 启用公钥私钥配对认证方式
#AuthorizedKeysFile %h/.ssh/authorized_keys # 公钥文件路径
# 改为
RSAAuthentication yes # 启用 RSA 认证
PubkeyAuthentication yes # 启用公钥私钥配对认证方式
AuthorizedKeysFile %h/.ssh/authorized_keys # 公钥文件路径
#----------------------------------------------------------
# 按Esc后输入 :wq 退出

cd /app/hadoop3.1/etc/hadoop/

vim hadoop-env.sh
# 追加 按i 进入编辑模式后，将如下代码粘贴进去，快捷键 ctrl - shift -v【后续不在提醒】
#----------------------------------------------------------
# The java implementation to use.  
#export JAVA_HOME=${JAVA_HOME}  
export JAVA_HOME=/app/jdk1.8.0_171
#----------------------------------------------------------
# 按Esc后输入 :wq 退出【后续不在提醒】


vim yarn-env.sh
# 追加
#----------------------------------------------------------
export JAVA_HOME=/app/jdk1.8.0_171
#----------------------------------------------------------

vim core-site.xml
# 替换
#----------------------------------------------------------
<configuration>  
 <property>  
    <name>fs.default.name</name>  
    <value>hdfs://localhost:9000</value>  
    <description>HDFS的URI，文件系统://namenode标识:端口号</description>  
</property>  
  
<property>  
    <name>hadoop.tmp.dir</name>  
    <value>/usr/hadoop/tmp</value>  
    <description>namenode上本地的hadoop临时文件夹</description>  
</property>  
</configuration>  
#----------------------------------------------------------

vim hdfs-site.xml
# 替换
#----------------------------------------------------------
<configuration>  
<property>  
    <name>dfs.name.dir</name>  
    <value>/usr/hadoop/hdfs/name</value>  
    <description>namenode上存储hdfs名字空间元数据 </description>   
</property>  
  
<property>  
    <name>dfs.data.dir</name>  
    <value>/usr/hadoop/hdfs/data</value>  
    <description>datanode上数据块的物理存储位置</description>  
</property>  
  
<property>  
    <name>dfs.replication</name>  
    <value>1</value>  
</property>  
</configuration>  
#----------------------------------------------------------

vim mapred-site.xml
# 替换
#----------------------------------------------------------
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>
#----------------------------------------------------------

vim yarn-site.xml
# 替换
#----------------------------------------------------------
<configuration>  
<property>  
        <name>yarn.nodemanager.aux-services</name>  
        <value>mapreduce_shuffle</value>  
</property>  
<property>  
        <name>yarn.resourcemanager.webapp.address</name>  
        <value>192.168.2.10:8099</value>  
        <description>这个地址是mr管理界面的</description>  
</property>  
</configuration>  
#----------------------------------------------------------

mkdir -p /usr/hadoop/tmp 
mkdir /usr/hadoop/hdfs 
mkdir /usr/hadoop/hdfs/data 
mkdir /usr/hadoop/hdfs/name

vim /etc/profile
# 追加
#----------------------------------------------------------
#set Hadoop Enviroment
export HADOOP_HOME=/app/hadoop3.1
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
#----------------------------------------------------------

source /etc/profile
hadoop namenode -format
start-yarn.sh
cd /app/hadoop3.1/sbin

vim start-dfs.sh
# 追加到第一行
#----------------------------------------------------------
#!/usr/bin/env bash
HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
#----------------------------------------------------------

vim stop-dfs.sh
# 追加到第一行
#----------------------------------------------------------
#!/usr/bin/env bash
HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
#----------------------------------------------------------

vim stop-yarn.sh
# 追加到第一行
#----------------------------------------------------------
#!/usr/bin/env bash
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root
#----------------------------------------------------------

vim start-yarn.sh
# 追加到第一行
#----------------------------------------------------------
#!/usr/bin/env bash
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root
#----------------------------------------------------------

start-dfs.sh
jps

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

头歌

Hadoop

大数据

分布式

【头歌】Hadoop开发环境搭建的相关文章

Hive：如何分解嵌入 CSV 文件中的 JSON 列？

从 CSV 文件带有标题和管道分隔符中我得到了以下两个内容其中包含一个 JSON 列内部有一个集合如下所示第一种情况使用没有名称的 JSON 集合 ProductId IngestTime ProductOrders 918
在 Windows 7 64 位中删除 Spark 临时目录时出现异常

我正在尝试在 Windows 7 64 位中运行 Spark 作业的单元测试我有 HADOOP HOME D winutils winutils path D winutils bin winutils exe 我运行了以下命令 winu
如何跟踪hadoop中哪个数据块在哪个数据节点？

如果复制一个数据块会复制到哪个数据节点是否有任何工具可以显示复制块存在的位置如果您知道文件名则可以通过 DFS 浏览器查找转到您的 namenode Web 界面说浏览文件系统并导航到您感兴趣的文件在页面底部将列出文件中
Hadoop 推测任务执行

在Google的MapReduce论文中他们有一个备份任务我认为这与Hadoop中的推测任务是一样的推测任务是如何实现的当我启动一项推测任务时该任务是从一开始就作为较旧且缓慢的任务开始还是从较旧的任务到达的位置开始如果是这样
Apache hadoop 版本 2.0 与 0.23

Hadoop 的版本和发行版太多让我很困惑我有几个问题 Apache Hadoop 1 x 是从 0 20 205 开始的 Apache Hadoop 2 0 是从 0 22 还是 0 23 开始根据这个blogpost http b
java.lang.ClassNotFoundException：找不到类 org.apache.hadoop.fs.azurebfs.SecureAzureBlobFileSystem

我是 Spark 和 Kubernetes 世界的新手我使用 docker image tool sh 实用程序使用与 Hadoop 3 2 捆绑在一起的官方 Spark 3 0 1 构建了 Spark docker 映像我还为 Jup
如何找到 JAR：/home/hadoop/contrib/streaming/hadoop-streaming.jar

我正在练习有关 Amazon EMR 的复数视角视频教程我被困住了因为我收到此错误而无法继续 Not a valid JAR home hadoop contrib streaming hadoop streaming jar 请注意
Hadoop 上的 Sqoop：NoSuchMethodError：com.google.common.base.Stopwatch.createStarted() [重复]

这个问题在这里已经有答案了我在 Google Cloud DataProc 上的 hadoop 上运行 sqoop 以通过 Cloud SQL 代理访问 postgresql 但遇到 Java 依赖项错误 INFO First Cloud
将 Spark 添加到 Oozie 共享库

默认情况下 Oozie 共享 lib 目录提供 Hive Pig 和 Map Reduce 的库如果我想在 Oozie 上运行 Spark 作业最好将 Spark lib jar 添加到 Oozie 的共享库而不是将它们复制到应用程序
当我将文件存储在 HDFS 中时，它们会被复制吗？

我是 Hadoop 新手当我使用以下方式存储 Excel 文件时hadoop fs putcommoad 它存储在HDFS中复制因子为3 我的问题是是否需要3份并分别存储到3个节点中这是 HDFS 工作的漫画 https docs
更改 Hadoop 中的数据节点数量

如何改变数据节点的数量即禁用和启用某些数据节点来测试可扩展性说得更清楚一点我有4个数据节点我想一一实验1 2 3 4个数据节点的性能是否可以只更新名称节点中的从属文件临时停用节点的正确方法创建一个排除文件这列出了您想要删除
Python 包安装：pip 与 yum，还是两者一起安装？

我刚刚开始管理 Hadoop 集群我们使用 Bright Cluster Manager 直至操作系统级别 CentOS 7 1 然后使用 Ambari 以及适用于 Hadoop 的 Hortonworks HDP 2 3 我不断收到安装
使用 org.apache.hadoop/* 依赖项离线编译 sbt 时遇到的问题

使用依赖于 org apache hadoop 包的 sbt 进行离线编译时遇到很多麻烦一个简单的build sbt name Test version 1 0 scalaVersion 2 10 4 libraryDependencie
与文件名中的冒号“：”作斗争

我有以下代码用于加载大量 csv gz 并将它们转储到其他文件夹中并将源文件名作为一列 object DailyMerger extends App def allFiles path File List File val parts
以不同用户身份运行 MapReduce 作业

我有一个与 Hadoop 交互的 Web 应用程序 Cloudera cdh3u6 特定的用户操作应在集群中启动新的 MapReduce 作业该集群不是一个安全集群但它使用简单的组身份验证因此如果我以自己的身份通过 ssh 连接到它
伪模式下没有名称节点错误

我是hadoop新手正处于学习阶段根据 Hadoop Definitve 指南我已将 hadoop 设置为伪分布式模式一切正常昨天我什至能够执行第三章中的所有示例今天当我重新启动我的unix并尝试运行start dfs sh然
Hadoop 超立方体

嘿我正在启动一个基于 hadoop 的超立方体具有灵活的维度数有人知道这方面现有的方法吗我刚刚发现PigOLAP草图 http wiki apache org pig PigOLAPSketch 但没有代码可以使用它另一种方法是Z
Hadoop 作业：任务在 601 秒内无法报告状态

在伪节点上运行 hadoop 作业时任务失败并被杀死错误任务尝试在 601 秒内无法报告状态但同一个程序正在通过 Eclipse 运行本地作业任务大约有 25K 个关键字输出将是所有可能的组合一次两个即大约 25K 2
如何使用 log4j 自定义附加程序在 HDFS 上创建日志？

Overview 我们希望使用 log4j 记录 Spark 作业活动并将日志文件写入 HDFS Java 8 Spark 2 4 6 Scala 2 1 2 Hadoop 3 2 1 我们无法找到本地 apache log4j 附加程序
Spark中如何获取map任务的ID？

Spark中有没有办法获取map任务的ID 例如如果每个映射任务都调用用户定义的函数我可以从该用户定义的函数中获取该映射任务的 ID 吗我不确定您所说的地图任务 ID 是什么意思但您可以使用以下方式访问任务信息TaskContext

随机推荐

python后端学习（四）进程、消息队列、进程池

进程以及状态 1 进程程序例如xxx py这是程序是一个静态的进程一个程序运行起来后代码用到的资源称之为进程它是操作系统分配资源的基本单元不仅可以通过线程完成多任务进程也是可以的 2 进程的状态工作中任务数往往大于
【转载】KaTeX 数学公式大全

文章目录转载自前言受支持的功能声调记号定界符括号之类定界符大小 5
HTML——锚链接

不同页面锚链接 a href a p a href 锚链接 html shuiguo 水果 a p p a href 锚链接 html shucai 蔬菜 a p p a href 锚链接 html yundong 运动 a p 展示效果
[计算机毕业设计]食品安全数据的关联分析模型的应用

前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生级别难度的对本科同学来说是充满挑战为帮助大
angular6学习(七)：样式设置和调用

样式调用是在app component ts中调用app component css设置外置调用也可内置调用一外置调用在html文件中添加h3标签在css文件中设置h3样式显示如下一内置调用在 ts文件中设置h3样式显
远程计算机已加入AAD凭据不工作

解决方法计算机需要加入AAD Azure Active Directory 设置账户其他用户连接工作或学校用户连接在下方的替代操作中选择将此设备加入 Azure Active Directory 输入用户名和密码点击加入
学习日记——STM32CubeMX软件应用（2020.1.31）

STM32CubeMX的定义 STM32CubeMX是ST公司主动原创的一款代码生成工具它可以减轻开发时间和费用相当于一种偷懒的做法 STM32CubeMX集成了一个全面的软件平台支持STM32每一个系列的MCU开发 STM32Cub
【idea】IDEA常用断点详解

一断点条件过滤场景过滤条件i lt 10 1 标注断点点击需要调试的代码行 2 鼠标悬浮在断点上右击在condition中输入条件如 i 10 点击done按钮 3 确认条件是否生效鼠标悬浮断点显示所填写的条件 4 点击右
搭建个人网站vm+center os+apache

如何搭建个人网站准备的前提 vm cnetos 7 apche 在vm上安装center os的教程就不介绍了这个有很多 1 如何配置一台刚装好了center os 7并且能够使他联网 ping 通百度 ip a查看当前ip地址如果显示
微信小程序：环形进度条模块

利用canvas实现微信小程序环形进度条模块模块下载链接下载链接最近开发一款背单词的微信小程序计划使用环形进度条展示每日背单词进度效果图如下可渐变颜色开发步骤 1 在根目录创建名为components的文件夹用来放需要引用的
java链式编程/级联式编程

链式编程也叫级联式编程调用对象的函数时返回一个this对象指向对象本身达到链式效果可以级联调用链式编程通过高阶函数以点为连接将多个函数连接在一起完成参数传递和复杂的操作通俗的说是通过点号链接在一起成为一句代码链式编程的优点
sqli-labs-less-1完整解析，小白干货

Less 1 Sql知识点 Limit x y 从x 1行开始输出共输出y行 Order by 排序 asc升序默认 desc 降序 Union MySQL执行两条SELECT语句并把输出组合成单个查询结果集 Group concat
Java后端返回前端的日期差9小时？

当后端返回Date类型到前端的时候需要在实体中增加 JsonFormat注释这个可以帮我们处理格式化很多人都是用下面这种写法 JsonFormat locale zh timezone GMT 8 pattern yyyy MM dd
win10蓝牙已配对连接不上_Win10系统蓝牙配对手机连接不成功的解决方法

Win10系统蓝牙配对手机连接不成功的解决方法很多的Win10用户都在使用蓝牙连接手机一些网友在连接时出现win10系统蓝牙已配对但连接不成功出现在这样的问题怎么解决呢下面我们来看看Win10镜像官网给大家带来的解决方法 Win10
封装,继承和多态详解

封装继承和多态是 C 中三个重要的面向对象编程技术本文将详细介绍这些技术的概念原理和用法以帮助读者更好地理解并应用它们一封装封装是一种面向对象编程的基本概念它指的是将数据和方法封装在一个对象内部防止外部通过对象的公共接口直
一文看懂IC芯片生产流程：从设计到制造与封装

origin http forum esm cn com FORUM POST 1000163993 1201257744 0 HTM ga 1 101949507 338942905 1436813394 芯片制造的过程就如同用乐高盖房子
深度学习和因果如何结合？北交最新《深度因果模型》综述论文，31页pdf涵盖216篇文献详述41个深度因果模型...

来源专知北京交通大学最新深度因果模型综述论文 31页pdf涵盖216页pdf详述41个深度因果模型值得关注因果关系概念在人类认知中起着重要作用在过去的几十年里因果推理在计算机科学医学经济学和教育等许多领域都得到了很好的发
关于504报错的解决方法之一

项目场景记录一些工作遇见的bug 项目场景使用命令 npm start 运行代码打开网页报504 打开失败问题描述提示这里描述项目中遇到的问题使用命令 npm start 运行代码打开网页报504 打开失败原因分析 504
运行java程序报java/lang/NoClassDefFoundError: java/lang/Object

今天直接将解压后的jre文件放到linux上执行java命令报如下错误 Error occurred during initialization of VM java lang NoClassDefFoundError java lan
【头歌】Hadoop开发环境搭建

本来不想写这个了就为了搞这实验截图又得敲一遍这个代码代码量真的大我真的是吐了呀 MD 大家反正写过直接粘贴是最佳选择没必要自己再做一遍第1关配置开发环境 JavaJDK的配置任务描述本关任务配置 JavaJDK 相关知

【头歌】Hadoop开发环境搭建

第1关：配置开发环境 - JavaJDK的配置

第2关：配置开发环境 - Hadoop安装与伪分布式集群搭建

【头歌】Hadoop开发环境搭建 的相关文章

随机推荐

热门标签

【头歌】Hadoop开发环境搭建的相关文章