hadoop入门-wordcount

2023-05-16

hadoop是阿帕奇基金会的一个顶级项目,主要用于大量的廉价机器组成的集群去执行大规模运算,主要是海量数据的处理。

在hadoop官网(http://hadoop.apache.org/)hadoop包含了4个模块分别是:

1、Hadoop Common 

2、Hadoop Distributed File System (HDFS™) 

3、Hadoop YARN 

4、Hadoop MapReduce 

这四个模块分别对应了4个配置文件1.core-site.xml 2.hdfs-site.xml 3.yarn-size.xml 4.mapred-size.xml

我在这里只是做了最简单的配置

1、core-site.xml
			<property>		 
				<name>fs.default.name</name>
				<value>hdfs://hadoop-yarn.dragon.org:8020</value>
			</property>

			<property>
				<name>hadoop.tmp.dir</name>
				<value>/usr/local/hadoop/hadoop-2.2.0/data/tmp</value>
			</property>
			
2、hdfs-site.xml
			<property>		
				<name>dfs.replication</name>
				<value>1</value>
			</property>
		
3、yarn-site.xml
			<property>
				<name>yarn.nodemanager.aux-services</name>
				<value>mapreduce_shuffle</value>
			</property>
			
4、mapred-site.xml
			<property>	 	        		
				<name>mapreduce.framework.name</name>
				<value>yarn</value>
			</property>

我的hadoop是安装在linux(centOS-6.5)下面。

一、首先启动启动HDFS

1 启动NameNode
sbin/hadoop-daemon.sh start namenode
2 启动DataNode
sbin/hadoop-daemon.sh start datanode
3启动SecondaryNameNode
sbin/hadoop-daemon.sh start secondarynamenode

下面这张图表示已经启动成功三个HDFS节点



二、启动yarn

1/ 启动ResourceManger
sbin/yarn-daemon.sh start resourcemanager
2/启动NodeManager
sbin/yarn-daemon.sh start nodemanager



 三、启动刚完毕之后,我们来启动word count程序

1、首先使用在hadoop根目录下面创建一个文件,我这里创建wc.text

2、将文件放到testdata文件夹中


3、查看文件是否在文件中,里面的内容是


4、执行mapreduce命令


5、查看输出结果



至此,haddoop入门wordcount已经全部讲完,本人也是初学者,第一次写hadoop方面的博客,难免有疏漏之处,请大家批评指正。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

hadoop入门-wordcount 的相关文章

随机推荐

  • 51单片机三线串行驱动12864液晶

    以前写12864的液晶程序都是用的并行的方式 xff0c 这种方式焊接起来很麻烦 xff0c 而且占用的IO口比较多 今天尝试使用串行方式来驱动该模块 本程序是基于STC89C52的12864串行模式的程序 xff0c 硬件电路连接只需要5
  • 基于形状的模板匹配

    前段时间一直在做图像模板匹配 需要对旋转模板进行匹配 xff0c 并且对速度精度都有较高的要求 OpenCV里面并没有较好的解决方法 cvMatchTemplate const CvArr image constCvArr templ Cv
  • 相机模型详解

    相机模型 数码相机图像拍摄的过程实际上是一个光学成像的过程 相机的成像过程涉及到四个坐标系 xff1a 世界坐标系 相机坐标系 图像坐标系 像素坐标系 以及这四个坐标系的转换 理想透视模型 针孔成像模型 相机模型是光学成像模型的简化 xff
  • 相机镜头工作原理图解

    本文目录 xff08 一 xff09 机身 xff08 二 xff09 关于镜头一 如何平衡机身与镜头的预算二 镜头的作用三 镜头的组成部分四 关于焦距 什么是焦距 xff1f 为什么焦距很重要 xff1f 五 变焦与定焦镜头六 光圈及最大
  • 【Git】TortoiseGit代码冲突解决方法

    TortoiseGit冲突解决方法 场景一 xff1a 本地相同文件冲突场景二 xff1a 服务端相同文件冲突场景三 xff1a 服务端不同文件冲突场景四 xff1a 服务端文件名冲突小结 场景一 xff1a 本地相同文件冲突 冲突场景 x
  • RTOS系统问答

    RTOS 系统区别 RTOS Real Time Operating System 是专门为实时系统设计的操作系统 实时系统是指需要在规定的时间内响应某些事件或完成某些任务的系统 RTOS 和一般的操作系统相比 xff0c 具有更高的实时性
  • VTK与ITK的详细安装指南

    1 说明 本文来自一个付费下载文档 xff0c 好像是一本图书的第一章的部分内容 感觉比网上很多指南写的要详细 特整理出来和大家分享 xff0c 向原作者表示感谢 xff01 2 获取安装资源 xff08 1 xff09 CMake 安装资
  • ROS-gazebo 简介

    gazebo 一 什么是Gazebo xff1f Gazebo的典型用途Gazebo的一些主要特点二 系统要求三 安装 1 添加源2 安装Gazebo四 用户界面 1 场景2 左右面板3 工具栏4 菜单栏5 鼠标 一 什么是Gazebo x
  • Mac Pro安装Python3

    用brew install python3报错 xff1a curl 7 Failed to connect to raw githubusercontent com port 443 Operation 问题解决 xff1a https
  • 基于宽度优先爬虫

    coding utf 8 from selenium import webdriver import time from bs4 import BeautifulSoup import urllib2 from selenium webdr
  • LINUX amixer工具及kcontrol使用

    网上对amixer工具的使用较多 xff0c 但使用kcontrol coding的例子有限 xff0c 目前比较好的一篇文章如下 xff1a http blog chinaunix net uid 27875 id 5783294 htm
  • 小波部分特征说明和小波特征比较---未写完

    小波特征 1 xff1a 多分辨分析可以对信号进行有效的时频分分解 xff0c 但是由于其尺度函数是按二进制变化的 xff0c 因此在高频段器频率分辨率较差 xff0c 对信号的频段进行指数等间隔划分 小波包能够为信号提供一种更加精细的分析
  • 《国产嵌入式微系统msOS成型记》之终结篇——嵌入式微系统msOS的出发点:应用

    http www eefocus com embedded 329047 msOS设计的本意是为电子类设备及PLC设计的 xff0c 一开始想着仿造西门子的S7 300来设计一套基于CAN通讯的分布式PLC xff0c 然而当设计了几个硬件
  • Debian10(英文环境)安装中文输入法fcitx

    执行 locale 以及 cat etc locale gen 查看当前数据 sudo dpkg reconfigure locales 本身默认已经选择了 en US UTF 8 UTF 8 增加几个zh CN选项 然后ok 然后这里继续
  • 小批量数据测试模型容易出现Bug

    如果是直接用的原来数据集类的数据 xff0c 截取出来后 xff0c 数据范围为 0 255 xff0c 需要手动实现transform的功能
  • Windbg介绍

    文章目录 1 介绍1 1 相关网站1 2 下载1 3 符号配置 2 常用命令2 1 常用的标准命令2 2 常用的 96 96 命令有2 3 常用的 96 96 命令有 3 调试环境搭建3 1 实时调试进程3 2 调试进程dump3 3 调试
  • 笔记本电脑 (天梯图) 处理器 和 显卡

    游戏本一般是i5 9300H起步 xff0c 低于这个标准的游戏本不建议购买 另外需要注意的是不要被10代CPU唬住了 xff0c 拿最近卖的比较火的i5 10210U来说 xff0c 其性能还不如8代的i5 8300H 我们以移动版GTX
  • ActiveX开发详解

    配套源码 http download csdn net detail mingojiang 4743623 转载请注明出自 http blog csdn net MingoJiang 一 ActiveX基础 1 1什么是ActiveX Ac
  • GNVM - Node.js 多版本管理器

    GNVM Node js 多版本管理器 GNVM 是一个简单的 Windows 下 Node js 多版本管理器 xff0c 类似的 nvm nvmw nodist c gt gnvm install latest 1 0 0 x86 1
  • hadoop入门-wordcount

    hadoop是阿帕奇基金会的一个顶级项目 xff0c 主要用于大量的廉价机器组成的集群去执行大规模运算 xff0c 主要是海量数据的处理 在hadoop官网 xff08 http hadoop apache org xff09 hadoop