大数据-HDFS的定义、使用场景、优缺点、组成架构

2023-05-16

HDFS定义

HDFS(Hadoop Destributed File System)是一个分布式的文件系统，用于存储文件，通过目录树来定位文件

HDFS使用场景

适合一次写入，多次读取的场景，不支持文件的修改

HDFS优缺点

优点

高容错性
数据自动保存多个副本。它通过增加副本的形式提高容错性
某一个副本丢失后，它可以自动恢复
适合处理大数据
数据规模：能够处理数据规模达到GB、TB、甚至PB级别的数据
文件规模：能够处理百万规模以上的文件数量
可构建在廉价机器上，通过多副本机制，提高可靠性

缺点

不适合低延时数据访问，比如毫秒级的存储数据是做不到的
无法高效的对大量小文件进行存储
原因：
存储大量小文件会占用NameNode大量的内存来存储文件目录和块信息
小文件存储的寻址时间会超过读取时间
不支持并发写入，文件随机修改，仅支持数据追加append

HDFS组成架构

NameNode（nn）：Master，是一个主管、管理者

管理HDFS的名称空间
配置副本策略
管理数据块（Block）映射信息
处理客户端读写请求

DataNode：Slave，NameNode下达命令，DataNode执行实际的操作

存储实际的数据块
执行数据块的读写操作

Client：客户端

文件切分，文件上传HDFS的时候，Client将文件切分成一个一个的Block，然后上传
与NameNode交互，获取文件的位置信息
与DataNode交互，读取或写入数据
Client提供一些命令来管理HDFS，比如NameNode格式化
Client可以通过一些命令来访问HDFS，比如对HDFS增删改查操作

Secondary NameNode：并非NameNode的热备，当NameNode挂掉时，它并不能马上替换NameNode并提供服务

辅助NameNode，分担其工作量，比如定期合并Fsimage和Edits，并推送给NameNode
在紧急情况下，可辅助恢复NameNode

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

大数据-HDFS的定义、使用场景、优缺点、组成架构的相关文章

打包pyinstaller生成的python桌面应用为windows安装包的方法教程

本篇文章主要讲解使用nsis制作windows安装包的方法日期 xff1a 2022年12月7日作者 xff1a 任聪聪一准备材料 1 nsis软件 nsis是一款生成windows安装包的一款压缩工具下载地址 xff1a htt
linux常用命令

常用命令编号操作命令1复制文件 1cp r home web service test canlian chengxu dbfile app properties 2 home web service test canlian cheng
002-HTML入门

1 什么是HTML HTML 是用来描述网页的一种语言 HTML 指的是超文本标记语言 Hyper Text Markup Language HTML 不是一种编程语言 xff0c 而是一种标记语言 markup language 标记语言
Debian linux--从安装到升级（非编译）

debian 完美桌面应用 Debian linux 从安装到升级在windows底下 xff0c 我们尝尽了欢乐与痛苦 xff1a 办公笔记本预装了windows xff0c 为什么不预装office xff1f 游戏最爱当然是3D
linuxshell如何实现进度条效果

代码如下 xff1a b 61 39 39 for i 61 0 i lt 61 100 i 43 61 2 do printf 34 PleaseWait 50s d r 34 b i sleep 3 b 61 34 gt 34 b do
XDMCP服务器

导读 xff1a 几个人同时有x windows时 X server xff1a 主要是负责显示 x client xff1a 主要是负表运算设定XDMCP XDM是X Display Manager的简称功能就是管理操控xserver
Laravel中间件向Controller传递值

Laravel中间件向Controller传递值方法一 span class token keyword class span MidParams span class token comment 中间件 span span class
3. Proxmox VE 配置 NTP

3 Proxmox VE配置 NTP 手动 span class token comment apt y install ntp span span class token comment vi etc ntp conf span span
4. 在 Proxmox VE 安装Ceph

4 在 Proxmox VE 安装 Ceph 1 安装按图操作即可 2 参考 1 https blog csdn net ggeol article details 109112815
5. 在 Proxmox VE 配置Ceph

Pool 用于存储虚拟机的img xff0c 如果需要实现虚拟机的HA xff0c 那么虚拟机必须创建在Ceph上 xff0c 通过Ceph的多副本来实现故障恢复 CephFS 在PVE中主要用于共享文件 xff0c 如iso文件等创建O
6. Proxmox VE安装Ceph Dashboard

6 Proxmox VE安装Ceph Dashboard span class token function apt get span span class token function install span ceph mgr dash
7.安装Proxmox Backup Server

安装Proxmox Backup Server 1 安装安装和Proxmox VE基本是一样的 xff0c 看图一直下一步即可安装完成会自动重启 xff0c 重启后如下图 2 参考 1 https pbs proxmox com wik
8. 添加Backup Server到PVE集群

添加Backup Server到PVE集群 1 配置磁盘 2 配置账户 3 PVE中添加 Backup Server
在Harvester上安装windows sever 2012 r2

安装Windows Server 2012 r2 文章目录安装Windows Server 2012 r2新建虚拟机配置基础信息配置卷配置网络开机 xff0c 进入安装系统步骤安装磁盘驱动安装网络驱动安装其他驱动测试网络 Harveste
SDU 程序设计思维实践第四周 csp模拟

文章目录题目A 咕咕东的奇遇题意InputOutput 思路总结代码题目B 咕咕东想吃饭题意InputOutput 思路总结代码题目C 可怕的宇宙射线题意InputOutput 思路总结代码题目A 咕咕东的奇遇题意咕咕东是个贪玩
使用MySQL8.0 by docker

MySQL8 0 by Docker 拉取镜像 span class token function docker span pull mysql 8 0 为了获取到对应的配置文件而 docker run span class token f
国内安装oh-my-zsh

zsh有华丽的外表 xff0c 使用便捷的特点 xff0c 但在国内网络环境中 xff0c 安装会存在困难 xff0c 使用zsh官网提供的脚本安装 xff0c 基本会安装失败 xff0c 会显示报访问错误 xff0c 在此提供使用Git安
使用kubeKey快速搭建Kubernetes集群

使用kubeKey快速搭建Kubernetes集群文章目录使用kubeKey快速搭建Kubernetes集群一安装 kk二初始化本地主机 xff08 官方没写 xff09 三安装集群3 1 All in One 测试集群无配置文件
使用docker运行mysql-client

使用docker运行mysql client 由于服务器环境的限制的 xff0c 能少污染主机环境就尽量不污染 xff0c 在集群环境 xff0c 使用docker运行mysql cli 访问通过NodePort暴露的数据库就是一个不错的方
CentOS 快速安装Docker

CentOS 快速安装Docker 下载及安装 yum span class token function install span span class token function wget span y span class toke

随机推荐

使用Docker快速搭建MSSQL实验环境 (持久化)

使用Docker快速搭建MSSQL实验环境 xff08 持久化 xff09 前置章节 CentOS 快速安装Docker 使用Docker快速搭建MSSQL实验环境拉取镜像 span class token function docker
使用Docker快速搭建Oracle实验环境（持久化）

容器镜像系统用户root密码为 helowin su root helowin 运行及配置仅限测试环境 1 拉取镜像 span class token function docker span pull registry cn hangz
SHELL内涵段子

1 字符掩码 xff0c 过滤掉不需要的 Database span class token assign left variable DATABASE MASK span span class token operator 61 span
Shell中读取文本文件

读取文本文件基础范式 span class token function cat span filename span class token operator span span class token keyword while sp
MySQL有点用的Shell片段

获取Table Schema mysql span class token parameter variable uroot span p span class token variable passwd span span class t
switch语句作用在byte上却不能作用在String和long上

在switch xff08 exprl xff09 语句中 xff0c exprl必须是一个整数表达式或者枚举常量而byte short char都可以隐式转换为int类型 xff0c 整数表达式可以是int或者包装类Integer xf
MySQL批量测试账号密码

账号密码文件 user txt root pass 64 1234 root pass 64 1234 root pass 64 1234 root pass 64 1234 run sh span class token shebang
MySQL连接过慢优化

在配置文件my cnf中加上skip name resolve span class token punctuation span mysqld span class token punctuation span span class to
stm32的GPIO口PA0按键没按下就是低电平的分析

芯片 xff1a stm32f407ZET6X 功能 xff1a 实现两按键分别控制四个灯和一个蜂鸣器思路 xff1a 将寄存器设置封装成函数 xff0c 体会固件库的实现原理踩坑记录 xff1a 下载程序后发现与PA0连接的按键 xf
正点原子f103新建工程模板——基于固件库

编译器版本要选对 xff0c 1 xff0c 原来的MDK版本5 15 xff0c 使用的V5编译器 xff1b 新的MDK5 26使用的是V6编译器 xff1b 2 xff0c 在5 26版本下 xff0c ARM Compiler选择V
stm32f103-gpio源码理解

提要 xff1a 参照野火的stm32f103开发指南 xff0c 对标准库的构造进行理解 xff1a xff08 1 xff09 使用结构体 xff0c 使用宏 xff0c 使用枚举 xff08 2 xff09 因为参数是可变的 xff0
c语言变量的存储方式和生存期 -考察

全局变量和局部变量 1 局部变量 xff08 讨论在一个C源文件中 xff09 1 xff09 who is 局部变量 xff1a a 函数内定义的变量 b 函数内的复合语句内定义的变量 c 函数的形参类比 xff1a a 酒店的住客房间
数字特征值-对数字求特征值是常用的编码算法，奇偶特征是一种简单的特征值

对数字求特征值是常用的编码算法 xff0c 奇偶特征是一种简单的特征值对于一个整数 xff0c 从个位开始对每一位数字编号 xff0c 个位是1号 xff0c 十位是2号 xff0c 以此类推这个整数在第n位上的数字记作x xff0c
我们认为2是第一个素数，3是第二个素数，5是第三个素数，依次类推。现在，给定两个整数n和m，0＜n＜=m＜=200，你的程序要计算第n个素数到第m个素数之间所有的素数的和，包括第n个素数和第m个素数

我们认为2是第一个素数 xff0c 3是第二个素数 xff0c 5是第三个素数 xff0c 依次类推现在 xff0c 给定两个整数n和m xff0c 0 lt n lt 61 m lt 61 200 xff0c 你的程序要计算第n个素数到
win10 操作系统JDK 11安装配置环境变量

JDK 11的安装说明Installation of the JDK on Microsoft Windows Platforms 1 系统变量新建 JAVA HOME 变量变量值填写jdk的安装目录 xff08 2 xff09 系统变
Linux学习--Shell脚本的创建

Shell脚本的创建 1 什么是shell shell 它是命令行解析器 xff0c 分为以下几类 xff1a 1 sh xff1a 全称 Bourne Shell 是UNIX最初使用的 shell xff0c 而且在每种 UNIX 上都可
Linux磁盘扩容三种方式

Linux在使用过程中由于数据量不断增大 xff0c 导致磁盘空间不足 xff0c 需要增加磁盘空间 xff0c 主要有以下三种方式 1 直接给分区 xff08 或者某一分区 xff09 扩容 xff0c 直接在原有磁盘上增大空间 2 给
Ubuntu系统电脑屏幕合盖后在打开，进入不了系统（黑屏幕）

一编辑下列文件 xff1a sudo vim etc systemd logind conf 打开文件输入 xff1a i 然后才能修改 xff1b 修改完成后 xff0c 按 Esc 键然后输入 34 xff1a wq 34 Ente
【森气杂谈】群晖NAS内外网磁盘映射以及quick connect设置

森气杂谈群晖NAS内外网磁盘映射以及quick connect设置 NAS内网磁盘映射具体操作步骤 NAS外网磁盘映射具体操作步骤 quick connect NAS内网磁盘映射在频繁使用NAS时 xff0c 网页版体验确实不是很好 x
大数据-HDFS的定义、使用场景、优缺点、组成架构

HDFS定义 HDFS Hadoop Destributed File System 是一个分布式的文件系统 xff0c 用于存储文件 xff0c 通过目录树来定位文件 HDFS使用场景适合一次写入 xff0c 多次读取的场景 xff0c

大数据-HDFS的定义、使用场景、优缺点、组成架构

HDFS定义

HDFS使用场景

HDFS优缺点

HDFS组成架构

大数据-HDFS的定义、使用场景、优缺点、组成架构 的相关文章

随机推荐

热门标签

大数据-HDFS的定义、使用场景、优缺点、组成架构的相关文章