Hadoop3.x集成HBase

2023-11-05

HBase作为Hadoop家族中实现高并发的利器，我们来看看怎么进行集成。

1. 下载并上传到服务器

目前使用2.3.5版本

wget https://mirrors.bfsu.edu.cn/apache/hbase/2.3.5/hbase-2.3.5-bin.tar.gz

#wget https://mirrors.bfsu.edu.cn/apache/hbase/2.4.4/hbase-2.4.4-bin.tar.gz

2. 解压

tar zxvf hbase-2.3.5-bin.tar.gz -C /app/

ln -s /app/hbase-2.3.5 /app/hbase

3. 修改配置文件

3.1 修改hbase-env.sh

export JAVA_HOME=/app/jdk1.8.0_281
#表示不引用hbase自带的zookeeper，用我们自己安装的
export HBASE_MANAGES_ZK=false

3.2 修改hbase-site.xml

<!-- 参考文档: https://www.cnblogs.com/nexiyi/p/hbase_config_94.html -->
<!-- 指定 hbase 是分布式的 --> 
<property>
    <name>hbase.cluster.distributed</name>
    <value>true</value>
</property>
<!-- hbase 在 zookeeper 中的缓冲的节点目录  -->
<property>
    <name>zookeeper.znode.parent</name>
    <value>/hbase</value>
</property>
<property>
    <!-- 指定 hbase 在 HDFS 上存储的路径 mycluster为hdfs的nameservice名称--> 
    <name>hbase.rootdir</name> 
    <value>hdfs://mycluster/hbase</value>
</property>
<property>
    <!-- 指定 zk 的地址,多个用","分割 --> 
    <name>hbase.zookeeper.quorum</name> 
    <value>hadoop101:2181,hadoop102:2181,hadoop103:2181</value>
</property>

3.3 修改regionservers

hadoop101
hadoop102
hadoop103

3.4 添加文件backup-masters

echo "hadoop103" > /app/hbase/conf/backup-masters

3.5 链接hdfs配置

ln -s $HADOOP_HOME/etc/hadoop/core-site.xml /app/hbase/conf/core-site.xml
ln -s $HADOOP_HOME/etc/hadoop/hdfs-site.xml /app/hbase/conf/hdfs-site.xml

3.6 添加环境变量

sudo vi /etc/profile.d/env.sh
# 添加以下内容
export HBASE_HOME=/app/hbase
export PATH=$HBASE_HOME/bin:$PATH

# 刷新环境变量
source /etc/profile

3.7 分发文件

sudo /home/hadoop/bin/xsync /etc/profile.d/env.sh
xsync /app/hbase

4. 启动集群

首先确保zookeeper和hdfs启动正常

/app/hbase/bin/start-hbase.sh

/app/hbase/bin/stop-hbase.sh

验证是否启动成功，访问地址：http://hadoop101:16010/master-status

欢迎关注微信公众号，回复hadoop，获取从零开始Hadoop系列完整文档：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

大数据

系统运维

数据分析

Hbase

Hadoop

Hadoop3.x集成HBase 的相关文章

更改 Spark Streaming 中的输出文件名

我正在运行一个 Spark 作业就逻辑而言它的性能非常好但是当我使用 saveAsTextFile 将文件保存在 s3 存储桶中时输出文件的名称格式为 part 00000 part 00001 等有没有办法更改输出文件名谢谢
Pig 10.0 - 将元组分组并在 foreach 中合并包

我在用着Pig 10 0 我想在 foreach 中合并包假设我有以下内容visitors alias a b 1 2 3 4 a d 1 3 6 a e 7 z b 1 2 3 我想对第一个字段上的元组进行分组并将包与一组语义合并以获
Hadoop 推测任务执行

在Google的MapReduce论文中他们有一个备份任务我认为这与Hadoop中的推测任务是一样的推测任务是如何实现的当我启动一项推测任务时该任务是从一开始就作为较旧且缓慢的任务开始还是从较旧的任务到达的位置开始如果是这样
无法在 Hadoop Map-Reduce 作业中加载 OpenNLP 句子模型

我正在尝试将 OpenNLP 集成到 Hadoop 上的 Map Reduce 作业中从一些基本的句子分割开始在地图函数中运行以下代码 public AnalysisFile analyze String content InputS
hive 添加分区语句忽略前导零

我在 hdfs 上有文件夹 user test year 2016 month 04 dt 25 000000 0 需要将上面的分区路径添加到test table 命令 ALTER TABLE test ADD IF NOT EXISTS
使用字符串数组在 Hive 表上加载 CSV 文件

我正在尝试将 CSV 文件插入 Hive 其中一个字段是 string 数组这是 CSV 文件 48 Snacks that Power Up Weight Loss Aidan B Prince Health Fitness Trave
无法验证 serde：org.openx.data.jsonserde.jsonserde

我编写了这个查询来在配置单元上创建一个表我的数据最初是 json 格式所以我已经下载并构建了 serde 并添加了它运行所需的所有 jar 但我收到以下错误 FAILED Execution Error return code 1 fr
Sqoop 导出分区的 Hive 表

我在尝试导出分区的 Hive 表时遇到了一些问题这是否完全受支持我尝试用谷歌搜索并找到一张 JIRA 票证 sqoop export connect jdbc mysql localhost testdb table sales exp
Hadoop Windows 设置。运行 WordCountJob 时出错：“任何本地目录中都没有可用空间”

我正在按照此视频教程尝试在我的计算机上设置 hadoop 如何在 Windows 10 上安装 Hadoop https www youtube com watch v zujpglKP0Nw 我已经成功设置它从 sbin 目录执行 st
在 Hadoop MapReduce 中为二进制文件创建自定义 InputFormat 和 RecordReader

我正在编写一个 M R 作业该作业处理以二进制格式编写的大型时间序列数据文件如下所示此处换行以提高可读性显然实际数据是连续的 TIMESTAMP 1 TIMESTAMP 1 TIMESTAMP 2 TIMESTAMP 2 TIME
将 Spark 添加到 Oozie 共享库

默认情况下 Oozie 共享 lib 目录提供 Hive Pig 和 Map Reduce 的库如果我想在 Oozie 上运行 Spark 作业最好将 Spark lib jar 添加到 Oozie 的共享库而不是将它们复制到应用程序
无法在 Windows 10 中启动 Spark Master

我是 Spark 新手我正在尝试手动启动 master 在 Windows 10 中使用 MINGW64 当我这样做时 Downloads spark 1 5 1 bin hadoop2 4 spark 1 5 1 bin hadoop2
适用于 Python 3.x 的 Hive 客户端

是否可以使用 Python 3 x 连接到 hadoop 并运行 hive 查询我正在使用Python 3 4 1 我发现可以按照这里写的方式完成 https cwiki apache org confluence display Hiv
与文件名中的冒号“：”作斗争

我有以下代码用于加载大量 csv gz 并将它们转储到其他文件夹中并将源文件名作为一列 object DailyMerger extends App def allFiles path File List File val parts
更改spark_temporary目录路径

是否可以更改 temporarySpark在写入之前保存临时文件的目录特别是由于我正在编写表的单个分区因此我希望临时文件夹位于分区文件夹内是否可以由于其实现原因无法使用默认的 FileOutputCommiter FileOut
如何用snappy解压hadoop的reduce输出文件尾？

我们的 hadoop 集群使用 snappy 作为默认编解码器 Hadoop作业减少输出文件名就像part r 00000 snappy JSnappy 无法解压缩文件 bcz JSnappy 需要以 SNZ 开头的文件归约输出文件以某种
如何使用hbase协处理器实现groupby？

最近学习了hbase协处理器我使用endpoint来累加hbase表的一列例如名为 pendings 的hbase表它的家族是 asset 我累加了 asset amount 的所有值该表还有其他列例如 asset custom
在 HBase 中存储和检索字符串数组

我读过这个答案如何将复杂对象存储到hadoop Hbase中 https stackoverflow com questions 4086684 how to store complex objects into hadoop hbase
通过Oozie命令行指定多个过滤条件

我正在尝试通过命令行搜索一些特定的 oozie 作业我使用以下语法进行相同的操作 oozie jobs filter status RUNNING status KILLED 但是该命令仅返回正在运行的作业而不是已杀死的作业需要帮助
匿名类上的 NotSerializedException

我有一个用于过滤项目的界面 public interface KeyValFilter extends Serializable public static final long serialVersionUID 7069537470113

随机推荐

【华为OD机试真题 Java】创建二叉树

前言本专栏将持续更新华为OD机试题目并进行详细的分析与解答包含完整的代码实现希望可以帮助到正在努力的你关于OD机试流程面经面试指导等如有任何疑问欢迎联系我 wechat steven moda email nansun09
Binder机制详解（二）

系列章节 Binder机制详解一 Binder机制详解三文章目录前言一什么是MMU 二发展历史三相关概念四分页机制 1 页表的概念 2 页式内存管理总结前言上一章通过一个例子让我们认识了Binder通信机制不同于
HbuilderX微信小程序uniapp分包小白教程&趟坑【伸手党福利】【干货】

本教程为小白教程主管操作具体原理讲解欢迎评论区补充微信小程序分包原因 1 多人开发 2 引入了大型js 3 单项目多模块需要分包官方资料 https developers weixin qq com miniprogram dev
扫描指定路径下有多少行代码

import java io BufferedReader import java io File import java io FileReader import java io IOException Created by qiaoju
使用蓝牙耳机听群晖ds218play中的音乐（audio station）

缘起有时需要欣赏nas中的音乐而又不影响家人有什么方法呢思路研究了一下发现新版的群晖dms支持蓝牙usb蓝牙适配器可以使用audio station播放蓝牙耳机收听步骤 1 购买CSR USB蓝牙适配器 2 插入ds218p
大数据CDC技术

1 简介 CDC全称是Change Data Capture 是一种捕获增量数据的技术统称目前主要应用在捕获数据库数据变更的技术其中数据库变更包括DDL DML DCL等语句触发的变更在数据备份容灾数据分发面向数仓的数据集成等场景
JavaScript实现WebService的http的Post请求

javascript 这个脚本实现Webservice调用 function AjaxFunc var url http localhost MyService Service asmx var method DollarConvertTo
使用Jmeter做压力测试，参数化

1 首先在工作台下添加一个线程组测试计划右键添加线程用户线程组根据需求填写线程组信息根据测试数据量填写线程数也就是并发数下面的调度时间代表规定的时间内完成并发 2 添加HTTP请求在线程组下右键添加取样器 HTTP请
微信小程序image组件的mode总结+介绍（包含heightFix）

2 10 3版本后微信小程序的图片即image组件新增了heightFix属性 mode 总共具有14种属性满足各种情况的放置需要 14种属性可以分为两大类一种是完全保留的缩放属性一种是裁剪属性原图缩放属性 scaleToFil
常见的List接口的实现类

常见的List接口的实现类 ArrayList 数组实现查询快增删慢轻量级线程不安全 LinkedList 双向链表实现增删快查询慢线程不安全 Vector 数组实现重量级线程安全使用少 ArrayList实现类 pub
cesium-添加点线面可以动可编辑

使用 const drawEntities new CesiumEntityDraw viewer drawEntities startDraw 需要绘制的类型 CesiumEntityDraw ts文件 import Cesium fro
RabbitMQ编程模型

Hello World 在本教程的这一部分中我们将用 Java 编写两个程序发送单个消息的生产者和接收消息并将其打印出来的消费者我们将忽略 Java API 中的一些细节专注于这个非常简单的事情以便开始这是一个 Hello Wo
vue3的element-plus的el-dialog的样式加上scoped发现:deep()不再生效解决方案

想要将弹框 el dialog header el dialog body 的padding值设为0 但是 el dialog 用了 append to body 属性情况下官网解释 Dialog 自身是否插入至 body 元素上嵌套
C语言入门教程之三天入门C语言（第二天结构体与指针使用）

三天学习C语言第二步一 C语言中的几种集合的表达形式数组类型数组扩展结构体的表示联合体的表示二 sizeof 的使用三指针的使用指针变量未完待续指针与数组一 C语言中的几种集合的表达形式在数学中一般一组数据的集合
前端面试100道

幕布链接完整版面试终极幕布目录 1 弹性布局的认识 2 Var和let有什么区别 3 和的区别 4 Js事件 5 Vue计算属性 6 Vue采用指令 7 Html中的浮动怎么使用 8 箭头函数 9 Js的this指向 10 Cal
css兼容浏览器的各种背景渐变

需要兼容各浏览要注意的是必须加上浏览器的私有前缀否则一般都是不生效的浏览器的私有前缀主要是解决不同浏览器的兼容性问题 webkit 谷歌浏览器安卓 moz 火狐浏览器 o opera浏览器 ms ie浏览器首先来个简单的也最常见的
父组件更新，子组件未更新

囧问题项目中渲染的数据为对象数组arr obj obj obj 业务需要要给某个对象obj增加一个属性key arr forEach obj gt obj key 囧但是当在父组件中修改这个属性后子组件并没有随着更新原因没有通
软件测试笔试题含答案

目录一填空 1 系统测试使用 C 技术主要测试被测应用的高级互操作性需求而无需考虑被测试应用的内部结构 2 单元测试主要的测试技术不包括 B 3 A 的目的是对最终软件系统进行全面的测试确保最终软件系统满足产品需求并且遵循系统设计
ReactNative中使用WebSocket

首先说说发布订阅这种设计模式这种模式我给它起了个别名叫遥控炸弹很多朋友理解不了这种模式那举个例子张三是个法外狂徒它要去复仇他想去炸掉仇家的房子他来到仇家所在的小区拿出自己准备的炸弹监听丢进仇家的屋里页面等他走出小区
Hadoop3.x集成HBase

HBase作为Hadoop家族中实现高并发的利器我们来看看怎么进行集成 1 下载并上传到服务器目前使用2 3 5版本 wget https mirrors bfsu edu cn apache hbase 2 3 5 hbase 2 3

Hadoop3.x集成HBase

1. 下载并上传到服务器

2. 解压

3. 修改配置文件

3.1 修改hbase-env.sh

3.2 修改hbase-site.xml

3.3 修改regionservers

3.4 添加文件backup-masters

3.5 链接hdfs配置

3.6 添加环境变量

3.7 分发文件

4. 启动集群

Hadoop3.x集成HBase 的相关文章

随机推荐

热门标签