创建hbase索引表之hbase与hadoop整合

2023-05-16

hbase创建索引表只是为了减少查询表中数据的时间，优化查询。但是前提是表中数据很大的情况下，表数据很少完全没有必要建立索引表。。建立索引表是一种以空间换取时间的做法。。。
下面来看这道题

heroes表

索引表

以下是实现索引表的代码

package com.yc.hadoop.hbase.heroes;

import java.util.Enumeration;
import java.util.Random;
import java.util.ResourceBundle;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.TableExistsException;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;
import org.apache.hadoop.hbase.protobuf.generated.ClientProtos.MutationProto.MutationType;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.util.ResourceBundles;

import com.yc.hadoop.hbase.util.HBaseUtil;

public class Heroes {
    public static void getData(){
        try {
            HBaseUtil.createTable("heroes1", "info");
            String[] heronames = new String[] { "peter", "hiro", "sylar", "claire", "noah" };
            Random rand=new Random();
            for (int i = 1; i <= 5; i++) {
                HBaseUtil.doUpdate("heroes1", MutationType.PUT,i+"",
                        new String[]{"info","name",heronames[i-1]},
                        new String[]{"info","email",heronames[i-1]+"@heroes.com"},
                        new String[]{"info","power",randString(rand.nextInt(5)+3)});
            }
        } catch (TableExistsException e) {
            System.out.println(e.getMessage());
        }
    }
    public static String randString(int len){
        String str="abcdefgijklmnopqstuwxyz1234567890ABCDEFGIJKLMNOPQSTUWXYZ";
        StringBuilder sb=new StringBuilder();
        Random rand=new Random();
        for (int i = 0; i < len; i++) {
            sb.append(str.charAt(rand.nextInt(str.length())));

        }
        return sb.toString();
    }
    public static void main(String[] args) throws Exception {
        getData();
        Configuration conf=HBaseConfiguration.create();//加载hadoop和hbase的配置文件创建配置文件对象
        //加载hbase.properties配置文件信息
        ResourceBundle rb=ResourceBundles.getBundle("hbase");
        Enumeration<String> kvs=rb.getKeys();
        while (kvs.hasMoreElements()) {
            String key=kvs.nextElement();
            String value=rb.getString(key);
            conf.set(key,value);//设置hbase由哪个zookeeper集群协调管理
        }
        Job job=Job.getInstance(conf, "heroes1");
        job.setJarByClass(Heroes.class);
        Scan  scan=new Scan().addColumn(Bytes.toBytes("info"),Bytes.toBytes("name"));
        //TableMapReduceUtil.initTableMapperJob("heroes", scan, HBaseIndexMapper.class, ImmutableBytesWritable.class, ImmutableBytesWritable.class, job);
        TableMapReduceUtil.initTableMapperJob("heroes1", scan, HBaseIndexMapper02.class, Text.class, Text.class, job);
        try {
            HBaseUtil.createTable("index_heroes1", "rowkey");
        } catch (TableExistsException e) {
            System.out.println(e.getMessage());
        }
        TableMapReduceUtil.initTableReducerJob("index_heroes1", HBaseIndexReducer02.class, job);
        //FileOutputFormat.setOutputPath(job,new Path("hdfs://master:9000/out"+System.currentTimeMillis()));
        System.exit(job.waitForCompletion(true) ? 0 : 1);

    }   

}

package com.yc.hadoop.hbase.heroes;

import java.io.IOException;
import java.util.List;

import org.apache.hadoop.hbase.Cell;
import org.apache.hadoop.hbase.CellUtil;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableMapper;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

public class HBaseIndexMapper02 extends TableMapper<Text, Text> {
    @Override
    protected void map(ImmutableBytesWritable key, Result value,
            Mapper<ImmutableBytesWritable, Result, Text, Text>.Context context)
                    throws IOException, InterruptedException {
        Text k=new Text(CellUtil.cloneValue(value.listCells().get(0)));
        Text v=new Text(key.get());
        System.out.println("k===>"+k+"v===>"+v);
        context.write(k,v);
    }
}

package com.yc.hadoop.hbase.heroes;

import java.io.IOException;

import org.apache.hadoop.hbase.client.Mutation;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableReducer;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

public class HBaseIndexReducer02 extends TableReducer<Text, Text, ImmutableBytesWritable> {
    @Override
    protected void reduce(Text key, Iterable<Text> value, Reducer<Text, Text, ImmutableBytesWritable, Mutation>.Context context)
            throws IOException, InterruptedException {
        //把名字做行健
        //ImmutableBytesWritable k=new ImmutableBytesWritable(key.getBytes()); 这个会多加字符
        ImmutableBytesWritable k=new ImmutableBytesWritable(key.copyBytes());
        Put put=new Put(k.get());
        for (Text text : value) {
            put.addColumn(Bytes.toBytes("rowkey"),Bytes.toBytes("index"), Bytes.toBytes(text.toString()));
        }
        context.write(k, put);
    }

}

运行后结果如图所示
这里写图片描述

这里写图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

创建hbase索引表之hbase与hadoop整合的相关文章

解决问题：编译Latex遇到 file ended while scanning use of \@xdblarg or \@frac

出现这个问题的原因是使用某些命令时 xff0c 给出的参数不完整或者漏了半个大括号举例 xff1a begin document 第一行第二行第三行 section 第一部分第四行第五行 end document 上边这种情况明显
解决问题：windows10安装MATLAB闪退或者安装没反应

在bin win64目录下双击运行vcredist x64 exe xff1b 在bin win64 vc90目录下双击运行vcredist x64 exe xff1b 然后重启电脑该问题即可得到解决
解决问题：libpng warning: iCCP: known incorrect sRGB profile

我们在运行和图像相关的程序时 xff0c 有时会遇到libpng warning iCCP known incorrect sRGB profile的问题网上的解决方法有个是 xff1a pngcrush ow rem allb redu
Vue组件使用入门实例及常见错误解决

定义Vue组件名的方式有两种 xff1a 使用 kebab case Vue component 39 my component name 39 当使用 kebab case 短横线分隔命名定义一个组件时 xff0c 必须在引用这个自定义
vivado中verilog里关于$readmemb和 $readmemh的使用方法

vivado中verilog里关于 readmemb和 readmemh的使用方法这两天学习verilog语言时 xff0c 对 readmemb和 readmemh怎么读文件里的数据产生了疑问 xff0c 网上大多数资料都是inter下
R语言：permutation test 置换检验

1 生成男女生身高数据各20个男身高 xff0c mean 61 180 sd 61 10 女身高 xff0c mean 61 178 sd 61 10 set seed 20211009 boy 61 rnorm 20 180 10 g
Mac系统原生支持NTFS格式硬盘

所有的办法都是在没有办法的情况下才能找到之前一直用的 Paragon NTFS 当然虽然是程序员有两种方式一种就是支持自己的事业用收费的另一种就是发挥自己的特长去破解无奈承担不起Paragon NTFS每个版本更新都要重新购买的
模板 template 的类型转换

template lt typename T gt T to xff08 int n xff09 return T n double d 61 to lt double gt 3 float f 61 to lt float gt 2 还可
两个C++编译错误及解决办法--does not name a type和field `XX' has incomplete type

编译错误一 xff1a XX does not name a type 编译错误二 xff1a field 96 XX 39 has incomplete type 编译错误一 xff1a XX does not name a type x
vim 常用操作

1 xff1a vim选中字符复制剪切粘贴 xff08 https www cnblogs com luosongchao p 3193153 html xff09 问题描述 xff1a vim 中选中指定字符 xff0c 进行复制剪
oracle split去逗号，行列转换

1 针对 39 1 39 39 2 39 39 3 39 39 4 39 39 5 39 xff08 逗号在字符串外面 xff09 SQL gt SELECT COLUMN VALUE FROM TABLE SYS ODCIVARCHAR2
如何解决相机打开后显示灰色（只针对联想电脑）

症状描述 xff1a 打开相机 xff0c 显示灰色 xff0c 中间有一个相机带斜杠的图标我第二次被这玩意搞破了心态 xff0c 吐槽一句 xff1a 垃圾联想 xff0c 我丢 xff01 xff01 如何解决 xff1f 一步到位
python工程打包成可执行文件

1 将python打包成exe的方式 python 上常见的打包方式目是通过 pyinstaller 来实现的 pip install pyinstaller 或者用镜像下载 xff1a 清华源 pip install pyinstalle
Debian 8安装、配置

win10下双系统安装Debian 8 1 安装Debian 8 首先在Debian官网https www debian org CD 上下载网络安装CD或者完整DVD镜像 xff0c DVD镜像只需DVD 1即可下载好镜像后做成U盘启动
Rust语法之原生数据类型（一）

Rust语言有一些被认为是原生类型的数据类型这意味着它们是语言内建的 Rust是这样的一种结构 xff0c 这种结构是标准库在这些类型上提供了一些有用的类型 xff0c 但是这些才是最原始的 Booleans Rust有一个内置的bool
WTL学习笔记——（5）工具条与状态条

一对第三部分的介绍自从作为Windows 95的通用控件出现以来 xff0c 工具条和状态条就变成了很普遍的事物由于MFC支持浮动的工具条从而使它们更受欢迎随着通用控件的更新 xff0c Rebars 最初被称为Coollbar
ESP8266调用心知天气API

首先我们需要一个可以调用返回天气信息的API xff0c 这里以心知天气为例 xff0c 可以免费注册 xff0c 虽然功能受限 xff0c 但对于初学者来说 xff0c 足够了心知天气api xff1a https api senive
《信号量》讲解

7 3 1 信号量信号量及信号量上的操作是E W Dijkstra 在1965年提出的一种解决同步互斥问题的较通用的方法 xff0c 并在很多操作系统中得以实现 xff0c Linux改进并实现了这种机制信号量 semaphore 实
【TouchDesigner学习笔记与资料】

文章目录基础知识常用快捷键TOP元件CHOP元件DAT 元件SOP元件COMP元件MAT元件 TouchDesigner是什么 xff1f 简单来说就是一种可视化的编程语言 TD 是一种编程语言 TD 不是一个 APP 应用程序 xff0
Java 枚举(enum) 详解7种常见的用法

DK1 5引入了新的类型枚举在 Java 中它虽然算个小功能 xff0c 却给我的开发带来了大方便用法一 xff1a 常量在JDK1 5 之前 xff0c 我们定义常量都是 xff1a public static final

随机推荐

iOS 缓存文件到沙盒目录的执行文件夹下，并再次读取文件

开发中我们经常要将一些文件缓存到沙盒路径下 xff0c 并且把指定的类型储存到指定文件夹下 xff0c 以便于方便管理下面是以图片为例首先显示缓存到指定文件夹下 xff0c 注释解释很详细将图片存储到沙盒目录下存储成jpg 形式 xf
php 扩展函数openssl_decrypt 使用注意事项

一般都采用原生数据进行处理 xff0c 通过text json方式传输 xff0c 避免base64数据被urlencode进行转码 key和 iv都是二进制的 xff0c 不是二进制 xff0c 要转成二进制 xff0c 再传入进去 da
关于element-ui中dialog嵌套table时，报toggleRowSelection未定义undefined错误完美解决方案

1 xff0c toggleRowSelection调用方式为refs方式 xff0c 直接操作DOM层 this refs multipleTable toggleRowSelection item innerGood selected
vue.js 的 watch 适用场景记录以及其中的immediate适用场景和注意事项

但凡来面试的 xff0c 如果说没用过watch xff0c 那么这个前端就不用招了 xff0c 理论上只有两种可能 xff0c 第一种 xff0c 从未写过复杂逻辑 xff0c 第二种 xff0c 从未封装过组件 xff1b 而两种情况都
electron+vue项目添加vue-devTools Unrecognized manifest key ‘browser_action‘. Permission ‘contextMenus‘

多年后补充 xff1a electron vue 这个在windows上如果能用外网的情况 xff0c electron选择8 0版本能顺利安装vue devtools工具对于mac m1来说 xff0c 必须升级到electron 13
python 离线图片文字识别（OCR）Tesseract

本人最近也是在使用和学习python遇到各种问题 xff0c 公司内网控制严格没有网络 xff0c 同时也不允许安装exe文件 xff0c 做python 十分的费劲 xff0c 也研究了好几款文字识别的OCR xff0c 要么是收费的
PHP转GO 的正确打开路径从hyperf，ES6，Python 到 Go

目前主流意识是让PHP程序员转GO xff0c 认为Go的语法比较简单 xff0c 甚至还没PHP的多 xff0c 但这是一个错误的概念 xff0c 越简单底层越暴露 xff0c 冲击越大 xff0c 即使PHP程序员勉强转了Go xff0
谷歌浏览器插件 chrome.webRequest 技术深度解析

背景介绍使用 chrome webRequest API 观察和分析流量并拦截阻止或修改正在进行的请求 HTTP请求的生命周期事件解释onBeforeRequest当请求即将发生时触发此事件在建立任何 TCP 连接之前发送 xff0
pycharm 代码截长图插件 code screenshots 使用记录

今天突发奇想想要将pycharm中的代码截图出来 xff0c 用传统的截图软件无法截长图 xff0c 我想应该有人把这个事情搞过了 xff0c 然后上网一搜 xff0c 还真还有 xff0c 但是使用中有坑 xff0c 没人说明 xff0c
用ChatGPT来分析Python装饰器有那些高级使用场景并给出案例

问题一 xff1a python 装饰器都有那些高级使用场景 Python装饰器是一种高级的语言特性 xff0c 它可以用于修改扩展或包装函数和类的行为 xff0c 使代码更加优雅和简洁以下是一些常见的高级使用场景 xff1a 1 权限
PHP匿名类的使用场景有哪些？PHP匿名类怎么用？有什么好处？PHP匿名类如何在运行时动态生成？

以下是一些使用匿名类的场景 xff1a 2 简单的工厂模式 xff1a 当需要在运行时动态创建一些简单的对象时 xff0c 可以使用匿名类替代创建不必要的类定义和文件 span class token keyword function sp
ChatGPT API SSE（服务器推送技术）和 Fetch 请求 Accept: text/event-stream 标头案例

实战代码github代码 xff1a chatgpt google extension 该代码以Chrome 插件的实用案例讲解了 fetch sse 的用法 xff0c 之前这个技术被用得很少 xff0c 大家基本上都直接用 websoc
Qt与Python混合编程(一)

前言本文主要介绍使用Qt和Python进行混合编程的环境搭建运行环境 Qt 5 13 0 64位 MinGW 64编译器Python 3 9 6 64bit 注意 Qt编译器的版本号需要和Python的版本号一致 xff0c 不然编译时
centos7 防火墙

CentOS 7 0默认使用firewall作为防火墙 1 切换到 root 用户 xff1a su root 2 命令 xff1a systemctl stop start firewalld service xff08 关闭开启防火墙
CentOS7安装MySQL

CentOS默认安装有MariaDB xff0c 这是MySQL的分支但还是要在系统中安装MySQL xff0c 且安装完成后可直接覆盖MariaDB 1 下载并安装MySQL官方 Yum Repository wget i c http
单片机烧录不进去怎么办？通用类！

我们经常会遇到芯片超时 xff0c 单片机烧录不进去的情况 xff0c 我也经常遇到 xff0c 哎 xff01 解决办法 xff1a 这里是我对遇到的一些情况总结 xff0c 只有几点 xff01 1 串口驱动没有装 xff1b xff0
远程连接到CentOS Mysql出现的问题解决

1 确保端口开放以下命令开启3306端口 iptables I INPUT p tcp dport span class token number 3306 span j ACCEPT 2 确保Mysql允许本地ip地址连接在远程服务器
debian忘记root密码怎么找回

debian忘记root密码怎么找回作者 admin时间 2021 06 03分类 Linux 写这篇文章是因为vulnhub的靶场上vmware上不能自动获取ip xff0c 要改一下ip配置文件 grub界面按e xff0c 在大约倒
.dmp数据备份与还原

dmp一般用来备份数据库或者导入数据库 xff0c 通常我们得到一个dmp文件 xff0c 那怎么将dmp文件导入数据库呢 xff1f ctrl 43 R 输入cmd进入dos命令 sqlplus system a 登录system用户sh
创建hbase索引表之hbase与hadoop整合

hbase创建索引表只是为了减少查询表中数据的时间 xff0c 优化查询但是前提是表中数据很大的情况下 xff0c 表数据很少完全没有必要建立索引表建立索引表是一种以空间换取时间的做法下面来看这道题以下是实现索引表的代码 packa

创建hbase索引表之hbase与hadoop整合

创建hbase索引表之hbase与hadoop整合 的相关文章

随机推荐

热门标签

创建hbase索引表之hbase与hadoop整合的相关文章