Hive使用入门

2023-05-16


先介绍一些基本的命令：

1、进入hive命令行，这种方式进入之后，操作结果展示时带有执行mapreduce的调试信息；


hive --service cli //等同于直接输入hive

2、进入hive命令行静默模式,不输出调试信息；


hive -S //静默模式

3、查看表信息，查看函数信息，查看表字段信息,每一条hiveql语句后面都要跟分号(;)结尾


show tables;
show functions;
desc xx_user;

4、查看hdfs文件信息，查看linux文件信息


dfs -ls /usr; --查看hdfs文件系统信息
!ls ;         --查看linux文件系统信息

5、hive在linux命令行下的交互模式,静默模式


hive -e "show tables"    //交互模式
hive -S -e "show tables" //静默的交互模式

6、hive执行sql文件

第一种方式，在linux命令行下


hive -f queryall.sql

第二种方式，在hive命令行下


source queryall.sql


hive数据存储：

hive数据存储基于HDFS,没有专门的数据存储格式。

hive可以直接加载本地文本文件(.txt)，同时创建表可以指定间隔符。

表分为内部表、分区表、外部表、桶表。

a)默认创建的表是内部表：


create table student(id int,name string) location '/user/feiy/student';

b)分区表


create table student_all(id int,name string) partitioned by (gender string) row format delimited fields terminated by '\t';

c)外部表

hive目前不支持insert into table table_name values(x,x,x,x);的方式插入数据
只能是
1、导入外部数据
2、创建时查询别的表
3、插入时查询别的表

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

hive

使用入门

Hive使用入门的相关文章

Hive 表是从 Spark 创建的，但在 Hive 中不可见

从火花使用 DataFrame write mode SaveMode Ignore format orc saveAsTable myTableName 表正在保存我可以使用下面命令的 hadoop 看到fs ls apps hive w
将 Hive 表导出到 hdfs 中的 csv

我知道在 Hive 中将表保存到 csv 或其他文本文件时分隔符存在一个已知问题所以我想知道你们是否可以帮助我解决这个问题我有一个现有的表表 A 我想将其以 csv 格式保存到 hdfs 通过阅读其他回复我相信我必须首先创建一个
如何在 ORC 分区 Hive 表的中间添加一列，并且仍然能够使用新结构查询旧分区文件

目前我在 Prod 中有一个分区 ORC 托管错误地创建为内部优先 Hive 表其中至少有 100 天的数据按年月日约 16GB 数据分区这个表大约有160列现在我的要求是在这个表的中间添加一列并且仍然能够查询旧数据
如何获取hive中的数据库用户名和密码

正在编写jdbc程序来连接hive数据库我希望在连接 url 中提供用户名和密码我不知道如何使用 hive QL 获取用户名和密码有人可以帮我吗 Exception in thread main java sql SQLNonTran
Hive：转换“yyyy-MM-dd'T'HH:mm:ss.SSS'Z'”中缺少秒数的字符串日期时间

我使用以下代码将字符串日期时间变量转换为日期时间但转换后的字符串缺少 SSS 部分使用的代码 cast FROM UNIXTIME UNIX TIMESTAMP oldtime yyyy MM dd T HH mm ss SSS Z y
在 Hive 中获取空值使用 REGEX 创建和加载查询

我有一个日志文件我需要在其中使用 REGEX 存储数据我尝试了下面的查询但加载了所有 NULL 值我已经检查了 REGEXhttp www regexr com http www regexr com 它对我的数据工作正常 CRE
Hive（查找连续 n 列中的最小值）

我在 Hive 中有一个表有 5 列即电子邮件 a first date b first date c first date d first date a b c d 是用户可以执行的 4 个不同操作上表中的 4 列表示用户执行第一个
在 Hive 中分解一行 XML 数据

我们将 XML 数据作为名为 XML 的单个字符串列加载到 Hadoop 中我们正在尝试检索数据级别并将其标准化或分解为单行进行处理你知道就像表格一样已经尝试过分解功能但没有得到我们想要的示例 XML
Hive ParseException - 无法识别“结束”“字符串”附近的输入

尝试从现有 DynamoDB 表创建 Hive 表时出现以下错误 NoViableAltException 88 at org apache hadoop hive ql parse HiveParser IdentifiersParser
使用 python 从 hive 读取数据时的性能问题

我在 hive 中有一个表其中包含 351 837 110 MB 大小记录我正在使用 python 读取该表并写入 sql server 在此过程中从 hive 读取数据到 pandas dataframe 需要很长时间当我加载整
计算行的排名

我想根据一个字段对用户 ID 进行排名对于相同的字段值排名应该相同该数据位于 Hive 表中 e g user value a 5 b 10 c 5 d 6 Rank a 1 c 1 d 3 b 4 我怎样才能做到这一点可以使用ra
Hive：如何分解嵌入 CSV 文件中的 JSON 列？

从 CSV 文件带有标题和管道分隔符中我得到了以下两个内容其中包含一个 JSON 列内部有一个集合如下所示第一种情况使用没有名称的 JSON 集合 ProductId IngestTime ProductOrders 918
获取从开始日期到结束日期的活跃周数

我的订阅数据如下所示数据显示用户何时购买订阅它有user id subscription id start date and end date 我已经得出wk start and wk end从中 user subscription i
hive 添加分区语句忽略前导零

我在 hdfs 上有文件夹 user test year 2016 month 04 dt 25 000000 0 需要将上面的分区路径添加到test table 命令 ALTER TABLE test ADD IF NOT EXISTS
使用 impala 按范围连接表的有效方法

我第一个有下表 Range 包括值范围和附加列 row From To Country 1 1200 1500 2 2200 2700 3 1700 1900 4 2100 2150 The From and Toare bigint并且是
在蜂巢中出现错误

当我连接到 ireport 时如果说在 hive shell 中显示表则会出现此错误元数据错误 java lang RuntimeException 无法实例化 org apache hadoop hive metastore Hiv
为什么我们需要将外部表移动到托管 Hive 表？

我是 Hadoop 新手正在学习 Hive 在 Hadoop 权威指南第 3 版中第 12 页第428章最后一段我不明白下面关于 HIVE 中外部表的段落一种常见的模式是使用外部表访问存储在 HDFS 中的初始数据集由另一个进
我们如何确定总数？ Hive 表的桶数

我对 hadoop 有点陌生根据我的知识桶是固定的 hive 表中的分区数和 hive 使用编号减速机数量与总数量相同创建表时定义的存储桶数量那么谁能告诉我如何计算总数 Hive 表中的桶数有没有计算桶总数的公式让我们看一个场景
Aws Athena - 重命名列名称

我正在尝试更改 AWS Athena 表中的列名称从old name to new name 普通的DDL命令不会影响表它们无法执行是否可以更改列名而不从头开始删除并重新创建表我错了雅典娜使用HIVE DDL语法所以正确的命令是
将数据从 .txt 文件加载到 Hive 中以 ORC 形式存储的表

我有一个数据文件位于 txt格式我正在使用该文件将数据加载到 Hive 表中当我将文件加载到类似表中时 CREATE TABLE test details txt visit id INT store id SMALLINT STORE

随机推荐

opencv-python加载pytorch训练好的onnx格式线性回归模型

opencv是一个开源的图形库 xff0c 有针对java c 43 43 python的库依赖 xff0c 它本身对模型训练支持的不好 xff0c 但是可以加载其他框架训练的模型来进行预测这里举一个最简单的线性回归的例子 xff0c 使
edm经验1

edm经验 xff1a 1 lt table border 61 34 0 34 height 61 34 100 34 cellpadding 61 34 0 34 cellspacing 61 34 0 34 style 61 34 b
hive2.0.0安装(配合hadoop2.6.0)

一前提条件安装了Hadoop2 6 0 xff0c 并且配置了相关环境变量 jdk安装 xff0c 免密登录设置 xff0c 环境变量设置 JAVA HOME JRE HOME CLASSPATH PATH 二安装配置 1 下载hiv
mysql删除无主键表中重复记录(只保留一条记录)

考虑多条语句变通的办法 mysql gt span class hljs operator span class hljs keyword select span span class hljs keyword from span x us
redhat7安装openstack(juno版/附所需文件)

这种方式使用自己制作的yum源安装openstack allinone xff0c 基本一装一个准 xff0c 不会出差错 xff0c 适合初学者安装一使用vmware安装redhat7操作系统百度盘地址https pan baidu
win7部署kafka_2.11

kafka作为开源的分布式消息通信框架 xff0c 可以在有jvm的机器上部署运行这里介绍在windows7上的部署 kafka内部自带了zookeeper 如果单机简单部署 xff0c 可以不用另外下载部署zookeeper 1 下载
正则表达式驼峰转中（下）划线

一驼峰转中划线采用正则来实现可以看如下代码 xff1a span class hljs string 34 marginTop 34 span replace a z A Z span class hljs string 34 span
工作无聊？程序员上班没事做该怎么办！

作为一名程序员 xff0c 工作强度不稳定是比较正常的 xff0c 忙的时候会埋怨 xff0c 闲的时候会发慌合理的安排自己的工作也是程序员最基本且最重要的能力工作不紧张的时候 xff0c 可以好好利用起来充实自己 xff0c 根据自身
mysql5.7.x:this is incompatible with DISTINCT

DISTINCT关键字经常在MySQL中使用 xff0c 在mysql5 7以前的版本中一般没有什么问题 xff0c 但是在5 7以后的版本中会遇到这样的错误 Caused by java sql SQLException Expressi
sublime3配置Python编译器快速编译python程序

本文介绍经常用的sublime编辑器作为PythonIDE时如何快速编译代码并得到执行结果 xff0c 前提是本机已经安装了python xff0c 并加入了环境变量 xff0c 命令行下输入python xff0c 会有如下输出 xff1
redhat7通过yum安装mysql5.7.17

rhel centos系列linux操作系统自身没有mysql的源 xff0c 需要自行下载安装本文介绍如何安装mysql5 7 x数据库第一步 xff1a 下载源 root span class hljs variable 64 cl
mysql主从复制环境搭建

所需服务器 xff1a 两台 centos7 linux虚拟机服务器分配 server 192 168 56 201 client 192 168 56 202 说明 xff1a 使用server做主库服务器client做从库服务器第一
hadoop2.6.0伪分布式环境搭建

Hadoop作为分布式大数据处理框架在数据处理应用中有广泛的应用 xff0c 本文介绍在Linux环境下搭建hadoop伪分布式集群 xff0c 记录下自己的学习过程一虚拟机准备 xff0c 为了减少折腾 xff0c 不建议在windo
ubuntu1404单机安装部署openstack-juno

Redhat上可以很快的使用All in one的方式安装openstack xff0c 先安装packstack 然后通过packstack allinone这条命令就可以一步安装openstack 最后设置IP和网桥 xff0c 就可
ubuntu上利用qemu-kvm创建虚拟机

kvm是Kernel based Virtual Machine的缩写 xff0c 即基于内核的虚拟机技术 xff0c 运行在具备Intel vt或者AMD V功能的x86平台上在linux2 6 20之后的版本中kvm成为了linux内
Fatal error in launcher: Unable to create process using解决办法

我的机器是windows7 64位机器 xff0c 本来默认安装了pip命令是9 0 1版本的 xff0c 网上有介绍说可以安装1 5 6版本我考虑将pip更改为1 5 6版本 xff0c 去官网下载一个whl的文件 xff0c 利用pi
openstack-install-ubuntu-single说明

ubuntu1404单机安装部署openstack juno值得注意的地方 xff0c 这里说明一下先来说说openstack组件 keystone gt 认证组件glance gt 镜像组件 xff0c 负责管理虚拟机镜像nova gt
hive自定义函数UDF

Hive自定义函数 UDF xff0c 可以帮助用户轻松实现在hql语句中展现自定义查询结果这里以一个简单的连接函数来实现用户自定义函数 xff0c 假设表结构如下 xff1a 表中只有两个简单的字段 xff0c id和name 这里实现
Oracle 数据误删的恢复措施

Oracle中常见的数据删除操作就三种 xff0c truncate xff0c drop xff0c delete xff0c 下面分类说一下如何恢复 Truncate xff1a 该操作执行后 xff0c 保留表结构 xff0c 清空
Hive使用入门

先介绍一些基本的命令 xff1a 1 进入hive命令行 xff0c 这种方式进入之后 xff0c 操作结果展示时带有执行mapreduce的调试信息 xff1b hive service cli 等同于直接输入hive 2 进入hive命

Hive使用入门

Hive使用入门 的相关文章

随机推荐

热门标签

Hive使用入门的相关文章