在hive中如何将字符串转换为数组？

2024-03-29

我使用的是蜂巢1.1

 hive> select country from releases limit 1;
 OK
 ["us","ca","fr"]

目前，国家在 hive 中是字符串类型。如何将其转换为数组[String]？

我尝试了下面的方法，但它抛出错误

 hive> select country, cast(country as Array[String]) from releases limit 1;
 FAILED: ParseException line 1:48 cannot recognize input near 'Array' '[' 'String' in primitive type specification

有人可以帮我做打字吗？

hive> with releases as (select '["us","ca","fr"]' as country)
    > select  split(regexp_extract(country,'^\\["(.*)\\"]$',1),'","')
    > from    releases
    > ;
OK
_c0
["us","ca","fr"]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

hive

在hive中如何将字符串转换为数组？的相关文章

hive 添加分区语句忽略前导零

我在 hdfs 上有文件夹 user test year 2016 month 04 dt 25 000000 0 需要将上面的分区路径添加到test table 命令 ALTER TABLE test ADD IF NOT EXISTS
如何找到 JAR：/home/hadoop/contrib/streaming/hadoop-streaming.jar

我正在练习有关 Amazon EMR 的复数视角视频教程我被困住了因为我收到此错误而无法继续 Not a valid JAR home hadoop contrib streaming hadoop streaming jar 请注意
运行 Sqoop 导入和导出时如何找到最佳映射器数量？

我正在使用 Sqoop 版本 1 4 2 和 Oracle 数据库运行 Sqoop 命令时例如这样 sqoop import fs
在 Hadoop MapReduce 中为二进制文件创建自定义 InputFormat 和 RecordReader

我正在编写一个 M R 作业该作业处理以二进制格式编写的大型时间序列数据文件如下所示此处换行以提高可读性显然实际数据是连续的 TIMESTAMP 1 TIMESTAMP 1 TIMESTAMP 2 TIMESTAMP 2 TIME
当我将文件存储在 HDFS 中时，它们会被复制吗？

我是 Hadoop 新手当我使用以下方式存储 Excel 文件时hadoop fs putcommoad 它存储在HDFS中复制因子为3 我的问题是是否需要3份并分别存储到3个节点中这是 HDFS 工作的漫画 https docs
无法在 Windows 10 中启动 Spark Master

我是 Spark 新手我正在尝试手动启动 master 在 Windows 10 中使用 MINGW64 当我这样做时 Downloads spark 1 5 1 bin hadoop2 4 spark 1 5 1 bin hadoop2
公平调度器和容量调度器有什么区别？

我是 Hadoop 世界的新手想了解公平调度程序和容量调度程序之间的区别另外我们什么时候应该使用每一个请简单地回答一下因为我在网上读了很多东西但从中得到的不多公平调度是一种为作业分配资源的方法使得所有作业随着时间的推移平均获得
Mapreduce shuffle 阶段出现内存不足错误

我在运行时遇到奇怪的错误类似字数统计映射缩减程序我有一个包含 20 个从站的 hadoop 集群每个从站都有 4 GB RAM 我将 Map 任务配置为 300MB 堆 Reduce 任务槽为 1GB 我每个节点有 2 个映射槽和 1
为什么我们需要将外部表移动到托管 Hive 表？

我是 Hadoop 新手正在学习 Hive 在 Hadoop 权威指南第 3 版中第 12 页第428章最后一段我不明白下面关于 HIVE 中外部表的段落一种常见的模式是使用外部表访问存储在 HDFS 中的初始数据集由另一个进
如何强制 Spark 执行代码？

我如何强制 Spark 执行对 map 的调用即使它认为由于其惰性求值而不需要执行它我试过把cache 与地图调用但这仍然没有解决问题我的地图方法实际上将结果上传到 HDFS 所以它并非无用但 Spark 认为它是无用的简短回
如何在Hadoop中序列化List集合对象？

有没有办法在 Hadoop 中序列化 java 集合 The Writable接口仅适用于 Java 原语我有以下类属性 private String keywords private List
在 Apache Spark 上下文中，内存数据存储意味着什么？

我读到 Apache Spark 将数据存储在内存中然而 Apache Spark 旨在分析大量数据又称大数据分析在这种情况下内存数据存储的真正含义是什么它可以存储的数据是否受到可用 RAM 的限制它的数据存储与使用HDFS的A
在 Google Cloud Dataproc 环境中使用 Hadoop 流式处理运行 python map reduce 作业时出错

我想使用 hadoop 流方法在 Google Cloud Dataproc 中运行 python map reduce 作业我的map reduce python脚本输入文件和作业结果输出位于Google Cloud Storage中
以编程方式读取 Hadoop Mapreduce 程序的输出

这可能是一个基本问题但我在谷歌上找不到答案我有一个映射缩减作业它在其输出目录中创建多个输出文件我的 Java 应用程序在远程 hadoop 集群上执行此作业作业完成后需要使用以下命令以编程方式读取输出org apache had
Hive 聚集在多个列上

据我所知当配置单元表聚集在一列上时它会执行该分桶列的哈希函数然后将该行数据放入其中一个桶中每个桶都有一个文件即如果有 32 个桶那么 hdfs 中就有 32 个文件将 clustered by 放在多个列上意味着什么例如假
伪模式下没有名称节点错误

我是hadoop新手正处于学习阶段根据 Hadoop Definitve 指南我已将 hadoop 设置为伪分布式模式一切正常昨天我什至能够执行第三章中的所有示例今天当我重新启动我的unix并尝试运行start dfs sh然
Hadoop 超立方体

嘿我正在启动一个基于 hadoop 的超立方体具有灵活的维度数有人知道这方面现有的方法吗我刚刚发现PigOLAP草图 http wiki apache org pig PigOLAPSketch 但没有代码可以使用它另一种方法是Z
通过Oozie命令行指定多个过滤条件

我正在尝试通过命令行搜索一些特定的 oozie 作业我使用以下语法进行相同的操作 oozie jobs filter status RUNNING status KILLED 但是该命令仅返回正在运行的作业而不是已杀死的作业需要帮助
匿名类上的 NotSerializedException

我有一个用于过滤项目的界面 public interface KeyValFilter extends Serializable public static final long serialVersionUID 7069537470113
hive regexp_extract 怪异

我在 regexp extract 方面遇到一些问题我正在查询制表符分隔的文件我正在检查的列具有如下所示的字符串 abc def ghi 现在如果我这样做 select distinct regexp extract name 0 f

随机推荐

链接和图标之间有空格，非常棒

在链接段落和图标之间添加空格的最佳方法是什么 a href upgrade selection i class fa fa reply i Change a 仅在文本前放置一个空格是行不通的因为当您缩小丑化项目时它会被改回来我尝试了
用最少数量的固定半径圆完全覆盖一个矩形

我已经有这个问题好几年了不久前这是我镇上的一场信息学竞赛我没能解决我的老师也没能解决我还没有遇到能够解决这个问题的人我认识的人都不知道给出答案的正确方法所以我决定将其发布在这里泽问题给定一个 X Y 的矩形找到具有固定给
如何通过 WP REST API V2 使用自定义字段正确创建自定义帖子类型

如何通过带有自定义字段的 wp Rest api v2 正确创建自定义帖子类型记录无法创建自定义字段或更新它们我已经在自托管 WordPress 安装中安装了 superlist 和 superlist child 主题该主题对类别
将 xPath 转换为 jQuery 选择器

如何将以下 xPath 转换为 jQuery 1 10 选择器 html body div 4 div 2 div div div ul li 4 我想用结果来做这样的事情 jQuery selector hide 好吧这是一个识别语法差
Android：Google Play 服务中的 Google Analytics 是否可用？

Google Analytics 已宣布成为 Google Play Services 4 3 推出的一部分但尚未包含在 Google Play Services 包列表中 http developer android com refer
Nginx：代理传递/代理重定向到闪亮的 Web 应用程序

我们正在尝试更新我们的内部服务器基础设施并通过 Nginx 服务器代理对我们的 R闪亮网络服务器的所有访问我能够从闪亮的服务器获得响应但无法通过 Nginx 服务器获取 css js 等相关文件 Setup 2 个 docker 容器
Git：将子文件夹从存储库获取到新存储库而不丢失历史记录

我有一个git具有多个分支的应用程序的存储库源代码树由几个目录组成例如 main folder gt git gt dir0 gt dir1 gt dir2 不幸的是从开发之初我就没有使用git submodules nor git
“值”应该是 Kendo Angular DatePicker 中有效的 JavaScript Date 实例

kendo DatePicker 的绑定出现错误值应该是有效的 JavaScript Date 实例我在 asp core 中获取学生的 Web api 是 HttpGet Route api master id public Jso
循环遍历指定文件夹中的所有 Excel 文件并从特定单元格中提取数据的代码

我有大约 50 个左右的 Excel 工作簿需要从中提取数据我需要从特定单元格特定工作表中获取数据并编译成一个数据集最好是另一个 Excel 工作簿我正在寻找一些 VBA 以便可以将结果编译到我用来运行代码的工作簿中因此我需要
iOS9 的 UILocalNotification 问题

从iOS9开始本地通知无法正常工作有时用户会收到通知有时则不会我的通知每天都会重复知道什么可能导致这个问题吗我看到一些帖子说iOS9有一个bug 但我不确定这就是原因这是一段代码 NSDate alarmDate date d
如何保证两个div的高度相同？

假设我在包装器中有 2 个并排的 div div div div div div div primary width 50 float left secondary width 50 如何确保 div secondary 始终与 div m
正则表达式避免了Java中不必要的回溯

你好我是正则表达式世界的新手我想在 Java 测试字符串中提取时间戳位置和 id str 字段 20110302140010915 user is translator false show all inline media fals
postgresql 删除重复行

我只想删除具有相同名称的重复行但我想保留这些行的值高于其他行问题是当我执行代码时所有重复的行都被删除并且没有一个被保留为什么这样 SELECT name from select name ROW NUMBER OVER PART
反应路由器中的查询字符串

我正在尝试使用查询字符串设置路由路径内容如下 www mywebsite com results query1 query1 query2 query2 query3 query3 我会像这样过渡到结果组件
锚链接在 iPad 上无法正常工作

我们在 iPad 上遇到了固定元素的问题您可以在这里查看我们的布局 http cibology edoardobiasini it http cibology edoardobiasini it The position fixed右侧的
十六进制浮点文字中的十六进制“E/e”与指数形式的“E/e”如何区分？

在 C 中如果我想要一个浮点文字 x 为十六进制形式并具有指数值它将表示为 float x 0X2aE 10 其中0x用于表示它是十六进制的 2a用于表示十六进制字符 E 10用于表示十的10次方的数字然而编译器是否知道它不是 2a
为什么当我在 switch 语句中为每个枚举常量都有情况时，我仍然必须提供默认值吗？ [复制]

这个问题在这里已经有答案了我试图在 Java 中声明一个枚举并在 switch 语句中使用该类型的变量其中涵盖了该类型枚举常量的所有可能情况 enum MyEnum FOO BAR private static void test M
按版本对字符串列表进行排序

我有一个字符串列表每个字符串都遵循模式 Path UpdateTo Version Order 我需要对列表进行排序使最低版本号位于顶部如果存在多个具有相同版本号的文件则附加一个可选的顺序参数如果任何字符串上存在订单那么它应该出
以 cm 为单位调整图像大小 C#

我有一个要求要求提供 10 X 6 88 厘米的图像我知道我不能简单地将厘米转换为像素因为一个像素大小取决于用户显示分辨率我想知道是否有办法调整图像大小以达到该尺寸以厘米为单位我还需要保留图像扩展名例如无法将其转换为 pdf
在hive中如何将字符串转换为数组？

我使用的是蜂巢1 1 hive gt select country from releases limit 1 OK us ca fr 目前国家在 hive 中是字符串类型如何将其转换为数组 String 我尝试了下面的方法但它抛出错

在hive中如何将字符串转换为数组？

在hive中如何将字符串转换为数组？ 的相关文章

随机推荐

热门标签

在hive中如何将字符串转换为数组？的相关文章