hive - 在值范围之间将一行拆分为多行

2024-05-20

我在下面有一张表，想按从开始列到结束列的范围拆分行。

即 id 和 value 应该对开始和结束之间的每个值重复（包括两者）

--------------------------------------
id      | value   | start     | end
--------------------------------------
1       | 5       | 1         | 4
2       | 8       | 5         | 9
--------------------------------------

所需输出

--------------------------------------
id      | value   | current
--------------------------------------
1       | 5       | 1
1       | 5       | 2
1       | 5       | 3
1       | 5       | 4

2       | 8       | 5
2       | 8       | 6
2       | 8       | 7
2       | 8       | 8
2       | 8       | 9
--------------------------------------

我可以在 java/python 中编写自己的 UDF 来获得此结果，但想检查是否可以使用任何现有的 hive UDF 在 Hive SQL 中实现

提前致谢。

这可以通过 Hive 不支持的递归公用表表达式来完成。

一种选择是创建一个数字表并使用它在开始和结束之间生成行。

create table numbers
location 'hdfs_location' as 
select row_number() over(order by somecolumn) as num
from some_table --this can be any table with the desired number of rows 
;

--Join it with the existing table 
select t.id,t.value,n.num as current
from tbl t
join numbers n on n.num>=t.start and n.num<=t.end

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

apachespark

Hadoop

hive

hive - 在值范围之间将一行拆分为多行的相关文章

SQL - != 'NULL' 的解释

我的SSMS代码如下 Select top 50 From FilteredContact Where statuscode 1 and emailaddress1 NULL and telephone1 NULL and address1
如何获得顶部带有千位分隔符的数字？

SELECT count FROM table A 假设结果是8689 我怎样才能将它转换为8 689在 SQL Server 上尝试这样 select replace convert varchar convert Money coun
在 Oracle 行的多个列上使用透视

我在 Oracle 表中有以下示例数据 tab1 我正在尝试将行转换为列我知道如何在某一列上使用 Oracle 数据透视表但是否可以将其应用于多个列样本数据 Type weight height A 50 10 A 60 12 B 4
在 IntelliJ 中运行 Spark 字数统计

我花了几个小时浏览 You Tube 视频和教程试图了解如何在 Scala 中运行 Spark 字数统计程序并将其转换为 jar 文件我现在完全糊涂了我运行了 Hello World 并且了解了如何在 Apache spark sp
如何找到多个列中的最小值

我在我的 DB 3 col 中有一个值我想在所有这些值中找到一个值如下所述表名 MyTable id col1 col2 col3 1 200 300 400 2 100 150 300 3 800 102 20 4 80 80 0
如何在 apache Spark 作业中执行阻塞 IO？

如果当我遍历 RDD 时我需要通过调用外部阻塞服务来计算数据集中的值怎么办您认为如何才能实现这一目标值 Future RDD Double Future sequence tasks 我尝试创建一个 Futures 列表但由于
如何解决 java.lang.RuntimeException: PipeMapRed.waitOutputThreads(): subprocess failed with code 2？

我正在尝试在 Hadoop 环境中执行 NLTK 以下是我用于执行的命令 bin hadoop jar HADOOP HOME contrib streaming hadoop streaming 1 0 4 jar input user
我怎样才能知道oracle 9i中哪些值是数字

我有这个包含 varchar 的数据库我想知道哪些记录保存数值我试过REGEXP COUNT和其他但我在 9i 上运行我认为这是针对 10g gt 我怎样才能实现这个目标 I tried select to number my co
默认情况下，Spark sql 模式中的可为空性是建议性的。严格执行的最佳方法是什么？

我正在开发一个简单的 ETL 项目它读取 CSV 文件执行对每列进行一些修改然后将结果以 JSON 格式写出我想要读取我的结果的下游进程确信我的输出符合一个商定的模式但我的问题是即使我定义我的输入模式的所有字段都为 nu
Spark 执行器登录 YARN

我正在 Cloudera 集群上以 YARN 客户端模式启动分布式 Spark 应用程序一段时间后我在 Cloudera Manager 上看到一些错误一些执行者会断开连接并且这种情况会系统性地发生我想调试该问题但 YARN 未
Checkpoint RDD ReliableCheckpointRDD 与原始 RDD 的分区数量不同

我有一个由两台机器组成的 Spark 集群当我运行 Spark 流应用程序时出现以下错误 Exception in thread main org apache spark SparkException Checkpoint RDD R
如何在 Spark Dataframe 中显示完整的列内容？

我正在使用 Spark csv 将数据加载到 DataFrame 中我想做一个简单的查询并显示内容 val df sqlContext read format com databricks spark csv option header
使用 Apache Spark 读取 JSON - `corrupt_record`

我有一个json file nodes看起来像这样 toid osgb4000000031043205 point 508180 748 195333 973 index 1 toid osgb4000000031043206 point
如何在 DB2 AS/400 中将小数字段转换为日期字段？

我有一个 DECIMAL 字段其中包含 AS400 格式的日期 1100614 我努力了 cast MYDATE as DATE 但我无法将 DECIMAL 转换为 DATE 而 DATE MYDATE 返回空值如何将此字段转换为日期字
需要按天分割日期时间范围

我有一个需要根据日期时间拆分的表输入表 ID Start End A 2019 03 04 23 18 04 2019 03 04 23 21 25 A 2019 03 04 23 45 05 2019 03 05 00 15 14 所需
SQL 查询用于计算每个客户的订单数量和总金额

我有两张桌子Order与列 OrderID OrderDate CID EmployeeID And OrderItem与列 OrderID ItemID Quantity SalePrice 我需要返回客户 ID CID 每个客户的订单数
Postgresql 一张表的多个计数

我想从表中的两列中获得这些列中值的统一计数例如两列是表报告 type place one home two school three work four cafe five friends six mall one work one
检查两个“select”是否相等

有没有办法检查两个非平凡的选择是否等效最初我希望两个选择之间有形式上的等价但是答案在证明 sql 查询等价性 https stackoverflow com questions 56895 proving sql query equ
在 SQL Server 上执行分页的最佳方式是什么？

我有一个数据库超过200万记录我需要执行分页以在我的 Web 应用程序上显示该应用程序每页必须有 10 条记录DataGrid 我已经尝试使用ROW NUMBER 但是这种方式会选择所有 200 万条记录然后只得到 10 条记录我也
如何在MYSQL中将整个字符串小写并保持第一个大写[重复]

这个问题在这里已经有答案了我的表栏目我预期的输出会在列中发生变化 Smith Allen Doyle Dennis Baker Waker 这是我尝试过的但不起作用 UPDATE TABLE employee SET last nam

随机推荐

在 WooCommerce 中添加到购物车之前清空购物车

我正在使用 WP 作业管理器和 Woo Subscriptions Now 最初我选择了一个套餐 Woo Subscription 然后我添加了所有细节但没有提交回到网站所以要再次购买我需要选择一个套餐于是我选择了套餐并填写了详
识别操作系统

我在 Intel 编译器上的 Fortran 90 代码取决于它运行的操作系统例如 if OS win7 then do X else if OS linux then do y end if 我如何以编程方式执行此操作您可以使用预处理
jquery 验证错误位置

这看起来很简单但我无法弄清楚我正在使用 jquery 验证插件我验证所有文件但我想要的是在输入文本行中显示验证消息警报例如在电子邮件输入中请填写电子邮件地址但现在它出现在所有字段下在我的html中
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
如何从 Retrofit2 获取字符串响应？

我正在做 android 正在寻找一种方法来执行超级基本的 http GET POST 请求我不断收到错误 java lang IllegalArgumentException Unable to create converter for
重写 URL，将 ID 替换为查询字符串中的标题

我对 mod rewrite 很陌生但我做了一些搜索但找不到这个问题的答案我有一个网站它只有一个 PHP 页面根据查询字符串中传递给它的 ID 提供数十页内容我想重写 URL 以便此 ID消失并替换为从数据库中提取的页面标题例
使用 EWS 托管 API 为其他用户创建约会？

在 EWS 托管 API 中可以轻松地为特定用户创建约会 ExchangeService service new ExchangeService service Credentials new NetworkCredentials adm
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
SQLite + SpatiaLite 问题

我正在尝试使用 System Data SQLite 提供程序从 C 访问 SpatiaLite 当我尝试加载 SpatiaLite 扩展时我总是得到 System Data SQLite SQLiteException SQLite e
具有 Firebase (FCM) 推送通知的 Node js

我正在使用 Node js 开发 REST api 并且有一个休息端点来发送 firebase 推送通知我的代码如下 const bodyParser require body parser var cors require cors v
Renderscript 示例构建错误

所以我想尝试使用 RenderScript 的示例并在 Eclipse 中导入了 HelloWorld 但它给了我这样的错误 2011 10 25 13 10 48 HelloWorld home mileoresko workspace
如何使用open xml sdk获取word文档的所有合并字段

我是初学者打开xml sdk 我试图找出文档的所有合并字段但我没有得到页眉和页脚合并字段任何人都可以提出一个可行的解决方案吗我正在尝试这样的事情 foreach FieldCode field in docGenerated Main
使用位操作查找字符串中的重复项时出现问题

我认为我已经实现了正确的逻辑来查找字符串是否包含重复项但即使在终端中没有打印任何内容我也无法理解为什么会这样那么我在这个程序中犯了哪些错误任何人都可以解释为什么它不起作用 include
如何以编程方式断开拨出呼叫

我使用以下代码以编程方式断开呼叫但它不起作用 private void callDisconnect try TelephonyManager manager TelephonyManager this getSystemService
提升条件变量 - 对“notify_one”的调用是否堆栈？

在使用 Boost 线程的单个生产者单个消费者应用程序中如果生产者线程多次调用cond var notify one 在消费者线程调用之前cond var wait lock 是否会额外致电notify one被堆叠起来这样每次调用
使用 SSRS ASP.NET ReportViewer 和 Web 服务进行 Windows 身份验证

我目前在使用 SSRS 时遇到一些问题我有一个使用 Windows 身份验证的 ASP NET 网站这工作正常我知道网站当前用户是当前登录的用户此站点上有一个 Web 表单 ReportViewer 当我不设置凭据时这工作正常然
面向对象编程语言中的引用默认情况下是否应该不可为空？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何在 Html.ValidationSummary 中指定数据注释错误的顺序

我使用以下命令在表单上显示错误我的域对象继承自基类我发现基类数据注释属性显示在列表底部这违背了它们在我的表单中出现的顺序有什么方法可以指定错误的显示顺序吗 Example public class ClassA Required p
防止浮动换行，直到元素达到最小宽度

我有可变宽度的 HTML 布局内容左侧有一个固定宽度的菜单 div 可变宽度由 css max width 和 min width 设置对于非常窄的浏览器窗口我希望内容包裹在菜单下方我目前通过设置来实现这一点float left在
hive - 在值范围之间将一行拆分为多行

我在下面有一张表想按从开始列到结束列的范围拆分行即 id 和 value 应该对开始和结束之间的每个值重复包括两者 id value start end 1 5 1 4 2 8 5 9 所需输出 id value current

hive - 在值范围之间将一行拆分为多行

hive - 在值范围之间将一行拆分为多行 的相关文章

随机推荐

热门标签

hive - 在值范围之间将一行拆分为多行的相关文章