Hive alter table 更改列名称为重命名的列提供“NULL”

2024-02-25

我曾尝试将表中的现有列重命名为新列。但名称更改后，新列只给我“NULL”值。

Parquet 中表的存储格式。

例如，

“user”是“Test”表中字符串数据类型的列。插入了值为“John”的示例记录。

Select user from Test;

结果：约翰

我已将“user”重命名为“user_name”，但没有更改任何数据类型。

ALTER TABLE Test CHANGE user user_name String;

Select user_name from Test;

结果：空

请让我知道如何解决这个问题？

MSCK 修复表命令在这种情况下是否有用？

我是否需要再次重新加载此表来解决此问题？

问候，阿达什·K·S

您可以做的是添加新字段，执行一次插入覆盖，然后删除旧字段。像这样的事情：

ALTER TABLE temp.Test ADD COLUMNS (user_new string) CASCADE;

insert overwrite table temp.Test
select 
      user_a,
      a,
      b,
      c,
      user_a as user_new
from temp.test;

ALTER TABLE temp.test  REPLACE COLUMNS(user_new string, a string, b string, c string );

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

hive

Bigdata

HiveQL

parquet

Hive alter table 更改列名称为重命名的列提供“NULL” 的相关文章

Python 包安装：pip 与 yum，还是两者一起安装？

我刚刚开始管理 Hadoop 集群我们使用 Bright Cluster Manager 直至操作系统级别 CentOS 7 1 然后使用 Ambari 以及适用于 Hadoop 的 Hortonworks HDP 2 3 我不断收到安装
覆盖hadoop中的log4j.properties

如何覆盖hadoop中的默认log4j properties 如果我设置 hadoop root logger WARN console 它不会在控制台上打印日志而我想要的是它不应该在日志文件中打印 INFO 我在 jar 中添加了一个
为什么我们需要将外部表移动到托管 Hive 表？

我是 Hadoop 新手正在学习 Hive 在 Hadoop 权威指南第 3 版中第 12 页第428章最后一段我不明白下面关于 HIVE 中外部表的段落一种常见的模式是使用外部表访问存储在 HDFS 中的初始数据集由另一个进
无法在 Presto 中读取数据 - 在 Hive 中可以读取数据

我有一个 Hive DB 我创建了一个与 Parquet 文件类型兼容的表 CREATE EXTERNAL TABLE default table date date udid string message token string PAR
Hive NVL 不适用于列的日期类型 - NullpointerException

我正在使用 HDFS 上的 MapR Hive 发行版并面临以下问题如果表的列类型是日期类型则NVL https cwiki apache org confluence display Hive LanguageManual UDF
如何强制 Spark 执行代码？

我如何强制 Spark 执行对 map 的调用即使它认为由于其惰性求值而不需要执行它我试过把cache 与地图调用但这仍然没有解决问题我的地图方法实际上将结果上传到 HDFS 所以它并非无用但 Spark 认为它是无用的简短回
如何对 RDD 进行分区

我有一个文本文件其中包含大量由空格分隔的随机浮动值我正在将此文件加载到 scala 中的 RDD 中这个RDD是如何分区的另外是否有任何方法可以生成自定义分区以便所有分区都具有相同数量的元素以及每个分区的索引 val dRDD
使用 awk 处理多个文件

我必须使用 awk 处理大量 txt 文件每个文件 1600 万行我必须阅读例如十个文件 File 1 en sample 1 200 en n sample 2 10 en sample 3 10 File 2 en sample 1
在 Google Cloud Dataproc 环境中使用 Hadoop 流式处理运行 python map reduce 作业时出错

我想使用 hadoop 流方法在 Google Cloud Dataproc 中运行 python map reduce 作业我的map reduce python脚本输入文件和作业结果输出位于Google Cloud Storage中
如何用snappy解压hadoop的reduce输出文件尾？

我们的 hadoop 集群使用 snappy 作为默认编解码器 Hadoop作业减少输出文件名就像part r 00000 snappy JSnappy 无法解压缩文件 bcz JSnappy 需要以 SNZ 开头的文件归约输出文件以某种
使用 MySQL 作为元存储从 HIVE 查询元数据

我正在寻找一种使用 HiveQL 命令查询 HIVE 数据元数据的方法我配置了一个 MySQL 元存储但需要通过 HIVE 命令查询元数据因为然后我想通过 ODBC 连接到 HIVE 系统来访问数据要从 Hive 查看它们必须使用
Hive 聚集在多个列上

据我所知当配置单元表聚集在一列上时它会执行该分桶列的哈希函数然后将该行数据放入其中一个桶中每个桶都有一个文件即如果有 32 个桶那么 hdfs 中就有 32 个文件将 clustered by 放在多个列上意味着什么例如假
将数据从 .txt 文件加载到 Hive 中以 ORC 形式存储的表

我有一个数据文件位于 txt格式我正在使用该文件将数据加载到 Hive 表中当我将文件加载到类似表中时 CREATE TABLE test details txt visit id INT store id SMALLINT STORE
Hadoop - 直接从 Mapper 写入 HBase

我有一个 hadoop 作业其输出应写入 HBase 我并不真正需要减速器我想要插入的行类型是在映射器中确定的如何使用 TableOutputFormat 来实现此目的从所有示例中我看到的假设是 reducer 是创建 Put 的
在 Spark 2.1.0 中启用 _metadata 文件

Spark 2 1 0 中保存空 Parquet 文件似乎已损坏因为无法再次读入它们由于模式推断错误我发现从 Spark 2 0 开始写入 parquet 文件时默认禁用写入 metadata 文件但我找不到重新启用此功能的配置设
通过Oozie命令行指定多个过滤条件

我正在尝试通过命令行搜索一些特定的 oozie 作业我使用以下语法进行相同的操作 oozie jobs filter status RUNNING status KILLED 但是该命令仅返回正在运行的作业而不是已杀死的作业需要帮助
Hadoop 作业：任务在 601 秒内无法报告状态

在伪节点上运行 hadoop 作业时任务失败并被杀死错误任务尝试在 601 秒内无法报告状态但同一个程序正在通过 Eclipse 运行本地作业任务大约有 25K 个关键字输出将是所有可能的组合一次两个即大约 25K 2
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
通过 Java 连接 Apache Drill

在 Apache Drill 的 Wiki 中我只能看到通过 SqlLine 客户端运行的查询除了 REST API 之外是否有任何编程方式可以在 Drill 中运行查询有任何示例或指示吗或者它与使用 JDBC 驱动程序运行 SQ
谷歌的Dremel是什么？它与 MapReduce 有什么不同？

谷歌的 Dremel 是此处描述 http research google com pubs pub36632 html Dremel 和 Mapreduce 有什么区别 Dremel http research google com pu

随机推荐

将 MultiIndex 列合并到 pandas 数据框中的单个索引

在我的代码中我将 2 个数据库集成到 1 个数据库中问题是当我向数据库中再添加一列时结果与预期不符使用Python 2 7 code import pandas as pd import pandas io formats exce
laravel 会话返回 null 尽管设置它

只是原生 php 中的一个简单函数 protected function some function session start if isset SESSION a SESSION a some value return true els
如何让我的班级充满活力？

我想要一个带有一个附加属性的字符串比如说是以红色还是绿色打印它子类化 str 不起作用因为它是不可变的我看到了它的价值但它可能很烦人多重继承有帮助吗我从来没有用过那个仅继承 object 并使用 self value str
什么可能导致 imagecolorsforindex() 出现“颜色索引超出范围”错误？

当对一大堆 JPG PNG 和 GIF 文件进行补丁大小调整时 PHP 意外地死机并显示以下错误消息 imagecolorsforindex function imagecolorsforindex 颜色索引 226 超出范围相关代码片
AspectJ - 更改方法参数的值

我想要这样的东西 public void doSomething ReplaceFooBar String myString ReplaceFooBar是我的自定义注释其值应为myString并做一个replaceAll在方法开始执行之前
PipEnv：如何处理本地安装的 .whl 包

我正在使用 PipEnv 设置一个项目以及一些我需要从预编译的二进制文件安装的包在以前的项目中我只是将某些本地文件夹中的 whl 文件安装到我的环境中但这似乎会导致锁定文件出现问题如果其他人尝试从存储库安装因为 pipfile
使用 -NoExit 启动 PowerShell 不起作用

需要在 PowerShell 中启动多个作业但它们应该位于不同的会话中因此要启动一个可以使用 Start Process powershell ArgumentList command Get Process noexit nopr
在 woocommerce 结帐页面自定义字段中添加日期

我正在尝试在 woocommerce 结帐页面中添加自定义选择选项它正在添加额外的字段但我想在选择选项的值中添加日期有什么解决办法吗这是我在主题 function php 中添加的代码 today new DateTime tomo
tfs：如何解锁更改

我最初编辑了一个文件该文件进行了结帐我收到了一台新电脑现在我想编辑该文件我不关心原始编辑 TFS 报告另一个用户对该文件具有独占锁定它实际上不是另一个用户而是我但机器不同因此工作空间不同我尝试使用以下命令通过 tf 命令行
在海量数据集上学习决策树

我正在尝试使用 MATLAB 从巨大即无法存储在内存中数据集构建二元分类决策树本质上我正在做的是收集所有数据 Try out n数据的决策函数选出最佳决策函数 https stackoverflow com questions
为不受支持的语言选择本地化

我有 en 和 ru 语言的本地化如果用户选择任何其他语言 fr de 我需要显示俄语本地化变体我尝试将 info plist 中的本地化本机开发区域更改为 ru 俄语但在使用不受支持的语言时它始终显示英语有相关问题 http
iFrame 内的 cordova 回调

我使用 cordova 和 nanohttpd 创建了一些 Android Web 应用程序主页是通过 localhost url 从 nanohttp 加载的主页包含一个 iFrame 它从与主页相同的域 localhost 加载一些
将 nd 数组转换为键、值字典

python中是否有一个函数可以将nd数组转换为字典其中key是索引元组 value是该索引处的矩阵值例如 A np random random 3 4 5 Result i j k A i j k 当然你可以使用np ndenume
在 iPhone SDK 中实现 Core-Plot 时出现错误：“CorePlot-CocoaTouch.h：没有这样的文件或目录”

当我尝试在 iPhone 应用程序中实现 Core Plot 时出现以下错误 CorePlot CocoaTouch h 没有这样的文件或目录我从下面的链接下载安装了 Core plot 包 http code google com p
通过电子邮件将 Sparkline 图表作为 Google Sheets 范围内的图像/博客/png 发送

我尝试将此解决方案应用于我的案例通过电子邮件发送 SPARKLINE 图表会发送空白单元格而不是数据 https stackoverflow com questions 50133870 emailing sparkline charts
S3方法帮助（roxygen2）

我正在尝试在包中使用 S3 方法并认为在此处提出问题后我明白了如何设置它使用 Roxygen 构建 R 包时 S3 方法一致性警告 https stackoverflow com questions 14237018 s3 method
如何在声明式管道中使用 NodeLabel 参数插件

我正在尝试将我的自由式作业转换为声明性管道作业因为管道提供了更大的灵活性我不知道如何使用 NodeLabel 参数插件 https wiki jenkins io display JENKINS NodeLabel Parameter
如何为提交按钮添加事件监听器

我在这个 html 上遇到了很多麻烦我正在尝试向提交按钮添加事件侦听器以便最终可以更改文档以显示表单信息问题是当填写表单时按钮侦听器不执行任何操作它可以在 jsfiddle 和其他类似的东西中工作但不能作为独立文件工作这让我
div 中的水印背景图片

我想从存储的图像创建水印但水印会影响上层并缩小所有分区的颜色 div style background url blogthreadlist blogUri no repeat background position center di
Hive alter table 更改列名称为重命名的列提供“NULL”

我曾尝试将表中的现有列重命名为新列但名称更改后新列只给我 NULL 值 Parquet 中表的存储格式例如 user 是 Test 表中字符串数据类型的列插入了值为 John 的示例记录 Select user from Test

Hive alter table 更改列名称为重命名的列提供“NULL”

Hive alter table 更改列名称为重命名的列提供“NULL” 的相关文章

随机推荐

热门标签