REGEXP_REPLACE 捕获组

2024-01-05

我想知道是否有人可以帮助我了解如何使用 Hive 的 regexp_replace 函数来捕获正则表达式中的组并在替换字符串中使用这些组。

我正在解决一个涉及日期修改的示例问题。在此示例中，我的目标是获取与 SimpleDateFormat 解析不兼容的字符串日期，并进行一些小的调整以使其兼容。日期字符串（如下所示）需要在字符串中的偏移符号 (+/-) 前面添加“GMT”。

因此，给定输入：

  '2015-01-01 02:03:04 +0:00' 
  -or-
  '2015-01-01 02:03:04 -1:00'

我想要输出：

  '2015-01-01 02:03:04 GMT+0:00'
  -or-
  '2015-01-01 02:03:04 GMT-1:00'

这是一个我“认为”可行的语句的简单示例，但我得到了奇怪的输出。

蜂巢查询：

select regexp_replace('2015-01-01 02:03:04 +0:00', ' ([+-])', ' GMT\1');

实际结果：

2015-01-01 02:03:04 GMT10:00

请注意，“\1”应该输出匹配的组，而是用数字“1”替换匹配的组。

有人可以帮助我理解在替换字符串中引用/输出匹配组的正确方法吗？

Thanks!

Hive 支持的正则表达式反向引用符号（至少在 0.14 中是这样，我想我记得在 0.13.x 中也是这样）似乎是$1对于捕获组 1，$2对于捕获组 2 等。看起来它基于（甚至可能由其实现）Matcher 类中的 ReplaceAll 方法 http://docs.oracle.com/javase/7/docs/api/java/util/regex/Matcher.html#replaceAll%28java.lang.String%29。这是该文档的相关部分：

如上所述，美元符号可以被视为对捕获的子序列的引用，并且反斜杠用于转义替换字符串中的文字字符。

所以我认为你想要的是这样的：

select regexp_replace('2015-01-01 02:03:04 +0:00', ' ([+-])', ' GMT$1');

例如：

hive> select regexp_replace('2015-01-01 02:03:04 +0:00', ' ([+-])', ' GMT$1');
OK
2015-01-01 02:03:04 GMT+0:00
Time taken: 0.072 seconds, Fetched: 1 row(s) 
hive> select regexp_replace('2015-01-01 02:03:04 -1:00', ' ([+-])', ' GMT$1');
OK
2015-01-01 02:03:04 GMT-1:00
Time taken: 0.144 seconds, Fetched: 1 row(s)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

REGEXP_REPLACE 捕获组的相关文章

使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
Perl 非贪婪

我遇到非贪婪正则表达式 regex 的问题我已经看到有关于非贪婪正则表达式的问题但它们没有回答我的问题 Problem 我正在尝试匹配 lol 锚点的 href Note 我知道这可以通过 Perl HTML 解析模块来完成我的问题是
为什么我只得到第一个捕获组？

https stackoverflow com a 2304626 6607497 https stackoverflow com a 2304626 6607497 and https stackoverflow com a 370042
在 SQLite 中搜索时排除 HTML 标签和一些 UNICODE 字符

更新 4 我已经成功运行了firstchar例如但现在的问题是使用regex 即使包含头文件它也无法识别regex操作员有什么线索可以解决这个问题吗更新 2 我已经编译了sqlite3我的项目中的库我现在正在寻找任何人帮助我为我的
如何在hadoop mapreduce/yarn中设置VCORES？

以下是我的配置 mapred site xml map mb 4096 opts Xmx3072m reduce mb 8192 opts Xmx6144m yarn site xml resource memory mb 40GB min
如何使用正则表达式将多个
标签替换为一个
标签？

I want br br 变成 br 正则表达式的模式是什么注 br 标签可以连续出现两次以上 html preg replace br gt s i br html 这将捕获任何组合 br br or br 它们之间有任意数量或类型的空
用于多行字符串的 ECMAScript 正则表达式

我正在为我的应用程序编写加载过程它涉及从文件中读取数据并创建具有适当属性的适当对象该文件由以下格式的连续条目以换行符分隔组成 OBJECT TYPE
删除emacs中多余的空行

M x flush lines 删除缓冲区中的所有空白行但是我只想删除多余的空白行也就是说如果有n个连续的空白行我想删除n 1并保留一个我知道删除空白行可以完成该点下的空白行的工作但是我想要一个适用于整个缓冲区的简单解决方案有什
插入 Hive 表 - 非分区表到具有多个分区的分区表 - 无法插入目标表，因为列号/类型

当我尝试插入分区表时出现以下错误 SemanticException 错误 10044 第 1 23 行无法插入目标表因为列号类型不同表 insclause 0 有 6 列这 3 列已分区我们不需要任何必须从中转储存储的过滤器
正则表达式（第一个字符匹配 a-z）

我有这个正则表达式 a zA Z0 9 上面我想补充的是第一个字符只能是a zA Z 我怎样才能制作这个正则表达式尝试这样的事情 a zA Z a zA Z0 9 解释 Start of line string a zA Z Chara
C++ 正则表达式，未知转义序列 '\.'警告

我第一次尝试在 C 中使用正则表达式我对转义序列有点困惑我只是想匹配字符串开头的点为此我使用表达式它有效但我的编译器 g 生成警告 warning unknown escape sequence regex self regex
如何使用 log4j 自定义附加程序在 HDFS 上创建日志？

Overview 我们希望使用 log4j 记录 Spark 作业活动并将日志文件写入 HDFS Java 8 Spark 2 4 6 Scala 2 1 2 Hadoop 3 2 1 我们无法找到本地 apache log4j 附加程序
Spark中如何获取map任务的ID？

Spark中有没有办法获取map任务的ID 例如如果每个映射任务都调用用户定义的函数我可以从该用户定义的函数中获取该映射任务的 ID 吗我不确定您所说的地图任务 ID 是什么意思但您可以使用以下方式访问任务信息TaskContext
正则表达式将从文本文件中提取句子

我需要一个正则表达式来从文本文件中提取句子示例文本以 2004 年底发生的亚洲海啸灾难为例对 Google 新闻 http news google com 的查询在一个月内 1 月 17 日返回了超过 80 000 篇有关该事件的在
使用正则表达式、kibana 搜索数组中的元素

我正在搜索包含数组字段的记录payload params 我想显示包含该字符串的所有字段aabb 例子 payload params 3raabb 44aabb66 grgeg 展示 3raabb 44aabb66 如何在数组上使用正则表达
Hive：为现有文件夹结构添加分区

我在 HDFS 中有一个文件夹结构如下所示但是实际上没有使用以下命令在表上创建分区ALTER TABLE ADD PARTITION命令即使文件夹结构的设置就像表有分区一样如何自动将所有分区添加到Hive表中 Hive 1 0 外
在 Python 中解析 TCL 列表

我需要在双括号上拆分以空格分隔的 TCL 列表例如 OUTPUT 172 25 50 10 01 01 Ethernet 172 25 50 10 01 02 Ethernet Traffic Item 1 172 25 50 10 01
preg_match_all 查询仅显示有问题的外部组

我无法弄清楚如何只显示 preg 查询的外部组级别我会给你一个例子 preg match all start end input matches 这个输入start1 start2 2end 1end产生这个输出start1 start2
缺少依赖项 hive-builtins 会导致 Oozie 构建失败，错误代码为 410

我尝试从源代码构建 oozie 但安装失败我想安装 oozie 并热切地等待使用它我在这个阶段失败了当我从 oozie 3 3 3 目录给出 cmd 时 bin mkdistro sh DskipTests 我收到这个错误 INFO
检测并缩短字符串中的所有网址

假设我有一条字符串消息您应该将 file zip 上传到http google com extremelylonglink zip http google com extremelylonglink zip not https stack

REGEXP_REPLACE 捕获组

regex

Hadoop

hive

regexpreplace

REGEXP_REPLACE 捕获组的相关文章

使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

Perl 非贪婪

为什么我只得到第一个捕获组？

在 SQLite 中搜索时排除 HTML 标签和一些 UNICODE 字符

如何在hadoop mapreduce/yarn中设置VCORES？

如何使用正则表达式将多个
标签替换为一个
标签？

用于多行字符串的 ECMAScript 正则表达式

删除emacs中多余的空行

插入 Hive 表 - 非分区表到具有多个分区的分区表 - 无法插入目标表，因为列号/类型

正则表达式（第一个字符匹配 a-z）

C++ 正则表达式，未知转义序列 '\.'警告

如何使用 log4j 自定义附加程序在 HDFS 上创建日志？

Spark中如何获取map任务的ID？

正则表达式将从文本文件中提取句子

使用正则表达式、kibana 搜索数组中的元素

Hive：为现有文件夹结构添加分区

在 Python 中解析 TCL 列表

preg_match_all 查询仅显示有问题的外部组

缺少依赖项 hive-builtins 会导致 Oozie 构建失败，错误代码为 410

检测并缩短字符串中的所有网址

随机推荐

可以将嵌入图像提取到文件中吗？

linux批量重命名目录并从名称中删除#字符

我需要释放从 UIGraphicsGetCurrentContext() 返回的上下文吗？

Laravel - 1066 关系中的表/别名不唯一

写入一个或多个点的频率高于为指标配置的最大采样周期

Python，如何在 lambda 中展开元组？

CSRF验证失败。请求被中止。当我发送 POST 请求时

REGEXP_REPLACE 捕获组

REGEXP_REPLACE 捕获组 的相关文章

随机推荐

REGEXP_REPLACE 捕获组的相关文章