查找每个逗号后的第二个空格

2024-04-11

This is a follow up to this question: Concatenate previous and latter words to a word that match a condition in R https://stackoverflow.com/questions/58551389/concatenate-previous-and-latter-words-to-a-word-that-match-a-condition-in-r

我正在寻找一个正则表达式,它可以在逗号之后的第二个空格处分割字符串。看下面的例子:

vector <- c("Paulsen", "Kehr,", "Diego", 
            "Schalper", "Sepúlveda,", "Alejandro",
             "Von Housen", "Kush,", "Terry")

X <- paste(vector, collapse = " ")
X

## this is the string I am looking to split:
"Paulsen Kehr, Diego Schalper Sepúlveda, Diego Von Housen Kush, Terry"

每个逗号后的第二个空格是我的标准regex /questions/tagged/regex。所以,我的输出将是:

"Paulsen Kehr, Diego"
"Schalper Sepúlveda, Alejandro"
"Von Housen Kush, Terry"

我想出了一个模式,但不太有效。

[^ ]+ [^ ]+, [^ ]+( )

与它一起使用strsplit删除所有单词而不是在 group-1 处拆分(即[^ ]+ [^ ]+, [^ ]+(group-1)) 仅有的。我想我只需要排除完整的匹配项并仅与后面的空格匹配。 --正则表达式演示 https://regex101.com/r/z383ig/17

strsplit(X, "[^ ]+ [^ ]+, [^ ]+( )")

# [1] "" [2] "" [3] "Von Housen Kush, Terry"

谁能想到一个regex /questions/tagged/regex为了找到每个逗号后的第二个空格?


您可以使用

> strsplit(X, ",\\s+\\S+\\K\\s+", perl=TRUE)
[[1]]
[1] "Paulsen Kehr, Diego"           "Schalper Sepúlveda, Alejandro" "Von Housen Kush, Terry"

See the 正则表达式演示 https://regex101.com/r/1BRzKj/1

Details

  • ,- 一个逗号
  • \s+- 1+ 空格
  • \S+- 1+ 个非空格
  • \K- 匹配重置运算符丢弃迄今为止匹配的所有文本
  • \s+- 1+ 空格
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

查找每个逗号后的第二个空格 的相关文章

  • 如何通过 .htaccess 删除 URL 中任何位置的空参数或参数?

    我的意思是空参数可以在 URL 中的任何位置 每次不同的位置 每次使用不同的名称 每次在不同的 php 页面上 例如 http www example com AnyPHPpageHere php parameter1 7 paramete
  • 使用 2 个向量参数翻转函数

    我想对需要 2 个向量参数的函数应用滚动 这是使用 data table 的示例 不起作用 library data table df lt as data table cbind data frame x 1 100 y 101 200
  • 根据 R 中的字符串模式选择行

    假设我有以下数据 df lt data frame name c TO for Turnover for people HC people Hello world beenie man apple pears TO is number c
  • 如何在 Perl 中找到正则表达式匹配的位置?

    我需要编写一个接收字符串和正则表达式的函数 我需要检查是否有匹配并返回匹配的开始和结束位置 正则表达式已经由qr 该函数还可能收到一个 全局 标志 然后我需要返回所有匹配的 开始 结束 对 我无法更改正则表达式 甚至无法添加 用户可能使用的
  • 如何在R中将英尺转换为厘米?

    我得到了一个高度的字符向量 如下所示 859 5 10 5 8 5 11 6 0 5 10 6 2 5 11 6 2 6 2 5 7 5 9 5 7 6 1 6 0 5 11 6 0 6 5 6 1 6 1 5 10 5 11 5 11 6
  • 在防风草模型上使用 VIP 包计算重要性度量

    我正在尝试使用 vi firm 在防风草中制作的逻辑回归模型上计算特征重要性 对于正则表达式 我将使用 iris 数据集并尝试预测观察结果是否为 setosa iris1 lt iris gt mutate class case when
  • 正则表达式提取美国邮政编码,但不提取假代码

    使用 XML 包和 XPath 从网站上抓取地址 有时我只能得到一个嵌入了我想要的邮政编码的字符串 提取邮政编码很简单 但有时会显示其他五位数字的字符串 以下是 df 中问题的一些变体 zips lt data frame id seq 1
  • 提取单花括号内的值

    我想要一个收藏 value 一个字符串使用正则表达式 例如 lorem ipsum field1 lorem ipsum field2 lorem ipsum field1 lorem ipsum field2 field3 我会得到 fi
  • R中使用余弦距离的层次聚类

    我想通过使用余弦相似度与 R 编程语言对文档语料库进行层次聚类 但出现以下错误 if is na n n gt 65536L stop 大小不能为 NA 或 超过 65536 需要 TRUE FALSE 时缺少值 我应该怎么办 为了重现它
  • XLConnect 无法确定 JAVA_HOME 错误

    感谢您的帮助 我正在尝试运行 XLconnect 但收到此错误消息 gt library XLConnect lib loc C Users 1144143929 Documents R win library 2 15 Error onL
  • 跨类别和列自动化卡方

    我有一个调查数据框 其中包含几个问题 列 编码为 1 同意 0 不同意 受访者 行 根据 年龄 年轻 中年 老年 地区 东 中 西 等指标进行分类 大约有30个类别总共 3个年龄 3个地区 2个性别 11个职业等 在每个指标中 类别不重叠且
  • 所有语言中特殊字符的 Java 正则表达式

    在我的用户输入字段中 我想允许某些特殊字符 字母和数字的组合 我应该确保正则表达式模式在输入时允许此设置任何语言 基本上我构建的这个正则表达式也应该支持 unicode 表示 如何使用 Java 中的 Pattern 类来实现这一点 这里给
  • 具有数组属性的 IFC 正则表达式

    IFC 是用于建筑项目的 STEP 文件的变体 IFC 包含有关正在建造的建筑物的信息 该文件基于文本 易于阅读 我正在尝试将这些信息解析为 python 字典 每行的一般格式类似于以下内容 第2334章 IFCMATERIALLAYERS
  • 在ggplot2中,箱线图线的末尾代表什么?

    我找不到箱线图线条端点代表什么的描述 For example here are point values above and below where the lines end 我意识到盒子的顶部和底部是第 25 个和第 75 个百分位数
  • 如何不显示 ggplot 轴上的所有标签?

    I m trying to using ggplot2 to plot this But as you can see on the x axis you can t read anything 那么如何在 x 轴上显示每 10 年的值呢
  • 来自大型数据帧的共现

    我有一个数据框 其中包含有关每个用户访问过哪些城市的信息 df visited lt data frame user c john john claire claire doe doe city c Antananarivo Barcelo
  • Notepad++:: 通过正则表达式完全删除包含问号的行

    嗯 我想这就是我的标题 这对于我将要实现的目标来说是不言自明的 这是我当前的文本文件的示例 Diva was the winning song of the Eurovision Song Contest 1998 Who will win
  • R 获取子字符串和正则表达式?

    我有一组文件名字符串 我想提取 符号之后但文件扩展名之前的所有字符 例如 文件名之一是 HelloWorld you txt 我想返回字符串you 这是我的代码 hashPos grep name fixed TRUE dotPos len
  • R中具有特定条件的多列变异

    我有这个数据 M1 M2 M3 UCL 1 2 3 1 5 我想在这种情况下创建新列 如果M1大于UCL MM1将为 UP 否则为 NULL 如果M2大于UCL MM2将为 UP 否则为 NULL 如果M3大于UCL MM3将为 UP 否则
  • 解压 R 数据框中的列表

    我有一个dataframe其中一个字段包含不同长度的列表 我想将该字段中列表的每个元素提取到其自己的字段中 以便我可以将结果收集到一个很长的字段中dataframe每个列表元素都有一个 id 这是一个例子dataframe dat lt s

随机推荐

  • Laravel 错误:请提供有效的缓存路径

    我克隆了一个 Laravel 5 2 项目 当我执行composer install时 出现错误 InvalidArgumentException Please provide a valid cache path 这些文件夹存在 stor
  • 有用的二进制差异工具(除了 msdn[apatch 和 mpatch]、xdelta、bsdiff、vbindiff 和 winmerge)[关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我需要一个二进制 diff 工具 它可以从比较的 8MB 文件 dat 压缩文件 生成补丁文件 并且可以将生成的补丁文件合并到旧的 dat
  • 返回“System.Byte[]”而不是实际数据

    此代码旨在计算并打印桌面上文件的 MD5 哈希值 但是 在编译时 写入控制台窗口的所有内容都是 System Byte 放置 ToString 也没有解决问题 MD5 a MD5 Create Console Write a Compute
  • 使用 -fopenmp 和 -lgomp 链接 OpenMP 之间的区别

    最近几天我一直在努力解决一个奇怪的问题 我们使用 GCC 4 8 创建一些库 静态链接它们的一些依赖项 例如 log4cplus 或 boost 对于这些库 我们使用 boost python 创建了 Python 绑定 每次这样的库使用
  • 如何绘制这样的自定义颤动边框?

    我想要有关如何实现自定义边框的想法 如下图所示 我制造了一个CustomPainter绘制形状 class MyPainter extends CustomPainter Color color MyPainter required thi
  • Go 中 int 到 string 的转换是如何工作的?

    我今天才开始使用 Go 所以这可能是显而易见的 但我找不到任何内容 什么是var x uint64 0x12345678 y string x give y I know var x uint8 65 y string x 会给y字节 65
  • 在 Android 中使用共享首选项与捆绑包

    我正在制作的应用程序从数据库中的表中检索 1 到 2 打记录 以便在应用程序期间可以使用某些数据 该表有 6 个字段 它不需要永久存储在设备上 共享首选项是否用于类似的事情 或者我应该使用捆绑包 您可以只查询数据库并获取所需的数据并将其以正
  • 如何关闭所有 pyplot 窗口(包括之前脚本执行的窗口)?

    所以我有一些 python 代码 使用 pyplot 绘制一些图表 每次运行脚本时都会创建新的绘图窗口 我必须手动关闭该窗口 如何在脚本开始时关闭所有打开的 pyplot 窗口 IE 关闭先前执行脚本期间打开的窗口 在 MatLab 中 这
  • if (x==0||7||14||21||-7||-14) {y=星期四;} [关闭]

    这个问题不太可能对任何未来的访客有帮助 它只与一个较小的地理区域 一个特定的时间点或一个非常狭窄的情况相关 通常不适用于全世界的互联网受众 为了帮助使这个问题更广泛地适用 访问帮助中心 help reopen questions 你能像这样
  • 使用 Google Analytics 跟踪 XML Web 服务上的点击次数

    我有一个 xml Web 服务 我想使用 Google Analytics 进行跟踪 由于它使用小型客户端 JavaScript 来进行跟踪 因此这是一个问题 是否可以在不运行 javascript 客户端服务器端的情况下解决此问题 也许这
  • Sails.js 如何修改路由以解释逗号分隔的 id 列表

    根据一些 JSON API 规范 例如http jsonapi org format urls individual resources http jsonapi org format urls individual resources 服
  • Bash:执行存储在变量中的命令[重复]

    这个问题在这里已经有答案了 我正在编写一个脚本 其中一部分没有按我的预期工作 为了简单起见 我在一个简单的例子中分解了这一部分 echo echo gt tmp while read cmd do cmd done 在这里 我希望 cmd
  • mongodb有路径通配符吗?

    我有一个 mongodb 集合 其中每个文档都有一个树结构 第一个级别是国家 地区代码 第二个级别是操作系统 第三个级别是处理器类型 最后的值是性能分数 AU OSX x86 64 17 4 RU Android A9 14 2 x86 7
  • 如何从Excel中读取数据并逐行写入文本文件?

    我想编写代码从 Excel 获取数据并将其写入文本文件 这是我的代码 import xlrd import os path wb xlrd open workbook os path join D TRB 2014 Data SPS1 de
  • 为什么 std::string 不是 std::vector 的特化? [复制]

    这个问题在这里已经有答案了 将字符串视为字符向量似乎是显而易见的 那么为什么 string 有它自己的特殊实现 它看起来与向量类有很大不同呢 只是为了说明这一点 这里有两个课程的一些片段 以表明所需的工作非常相似 例如两者都使用分配器来管理
  • 页面刷新期间的 selenium.common.exceptions.StaleElementReferenceException

    页面包含一些数据 行数很少的表 有 刷新 按钮 可以重新加载和重新绘制页面上的某些元素 而无需重新加载静态数据 ajax 我正在尝试为该页面创建适当的测试 但有时会出现 StaleElementReferenceException 我的代码
  • 多元二分法

    我需要一种算法来执行二维二分法来解决 2x2 非线性问题 示例 两个方程f x y 0 and g x y 0我想同时解决这个问题 我非常熟悉一维二分 以及其他数值方法 假设我已经知道解决方案位于界限之间x1 lt x lt x2 and
  • 在 Android 上的活动之间保持蓝牙连接 [重复]

    这个问题在这里已经有答案了 可能的重复 Android 如何将蓝牙连接传递给另一个活动 https stackoverflow com questions 6872970 android how to pass a bluetooth co
  • 默认情况下,PHPUnit 模拟对象从未期望过

    如果没有正式定义的期望 有没有办法告诉 phpunit 模拟对象永远不要期望方法调用 在我看来 不要对每种方法都抱有期望是没有道理的 所以 phpunit 没有任何功能 仅当您想完全确保某些方法不会被调用时 才应使用 从不 期望 无论如何
  • 查找每个逗号后的第二个空格

    This is a follow up to this question Concatenate previous and latter words to a word that match a condition in R https s