在空格处拆分 R 字符串，但当空格位于单引号之间时则不拆分

2024-02-06

我有一组丑陋且复杂的字符串，我必须将其拆分：

vec <- c("'01'", "'01' '02'", 
         "#bateau", "#bateau #batiment",
         "#'autres 32'", "#'autres 32' #'batiment 30'", "#'autres 32' #'batiment 30' #'contenu 31'",
         "#'34'", "#'34' #'33' #'35'")
vec
[1] "'01'"                                      "'01' '02'"                                
[3] "#bateau"                                   "#bateau #batiment"                        
[5] "#'autres 32'"                              "#'autres 32' #'batiment 30'"              
[7] "#'autres 32' #'batiment 30' #'contenu 31'" "#'34'"                                    
[9] "#'34' #'33' #'35'"

我需要在有空格的地方分割字符串（)，除非之间有空格'。所以在上面的例子中，'01' '02'会成为'01' and '02' while #'autres 32' #'batiment 30'会成为#'autres 32' and #'batiment 30'.

我尝试从中获得灵感这个问题 https://stackoverflow.com/questions/45811754/regex-match-everything-except-words-between-quotes，但并没有走远：

strsplit(vec, "(\\s[^']+?)('.*?'|$)")

因为这个解决方案分割了一些不应该的空间，也让我丢失了一些信息。

分割的结果应该是这样的：

res <- c("'01'", "'01'", "'02'", 
         "#bateau", "#bateau", "#batiment",
         "#'autres 32'", "#'autres 32'", "#'batiment 30'", "#'autres 32'", "#'batiment 30'", "#'contenu 31'",
         "#'34'", "#'34'", "#'33'", "#'35'")

分割该字符串的正确正则表达式是什么？

Thanks

您可以使用

strsplit(vec, "'[^']*'(*SKIP)(*F)|\\s+", perl=TRUE)

See the R demo https://rextester.com/KYOHV49816和正则表达式演示 https://regex101.com/r/SEa8PZ/1 online.

Details

'[^']*'(*SKIP)(*F) - '，然后是除' (see [^']*）进而'，然后丢弃这个匹配的文本，并从当前匹配失败的位置开始搜索下一个匹配（参见(*SKIP)(*F) https://stackoverflow.com/questions/24534782/how-do-skip-or-f-work-on-regex)
| - or
\s+- 1 个以上空白字符。

由于它是 PCRE 模式，因此perl=TRUE是强制性的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

regex

在空格处拆分 R 字符串，但当空格位于单引号之间时则不拆分的相关文章

在 R 中创建一个运行计数变量？

我有一个足球比赛结果的数据集我希望通过创建一组类似于世界足球 Elo 公式的运行评级来学习 R 我遇到了麻烦在 Excel 中看似简单的事情在 R 中并不完全直观例如 4270 个观察中的前 15 个具有必要的变量 date t 1
删除ggplot2中的负图区域[重复]

这个问题在这里已经有答案了如何删除 ggplot2 中 x 轴和 y 轴下方的绘图区域请参见下面的示例我尝试了几个主题元素 panel border panel margin plot margin 但没有任何运气 p lt ggpl
如何从 Fortran 调用 R 函数？

根据http gallery rcpp org articles r function from c http gallery rcpp org articles r function from c Rcpp 允许用户从 C 调用 R 函数
正则表达式接受 4 条规则中的 3 条

我似乎无法让正则表达式正确满足以下要求长度在 8 到 20 之间的字符串必须包含至少 1 个大写字母字符至少 1 个小写字母字符以及至少 1 个数字或至少 1 个特殊字符字符或两者假设特殊字符仅限于包括我最初是这样写的 A Z
纵向序列数据的三次样条方法？

我有一个串行数据格式如下 time milk Animal ID 30 25 6 1 31 27 2 1 32 24 4 1 33 17 4 1 34 33 6 1 35 25 4 1 33 29 4 2 34 25 4 2 35 24
通过间接引用列来修改数据框中的某些值

我正在整理一些数据我们将失败的数据分类到垃圾箱中并按批次计算每个分类箱的有限产量我有一个描述排序箱的元表这些行按升序测试顺序排列一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
将数据框中的每个 x 个字符拆分为字符串

我知道这里有一些关于每隔一段时间分割一个字符串的答案nth字符例如this one https stackoverflow com questions 23208490 split each character in r and this
.htaccess 异常导致主目录出现问题

这是我的目录结构 localhost or livehost app bootstrap public vendor code demo 这是我的 htaccess
Dendextend：关于如何根据定义的组为树状图的标签着色

我正在尝试使用一个名为 dendextend 的很棒的 R 包来绘制树状图并根据一组先前定义的组为其分支和标签着色我已阅读您在 Stack Overflow 中的答案以及 dendextend vignette 的常见问题解答但我仍然不
在 R 中绘制 Likert 变量的堆积条形图

假设我有一个如下所示的数据框 P Q1 Q2 1 1 4 1 2 2 3 4 3 1 1 4 其中的列告诉我哪个人相应地回答了问题 q1 q2 中的哪一个这些问题需要按照 4 分李克特量表进行回答例如批准表示 1 稍微批准表示 2
JavaScript：是否有完全支持环视的正则表达式库？

As JavaScript 的内置正则表达式库 https developer mozilla org en US docs Web JavaScript Guide Regular Expressions不支持向后看 http www r
pyomo + 网状错误 6 句柄无效

我正在尝试运行pyomo优化我收到错误消息 Error 6 The handle is invalid 不知道如何解释它环顾四周似乎与特权有关但我不太明白在下面找到完整的错误跟踪以及重现它的玩具示例完整的错误跟踪 py run f
正则表达式 '?' 的类似物（前一项可选）在T-SQL中像什么？

我想知道是否可以翻译包含的正则表达式前面的项目可选在 T SQL LIKE 模式中 DB 端无需任何操作例如 31 4 我可以将其分成几个子句但如果正则表达式包含很多这不太方便 LIKE不使用正则表达式并且它使用的模式语言没
使用先前的反向引用作为命名捕获组的名称

有没有办法使用对先前捕获组的反向引用作为捕获组的名称命名捕获组这可能不可能如果不可能那么这就是一个有效的答案下列 data description some description preg match data matches p
API 请求和curl::curl_fetch_memory(url, handle = handle) 中的错误：SSL 证书问题：证书已过期

几天前我运行了代码几个月没有任何问题 GET url myurl query 今天我遇到一个错误 Error in curl curl fetch memory url handle handle SSL certificate pro
以引用透明的方式从函数的省略号参数中提取符号

事情又发生了我正要按下发布答案按钮的问题被删除了我正在寻找一种方法来从函数的省略号参数中提取绑定到符号的对象的值以及符号也就是说我试图以引用透明的方式从省略号中提取符号我尝试过使用替代品和lazy dots 但没有成功 funct
使用 sed 删除大括号对之间的所有内容

我有一个看起来像这样的字符串 B F blue master F red f k b f k b K black B F green 我想删除匹配的子字符串它可能包含也可能不包含相同顺序的其他子字符串我应该得到 master 作为最终输
使用 Shiny 发布平行坐标图表时出现“错误：路径[1]="”：没有这样的文件或目录”

我有一个似乎很常见但我还没有找到解决方案的问题当尝试使用 rCharts Parcoords 发布 Web 应用程序时出现以下错误错误路径 1 没有这样的文件或目录奇怪的是该应用程序在我的笔记本电脑上运行得很好下面是我正在使用
相当于 min() 的 rowMeans()

我在 R 邮件列表上多次看到这个问题但仍然找不到满意的答案假设我有一个矩阵m m lt matrix rnorm 10000000 ncol 10 我可以通过以下方式获得每行的平均值 system time rowMeans m use
如何从 R keras 中的类似生成器的数据中评估（）和预测（）

我有以下代码数据集可以下载here https www dropbox com s qjt5o31oyqj10m8 data tar gz dl 0 or here https www kaggle com c dogs vs cats

随机推荐

使用 UIPageControl 减少点大小或填充以适应屏幕上的所有页面指示器

我有一个UIPageControl有 22 页因此有 22 个页面指示点在 iPhone 的横向模式下它们都是可见的左侧和右侧有足够的空间但在纵向模式下没有足够的水平空间来显示所有点至少在 iPhone 4 和 5 上因此两
尝试替换 JTable 中的布尔复选框渲染器/编辑器

我正在尝试创建一个允许收藏项目的 JTable 但不幸的是正确的图像不会在初始渲染中显示然后不会正确更新直到它们在单元格中失去焦点为此我将第 1 列设为字符串将第 2 列设为布尔值然后我根据这个问题覆盖了布尔渲染器编辑器 J
为什么 ABCPdf 代码开始生成窗口错误 5

我有一些长期存在的代码它们在相当长的一段时间内运行良好最近它开始生成以下错误首先在 asp 站点上然后在 Net MVC 站点上两者都没有改变我真的很好奇为什么这个错误现在正在上升我希望这篇文章对将来的人有用因为通过搜索错误
不同app之间可以使用NSNotificationCenter进行通信吗？

应用程序可以内部使用NSNotificationCenter让不同的部分相互通信但是可以扩展以便不同的应用程序可以使用它来通信吗 Edit 对于 iOS 与 OSX 之间的混淆表示抱歉我只添加了 iOS 标签我不知道如何谁为什么
如何使用 FXML 将工具提示添加到未实现 Control 的节点？

在 JavaFX 的子类中Control https docs oracle com javase 8 javafx api javafx scene control package summary html有一个工具提示属性这意味着可以
中断异常“_InternalLinkedHashMap ”不是类型“Map ”的子类型

我今天进行了 flutter 升级我现在使用 v0 2 11 在此函数中遇到奇怪的运行时错误 Future apiCall Map params const async loading true Map stringParams para
模式中的签名板不起作用（墨水与鼠标偏移）

我正在尝试使用签名板 https github com szimek signature pad issues new在引导模式中我在 div 中有一个画布 div class modal body div class signature
Delphi - 查找 Active Directory 用户的主要电子邮件地址

我正在寻找最佳方法来查找当前登录的 Active Directory 用户的主电子邮件地址使用GetUserName获取登录的用户名我见过Delphi 如何与 Active Directory 集成 https stackoverfl
由于等待时间较长，可替代 CURL

我目前使用 CURL 运行 PHP 脚本将数据发送到另一台服务器以运行可能需要一分钟才能运行的 PHP 脚本该服务器不返回任何数据但 CURL 请求仍然需要等待其完成然后加载原始页面的其余部分我希望我的 PHP 脚本将数据发送到其
bash 函数调用到底有多昂贵？

如果感兴趣的话是否有任何资料可以说明 Bash 中的函数调用到底有多昂贵我预计它们比直接执行其中的代码慢几倍但我似乎找不到任何关于此的信息我不太同意在 bash 中编程时性能不应该成为一个问题这实际上是一个很好的问题这是一个可能
引导扇区编程中的无限跳转有什么用

我正在读一本关于如何构建操作系统的书我浏览了这段代码所有代码所做的就是打印 hello 但我想了解更多关于无限跳转的信息 mov ah 0x0e mov al H int 0x10 mov al e int 0x10 mov al l
在 linq 中将行转换为列

我有以下查询 var query from q1 in lstAgentDetails join q2 in lstAgentMaterialPercentage on q1 Agent Id equals q2 AMP Agent Id
如何从 /var/tmp 更改默认的 Pear/PECL 构建文件夹？

我正在尝试在 Linux 上安装 PECL 软件包但安装程序从未通过配置阶段我的托管提供商在 var tmp 处安装了一个文件系统该系统阻止文件执行这导致了此错误 root host usr local apache conf in
是否可以在 ActionBar 上使用 TransitionDrawable？

我正在尝试使用 TransitionDrawable 在操作栏上制作一些彩色动画我正在尝试的代码非常简单在 onCreate 期间我将可绘制的过渡作为操作栏背景 Drawable d getResources getDrawable
Nuxt 使用双冒号对 URI 进行编码/解码

我的网址上有双冒号我推送一条到 Nuxt 路由器的路径其中有作为其中的一部分 export default router extendRoutes routes resolve routes push name custom path
从大端数据中提取记录

我有以下用于网络协议实现的代码由于协议是大端我想使用位顺序属性和高阶优先值但看来我犯了一个错误 With Ada Unchecked Conversion with Ada Text IO use Ada Text IO with S
如何访问 ArrayList 中的上一个/下一个元素？

我这样遍历 ArrayList for T t list 当我这样做时我从未想过我必须访问该元素的上一个和下一个元素现在我的代码很大如果我用以下方式重写它成本会很高 for int i 0 i lt list size i 不 fo
如何将 AnimatedVisibility 与可为 null 的值一起使用？

我发现自己经常处于这种情况我有一些价值比如plates在下面的示例中我想根据其是否为空来显示隐藏它但隐藏它总是会失败因为只要它为空就不会渲染任何内容并且动画只是捕捉到空的虚无我怎样才能做到这一点我想保留plates直到动
PyCountry 货币格式化“DE”alpha2 国家/地区代码的问题

我有一个Python函数它接受alpha2国家地区代码和价格字符串其目的是获取该国家地区的货币并使用该货币的currency letter属性通过字符串插值来格式化提供的价格字符串到目前为止上面的代码运行良好但当以德国为国家时
在空格处拆分 R 字符串，但当空格位于单引号之间时则不拆分

我有一组丑陋且复杂的字符串我必须将其拆分 vec lt c 01 01 02 bateau bateau batiment autres 32 autres 32 batiment 30 autres 32 batiment 30 con

在空格处拆分 R 字符串，但当空格位于单引号之间时则不拆分

在空格处拆分 R 字符串，但当空格位于单引号之间时则不拆分 的相关文章

随机推荐

热门标签

在空格处拆分 R 字符串，但当空格位于单引号之间时则不拆分的相关文章