从字符串返回数字

2023-12-01

我正在尝试提取下面字符串中“Humans”的“Number”，例如：

string <- c("ProjectObjectives|Objectives_NA, PublishDate|PublishDate_NA, DeploymentID|DeploymentID_NA, Species|Human|Gender|Female, Species|Cat|Number|1, Species|Human|Number|1, Species|Human|Position|Left")

字符串中文本的位置会不断变化，所以我需要R搜索字符串并找到“Species|Human|Number|”并返回1。

抱歉，如果这是另一个线程的重复，但我已经看过这里（根据模式提取R中的子字符串）和这里（R提取字符串的一部分）。但我没有任何运气。

有任何想法吗？

使用捕获方法 - 捕获 1 个或多个数字（\d+）在已知子字符串之后（只需转义|符号）：

> string <- c("ProjectObjectives|Objectives_NA, PublishDate|PublishDate_NA, DeploymentID|DeploymentID_NA, Species|Human|Gender|Female, Species|Cat|Number|1, Species|Human|Number|1, Species|Human|Position|Left")
> pattern = "Species\\|Human\\|Number\\|(\\d+)"
> unlist(regmatches(string,regexec(pattern,string)))[2]
[1] "1"

一种变体是使用 PCRE 正则表达式regmatches/regexpr

> pattern="(?<=Species\\|Human\\|Number\\|)\\d+"
> regmatches(string,regexpr(pattern,string, perl=TRUE))
[1] "1"

在这里，左侧上下文被放入非消耗模式中，即积极的后视，(?<=...).

可以通过以下方式实现相同的功能\K操作员：

> pattern="Species\\|Human\\|Number\\|\\K\\d+"
> regmatches(string,regexpr(pattern,string, perl=TRUE))
[1] "1"

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

regex

从字符串返回数字的相关文章

rvest如何通过id选择特定的css节点

我正在尝试使用 rvest 包从网页中抓取数据简单来说 html 代码如下所示 div class style div
R：如何应用输出多列数据帧的函数（使用 dplyr）？

我想查找数据框中某一特定列与所有其他列之间的相关性 p 值和 95 CI broom 包提供了一个示例说明如何使用带有 dplyr 和管道的 cor test 在两列之间执行此操作对于 mtcars 和 mpg 列我们可以与另一列进行
什么时候在“strsplit”中设置“perl=TRUE”不起作用（按预期或根本不起作用）？

我只是在尝试优化一些代码时做了一些基准测试并观察到strsplit with perl TRUE is faster比跑步strsplit with perl FALSE 例如 set seed 1 ff lt function paste
Rstudio 中的 Sweave — pdf 中没有显示任何图

这里是 Sweave Latex 新手我在生成常规函数输出时没有问题但绘图没有显示这是一个基本示例 documentclass article begin document SweaveOpts concordance TRUE lt
ggplot更改图例中的几何顺序[重复]

这个问题在这里已经有答案了我有两个堆积面积图上面画了一条线在这两种情况下我的绘图顺序都是这样的创建ggplot 添加堆叠区域 geom area 更改堆叠区域颜色添加行 geom line 改变线条颜色在我的第一张图中堆叠区
hive regexp_extract 怪异

我在 regexp extract 方面遇到一些问题我正在查询制表符分隔的文件我正在检查的列具有如下所示的字符串 abc def ghi 现在如果我这样做 select distinct regexp extract name 0 f
如何处理“不符合”的数组？

如何对两个数组进行逐元素算术运算在第一维度中一致但也有一个额外的维度示例乘法数组a 3 x 3 x 2 按数组b 3 x 3 a lt array 1 18 dim c 3 3 2 b lt diag 3 由于数组不一致因此以下操
cspade() R 错误

我正在尝试从电缆调制解调器的事件中挖掘规则链接的是数千个文件当我尝试在所有设备的合并文件 1200 万行上运行 cspade 算法时它会花费数小时来消耗 RAM 直到它用完我可用的所有 64 GB 因此我尝试仅在一台设备的链接文件
在 R 中进行 Cox 回归后，将预测危险比列添加到数据帧中

在 R 中运行 Cox PH 回归后我需要在数据框中添加预测风险比的列数据框是面板数据其中 numgvkey 如果公司标识符和年龄是时间标识符您可以从此链接下载一小部分日期 https drive google com file
R - 正则表达式错误（PCRE 版本）

我正在尝试使用koRpus在 R 中在运行 RHEL6 的 Linux 服务器上进行词形还原上周当我安装了 MRO Microsoft R Open 3 2 3 时下面的代码效果很好 library koRpus lw c danci
Python 正则表达式中的 \B+ 与 [\B]+ 与 [^\b]+

我在回答 SO 问题时遇到了一个我不明白的问题我创建了一个简化的示例来说明该问题场景我正在测试两个标记不是随机的英语单词在字符串中至少相距一定距离在这个例子中我们有一个动物列表我们要确保在羊和狼之间至少还有其他三种动物否则
正则表达式（第一个字符匹配 a-z）

我有这个正则表达式 a zA Z0 9 上面我想补充的是第一个字符只能是a zA Z 我怎样才能制作这个正则表达式尝试这样的事情 a zA Z a zA Z0 9 解释 Start of line string a zA Z Chara
用于清除工作空间和转储存储的 R 全局函数

我希望创建一个全局函数来清除我的工作区并转储我的内存我将我的函数称为 cleaner 并希望它执行以下代码 remove list ls gc 我尝试在全局环境中创建该函数但是当我运行它时控制台仅打印该函数的文本在我要获取的函数文件
用于验证 ip 列表中的 ip 范围的正则表达式

我有正则表达式用于验证 50 个 ips 逗号分隔的列表 25 0 5 2 0 4 0 9 01 0 9 0 9 3 25 0 5 2 0 4 0 9 01 0 9 0 9 1 50 列表示例 10 10 10 1 127 0 0 1 现在
正则表达式将从文本文件中提取句子

我需要一个正则表达式来从文本文件中提取句子示例文本以 2004 年底发生的亚洲海啸灾难为例对 Google 新闻 http news google com 的查询在一个月内 1 月 17 日返回了超过 80 000 篇有关该事件的在
错误：“rjags”的包或命名空间加载失败

在终端的 conda 环境之一中我能够成功安装包 rjags 但是当我在该环境中运行 R 并运行库 rjags 时出现以下错误加载所需的包 coda 错误 rjags 的包或命名空间加载失败 rjags 的 loadNamespac
当每个记录都是一个段落并且某些记录有 4 个字段而其他记录有 6 个字段时，如何将文本文件读入 R

如何读取文本文件其中每条记录都是一个段落每个换行符表示单独的字段复杂的是有些记录有 4 行有些记录有 6 行当字段数量的差异为 1 时 DWin 解决了我的问题但当字段数量差异为 2 时一切都崩溃了你可以有一个在这里看看他
在另一个 Rmd 中运行选定的块

我已经在源 Rmd 文件中运行了分析并且希望仅使用few来自源的块我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
如何扩展路径中的波形符（~）[重复]

这个问题在这里已经有答案了我有一个 shell 脚本可以从用户那里获取目录路径但我需要检查目录是否为空如果用户将他的主路径与而不是绝对路径所以我无法检查它ls echo Specify your project root dir
如何更改 Shiny 中 navbarPage 折叠的断点

我想用shiny navbarPage collapsible TRUE 当在小屏幕上查看我的 Shiny 应用程序时将导航元素折叠到菜单中默认情况下当浏览器宽度小于 940 像素时会触发折叠有什么方法可以改变这一点以便在稍大的浏

随机推荐

Windows Phone 8 LongListSelector 内的图像内存泄漏

我有一个 LongListSelector 其中包含一个图像控件该控件从网络加载大量图像这在一段时间内工作正常但在加载一些图像后我出现内存不足异常我读到其他人也有同样的问题涉及大量图像内存不足但仍然没有找到解决方案我读到它与
Firebase 部署错误：构建失败：npm ERR！代码EUSAGE

我目前正在使用 Firebase 托管但突然遇到部署错误我尝试了所有可能的解决方案但部署错误多次出现所以现在需要社区的帮助请帮我解决这个问题从这条线上部署过程失败 i functions updating Node js 16
主源文件中的结构值未更新

我的项目的一部分一些源文件是button key h button key h lcd h mani c etc 在按钮 key H 中使用了一个结构并声明为 struct menu uint8 t Hour uint8 t Minute
拦截列表总体以在反序列化中分配值

我有一个递归类树层次结构它派生自一个列表该列表具有子级及其自身通过 JSON NET 中的反序列化填充 TLDR 版本是我想在该类存在的每个级别上从父级填充子级中的变量而不使用 JSON NET 中的 ref 变量存储到 co
如何从R中UNC指定的目录中读取文件？

是否可以从 UNC 指定的目录中读取文件R 我想在不使用基本安装之外的任何软件包的情况下完成此操作 UNC 名称工作正常您只需正确转义它们即可这对我有用 read csv COMPUTER Directory file txt
我如何在 QMake 中包含 python.h

INCLUDEPATH L usr include python2 7 LIBS usr local lib python2 7 QMAKE CXXFLAGS usr local lib python2 7 error cannot fin
C++程序与MySQL数据库通信

有谁知道 C 程序直接与 MySQL 数据库通信的简单方法吗我查看了 MySQL 发现它非常令人困惑如果有人知道一个非常简单的方法请告诉我 Thanks 附我正在 Windows 机器上进行开发 PHP 和 MySQL Web 应用
LINQ Intersect 不返回项目

我已经为我的自定义类实现了一个比较类以便我可以使用Intersect在两个列表中 StudentList1 and StudentList2 但是当我运行以下代码时我没有得到任何结果 Student class CompareStud
awk 要求合并两个文件

我通过 AWK 命令使用 Same Key 组合了两个不同的文件如果与 File1 和 File2 相比没有关键匹配则只需把 t t t 代替我有以下 AWK 命令 awk F t key 1 NR 1 header key key
为什么不能将 Dictionary> 转换为 Dictionary>？

我想知道为什么我不能直接进行强制转换我有一个模糊的想法这可能与协逆变的东西有关我是否被迫按顺序将第一个字典的元素复制到新的字典中得到我想要的类型你不能这样做因为它们不是同一类型考虑 var x new Dictionary
不使用模式名称访问表

我是 DB2 新手如果不使用架构名称我无法从表中获取数据如果我使用带有表名的模式名称我就可以获取数据 Example SELECT FROM TABLE NAME 它给了我错误同时 SELECT FROM SCHEMA NAME
如何在Python OpenCV中获取轮廓的x,y位置

我试图从下图中获取轮廓的 x 和 y 位置但我搞砸了图片我只需要找到轮廓的 x 和 y 位置或轮廓的中心当我从 GIMP 手动查找它们的位置时结果将类似于以下内容 290 210 982 190 570 478 我相信可以用 cv
从 C# 调用非托管 C++ 库 (dll) 会产生访问冲突错误 (0xc0000005)

抱歉问了这么长的问题我只是想包括我目前所知道的有关该问题的所有信息我正在使用 Visual Studio 2008 用 C 创建一个 Windows 窗体程序该程序调用用 C 编写的库 C DLL 分析由多个样本组成的测量数据样本通
使用php脚本将多个doc或rtf文件合并为一个doc或rtf文件

我想将多个 doc 或 rtf 文件合并到一个文件中该文件应该与多个文件的格式相同我的意思是如果用户从列表框中选择多个 rtf 模板文件并单击网页上的按钮则输出应该是组合多个 rtf 模板文件的单个 rtf 文件我应该使用 php
使用 TypeScript 将箭头函数分配给泛型函数类型

我已经对类似问题进行了一些挖掘但找不到有效的解决方案我有一些类型的通用函数但我似乎无法正确实现它们简而言之我有这个 Takes three values of the same type and collapses them in
Visual Studio 2010 无法加载导入了元素的项目

我们有一个大型约 800 个单独的项目系统我们正在将其从旧的构建系统迁移到 Visual Studio 2010 在过去的几周里我们为每个项目手动创建了 Visual Studio 项目文件 vcxproj 格式我们可以仅使用 M
UnreachableBrowserException：无法启动新会话。可能的原因是 Selenium Grid 远程服务器的地址无效

打开新驱动程序窗口时出错 org openqa selenium remote UnreachableBrowserException Could not start a new session Possible causes are in
无法在 Keras 中使用 VGG19 预测单个图像的标签

我正在根据本教程使用迁移学习方法在 Keras 中使用经过训练的 VGG19 模型https towardsdatascience com keras transfer learning for beginners 6c9b8b7143
如何在页面加载时显示运行进度条

我想在页面加载时显示运行进度条像这儿在我的页面中我在示例中使用了一个简单的加载图像但我想在运行进度栏中将其转换这是我的代码 window load function alert hi loading hide loading wid
从字符串返回数字

我正在尝试提取下面字符串中 Humans 的 Number 例如 string lt c ProjectObjectives Objectives NA PublishDate PublishDate NA DeploymentID Dep

从字符串返回数字

从字符串返回数字 的相关文章

随机推荐

热门标签

从字符串返回数字的相关文章