检测字符串变量中的单词列表并将匹配的单词提取到数据框中的新变量

2024-01-05

我有一个两个变量数据框，其中之一是字符向量。 “MyVector”中的每一行都包含一个只有一个名称的字符串（即“Pete”）。该名称在字符串中的位置可能有所不同。我想创建将列表中的名称与字符串中的名称相匹配的代码，并将该名称提取到数据框中的新变量中。如果名称始终位于向量“MyVector”中的相同位置，我将创建一个新变量作为 MyVector 的子字符串，将名称拉出到新列中。我尝试了 Stringr 的各种版本的 str_detect 但无济于事。

挑战：如果名称位于多个位置，如何检测名称或将其提取到新变量中并将其放入 MyDF 中？

#Create the data frame
var.1 <-rep(c(1,5,3),2)

MyVector <- c("I know Pete", "Jerry has a new job","Victor is an employee","How to work with Pete","Too Many Students","Bob is mean")
   MyDF <-as.data.frame(cbind(var.1,MyVector))

#Create a vector of a list of names I want to extract into a new column in the dataframe.
Extract <- c("Jerry","Pete", "Bob", "Victor")

#Match would be perfect if I could use it on character vectors
MyDF$newvar <-match(MyDF$MyVector,Extract)

我的最终 data.frame 应该类似于下面的输出。

 var.1                     MyVector NEWVAR
1     1               Don knows Pete   Pete
2     5          Jerry has a new job  Jerry
3     3 Victor and Bob are employees Victor
4     1        How to work with Pete   Pete
5     5            Too Many Students     NA
6     3                  Bob is mean    Bob

我们可以用str_extract after paste将“摘录”放在一起

library(stringr)
MyDF$NEWVAR <- str_extract(MyDF$MyVector, paste(Extract, collapse="|"))
MyDF$NEWVAR
#[1] "Pete"   "Jerry"  "Victor" "Pete"   NA       "Bob"

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

检测字符串变量中的单词列表并将匹配的单词提取到数据框中的新变量的相关文章

从网络源获取 R 中的数据作为数据框

我正在尝试使用 RCurl 包将一些空气污染背景数据作为 data frame 直接加载到 R 中该网站有 3 个下拉框用于在下载 csv 文件之前选择选项如下图所示我试图从下拉框中选择 3 个值并使用下载 CSV 按钮将数据作
在 mac (iMac OSX ) 终端中远程运行脚本（r 脚本）到其他计算机

我有一个小示例脚本 script p r 如下所示打算在终端中运行 usr bin Rscript sink output capture txt mn lt mean 1 10 and so on much longer list of
将 JSON URL 转换为 R 数据帧

我在将 JSON 文件从 API 转换为 R 中的数据帧时遇到问题例如 URL 我尝试了 S O 的一些不同建议包括将json数据转换为R中的数据框 https stackoverflow com questions 28683769
dplyr，do()，从模型中提取参数而不丢失分组变量

R 帮助中关于 do 的示例略有不同 by cyl lt group by mtcars cyl models lt by cyl gt do mod lm mpg disp data coefficients lt models gt d
如何在 R 中为传单中的数值变量设置不对称颜色渐变

我想让传单调色板以零为中心红白绿发散我已经尝试过中所说的这个帖子 https stackoverflow com questions 29262824 r center color palette on 0 当我尝试手动创建颜色时我得
R 中的发散积分可在 Wolfram 中求解

我知道我以前问过同样的问题但由于我是新来的这个问题问得不好而且不可重现因此我在这里尝试做得更好如果我只编辑旧的可能没有人会读它我有一个想要积分的二重积分 ff lt function g t exp 16 g exp 8 t t
如何获得属于五分位数的x？

我正在大学学习使用 R 进行计量经济学项目所以请原谅我的笨拙基本上使用并给出一个矩阵股票价格行天列公司股票价格另一个矩阵市值行天列公司市值我必须收集第三个矩阵每天观察的属于市值分布第一五分位数的股票价格然后
在 R 中绘制对数正态概率密度

我正在尝试在 R 中生成对数正态概率密度图其中包含 3 个不同的均值对数和标准差对数我尝试了以下方法但我的图表太丑了看起来一点也不好看 x lt seq 0 10 length 100 a lt dlnorm x meanlog 0
将 VLMC 拟合到很长的序列

我正在尝试将 VLMC 拟合到最长序列为 296 个状态的数据集我这样做如下所示 Load libraries library PST library RCurl library TraMineR Load and transform d
如何按 data.table 中的十分位数组计算统计数据

我有一个 data table 想按组计算统计数据 R set seed 1 R DT data table a rnorm 100 b rnorm 100 这些组应该定义为 R quantile DT a probs seq 1 9 1
fread 将空导入为 NA

我正在尝试导入带有空白的 csv 读取为不幸的是他们都读作 NA now 为了更好地演示问题我还展示了如何NA NA and 都映射到同一事物除了最底部的示例这将妨碍简单的解决方法dt is na dt lt gt write cs
为绘图制作 2D 图例 - 双变量分区统计图

我一直在玩双变量 choropleth 地图并且一直在如何创建类似于 2d 图例的问题上陷入困境约书亚史蒂文斯 http www joshuastevens net cartography make a bivariate chorop
glmnet 未从 cv.glmnet 收敛 lambda.min

我跑了20倍cv glmnet套索模型以获得 lambda 的最佳值但是当我尝试重现结果时glmnet 我收到一个错误内容如下 Warning messages 1 from glmnet Fortran code error c
R：表格格式

我有一个包含以下列的 Excel 文件 Column1 Column2 Column3 ab bb 0 5 ab bc 0 1 ab cd 0 7 ab dd 0 8 ac bb 0 2 ac bg 0 8 ac ee 0 8 ac dd
R 中的字符串作为函数参数

数据框chocolates列出了糖果的类型以及每种糖果的一组评级 ID sweetness filling crash snickers 0 67 0 55 0 40 milky way 0 81 0 53 0 56 我正在编写一个函数它
如何在R中同时对三个字段进行网络分析

如何在 R 中同时对三个字段进行网络分析下面是示例数据以及desired output在最后一栏中 df lt data frame stringsAsFactors FALSE id 1 c ABC ABC BCD CDE DEF EF
为什么 geom_boxplot 比基本箱线图识别更多异常值？

这是一个可重复的示例与基本箱线图相比最后一个治疗组又发现了一个异常值 dta lt structure list Treatment c A A A A A A A A A A A A A A A A B B B B B B B B B
具有 dplyr、tidyverse 和 broom 的相关矩阵 - P 值矩阵

全部我想使用以下方法从相关矩阵中获取 p 值dplyr 和或扫帚包并同时测试多个变量我知道其他方法但 dplyr 对我来说似乎更简单更直观此外 dplyr 需要关联每个变量以获得特定的 p 值这使得该过程更容易更快我检查
R 中的 Websocket

我设法在 R 中建立到 Mtgox websocket 的连接规格如下 url https socketio mtgox com mtgox Currency USD https socketio mtgox com mtgox Curr
非闪亮上下文中的反应式对象绑定

实际问题你怎样才能近似反应性环境行为 http shiny rstudio com tutorial lesson6 建立者shiny http shiny rstudio com函数或者甚至可能在一个函数中使用这些函数无光泽上下文以

随机推荐

SPI 电子墨水显示屏与 PIC 18F46K22 连接时出现问题

我正在使用一个图18F46K22 https ww1 microchip com downloads en DeviceDoc 40001412G pdf在 SPI 主模式下与Waveshare 1 54 电子纸模组 https www w
为什么仅键查询是免费的？

根据定价文档here https developers google com appengine pricing a keys only查询是免费的所以看来你可以通过执行以下操作伪代码来保存读取 qo ndb QueryOptions
laravel 中带有 join 的子查询

我即将对查询感到疯狂有人可以帮助我将查询翻译为在 laravel 中工作或者以 laravel 方式编写查询代码如下使用MySQL 我遇到的问题是第一个 JOIN 与另一个 JOIN 的子查询 SELECT usr token u
Lua gmatch 奇数字符（斯洛伐克字母）

我正在尝试从斯洛伐克语单词的字符串中提取字符例如 TURTLE 这个词是 KORYTNA KA 但是当我尝试从字符串中提取字符时它会跳过它 local str KORYTNA KA for c in str gmatch a do
Rails 引擎中的观察者

我正在尝试在 Rails 引擎中创建一个观察者它将观察我的主应用程序中的模型我的观察者在 app models my engine my observer rb 中是 module MyEngine class MyObserver
在 PHP 中检测客户端区域设置的最简单方法

我希望能够使用 PHP 检测我的网站上的访问者来自哪个国家地区请注意我并不是试图将其用作安全措施或任何重要的事情只是更改某些单词的拼写美国人似乎相信 enrolment 这个词有2个L 疯狂猛拉也许可以在选择您的国家地区列
android非法状态异常内容视图尚未创建？

您好当我启动抽屉活动片段时弹出非法状态异常内容视图尚未创建错误这是我的代码和错误我正在使用自定义列表适配器 error 10 14 09 40 25 926 E AndroidRuntime 6736 java lang Illeg
Strawberry Perl 和 PAR - 在其他 Windows 计算机上运行时错误：如果安装了 LWP::Protocol::https 模块，LWP 将支持 https URL

我有两台 Windows 10 机器其中一台安装了 Strawberry Perl 版本 5 30 1 如果有的话我的脚本使用 REST Client 在这台机器上脚本运行完美我正在使用 PAR 来制作 exe 我可以运行 pl 脚
如何在所有浏览器上的每次回显时正确显示输出？

我将文件移至新服务器并且有一个脚本可以立即显示每个文件的输出echo到浏览器但这在新服务器上不起作用这是我的测试代码 ini set output buffering 0 ini set implicit flush 1 for i
使用 Python 搜索具有 MAC 地址的主机

我想在我的网络上搜索给定的 MAC 地址所有这些都在 Python 脚本中进行我已经有了网络中所有活动 IP 地址的映射但我不知道如何收集 MAC 地址有任何想法吗你需要ARP http en wikipedia org wiki
如何隐藏联系表单7验证错误和成功消息框？ [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案如何从表单底部隐藏联系人表单 7 验证错误和成功消息框将以下代码放入CSS中 wpcf7 response output display
如何从 GAE 的 blobstore 下载具有原始文件名的文件？

将文件上传到 blobstore 后它会将其重命名为 s9QmBqJPuiVzWbySYvHVRg 如果您导航到其 serve URL 来下载该文件则下载的文件将被命名为这个混乱的字母有没有办法让下载的文件在上传时保留其原始文件名当
按工作表名称将 Excel 文件中的多个工作表导入到多个表中

您好感谢您的帮助我正在整理一个看似简单的 Access 数据管理解决方案供我们办公室使用但我遇到了麻烦因为我的 vba 背景充其量也很少我这里有两个相关但互不相连的 Access 2007 应用程序我需要一个系统供用户轻松导入
如果 nan 在列表列表中，则删除列表

我有一个来自 Pandas 数据框架的列表列表其中包含 nan 值我想删除所有包含任何 nan 值的列表然后绘制剩余的值 Example test 1 2 1 nan 3 4 最终结果 test 1 2 3 4 如果可能的话我还想使
Stripe 一次性付款允许促销代码

我将实施一次性付款的促销代码 Stripe 宣布在一次性付款中使用 allow promotion code true 参数但促销投入出了问题有时输入的促销代码没有显示条纹有错误还是我错过了什么 id cs test b1IjCh7A
理解 jsf ui:composition 的目的

下面的有什么用处
有什么简单的方法可以解释垃圾收集的工作原理？

我的注意力持续时间很短所以我无法通过维基百科文章 http en wikipedia org wiki Garbage Collection 我知道垃圾收集有多种技术但常见的一种是可达性测试其中对象的收集资格取决于它是否可以被根对
关于gamecenter+ios的问题

我对游戏中心一无所知我正在开发 COCO 应用程序我曾经经历过游戏中心指南 http developer apple com library ios DOCUMENTATION NetworkingInternet Conceptual
如何用策略替换（而不仅仅是移动）条件逻辑？

In 作者通过让客户端使用贷款工厂方法来替换条件逻辑其中每个方法针对给定参数使用适当的策略但是我觉得它已将条件逻辑代码传递给客户端客户端必须根据参数选择要调用哪个 Loan 工厂方法这不是移动而不是替换吗 DP 的书也强调了同样的
检测字符串变量中的单词列表并将匹配的单词提取到数据框中的新变量

我有一个两个变量数据框其中之一是字符向量 MyVector 中的每一行都包含一个只有一个名称的字符串即 Pete 该名称在字符串中的位置可能有所不同我想创建将列表中的名称与字符串中的名称相匹配的代码并将该名称提取到数据框中的新变量中

检测字符串变量中的单词列表并将匹配的单词提取到数据框中的新变量

检测字符串变量中的单词列表并将匹配的单词提取到数据框中的新变量 的相关文章

随机推荐

热门标签

检测字符串变量中的单词列表并将匹配的单词提取到数据框中的新变量的相关文章