根据向量指定的变量“开头为”字符串过滤行

2023-12-13

我正在尝试根据特定的 ICD9（诊断）代码过滤患者数据库。我想使用一个向量来指示 ICD9 代码的前 3 个字符串。

示例数据库包含每次患者就诊的 IC9 代码的 3 个字符变量（var1 到 var3）。

下面是数据示例

patient<-c("a","b","c")
var1<-c("8661", "865","8651")
var2<-c("8651","8674","2866")
var3<-c("2430","3456","9089")

observations<-data_frame(patient,var1,var2,var3)

   patient  var1  var2  var3
1       a  8661  8651  2430
2       b  865   8674  3456
3       c  8651  2866  9089

#diagnosis of interest: all beginning with "866" and "867"
dx<-c("866","867")

filtered_data<- filter(observations, var1 %like% dx | var2 %like% dx | var3 %like% dx)

我尝试了多种方法，包括 grep 和 %like% 函数，如您在上面看到的，但我无法让它适用于我的情况。如果您能提供任何帮助，我将不胜感激。

感恩节快乐

Albit

您可以从兴趣向量创建一个正则表达式模式，并将其应用到数据框的每一列，除了patient身份、使用rowSums检查行中是否有任何 var 与模式匹配：

library(dplyr)
pattern = paste("^(", paste0(dx, collapse = "|"), ")", sep = "")

pattern
# [1] "^(866|867)"

filter(observations, rowSums(sapply(observations[-1], grepl, pattern = pattern)) != 0)

# A tibble: 2 × 4
#  patient  var1  var2  var3
#    <chr> <chr> <chr> <chr>
#1       a  8661  8651  2430
#2       b   865  8674  3456

另一种选择是使用Reduce with lapply:

filter(observations, Reduce("|", lapply(observations[-1], grepl, pattern = pattern)))

# A tibble: 2 × 4
#  patient  var1  var2  var3
#    <chr> <chr> <chr> <chr>
#1       a  8661  8651  2430
#2       b   865  8674  3456

当您有两个以上的模式并且不同的模式具有不同的字符长度时，例如，如果您有dx as dx<-c("866","867", "9089"):

dx<-c("866","867", "9089")
pattern = paste("^(", paste0(dx, collapse = "|"), ")", sep = "")

pattern
# [1] "^(866|867|9089)"

filter(observations, Reduce("|", lapply(observations[-1], grepl, pattern = pattern)))

# A tibble: 3 × 4
#  patient  var1  var2  var3
#    <chr> <chr> <chr> <chr>
#1       a  8661  8651  2430
#2       b   865  8674  3456
#3       c  8651  2866  9089

Check this and this有关多个的更多信息，请堆栈答案or正则表达式中的条件。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

根据向量指定的变量“开头为”字符串过滤行的相关文章

如何使用 R 中带引号的字符值内的序列读取 CSV？

这是一个包含两个字符列的 CSV 文件 key value a 所有字符值都用双引号引起来并且有一个顺序在值之一内转义引号加分隔符我无法通过 read csv readr 中的 read csv 或 data table 中的 fr
在函数内部调用 clusterApply 时，性能会下降

我遇到了一个奇怪的问题clusterApply 我已经能够尽可能地隔离它如下所示首先我从全局环境运行以下代码 require parallel cl lt makeCluster rep localhost 20 SOCK xl lt
限制数据框中所有单元格的字符串长度？

您好有没有一种方法可以限制 data frame 中所有列的字符串文本大小而不必循环遍历每一列并一次使用 str trunc 之类的东西例如下面的数据框我可以将所有文本大小限制为仅 5 个字符而不必一次只执行一列吗如果有 50
如何获得属于五分位数的x？

我正在大学学习使用 R 进行计量经济学项目所以请原谅我的笨拙基本上使用并给出一个矩阵股票价格行天列公司股票价格另一个矩阵市值行天列公司市值我必须收集第三个矩阵每天观察的属于市值分布第一五分位数的股票价格然后
当每个记录都是一个段落并且某些记录有 4 个字段而其他记录有 6 个字段时，如何将文本文件读入 R

如何读取文本文件其中每条记录都是一个段落每个换行符表示单独的字段复杂的是有些记录有 4 行有些记录有 6 行当字段数量的差异为 1 时 DWin 解决了我的问题但当字段数量差异为 2 时一切都崩溃了你可以有一个在这里看看他
从 R 中的 HTTPS 连接逐行读取

当创建连接时open r 它允许逐行读取这对于批量处理大数据流非常有用例如这个脚本 https gist github com jeroenooms d33a24958d99bb969ac0通过一次读取 100 行来解析相当大的 gzi
在另一个 Rmd 中运行选定的块

我已经在源 Rmd 文件中运行了分析并且希望仅使用few来自源的块我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
将函数应用于 3d 数组的每一层，返回一个数组

假设您有一个包含行列和层的 3 维数组 A lt array 1 27 c 3 3 3 想象你有一个函数它接受一个矩阵作为输入并返回一个矩阵作为输出就像t 如何将该函数应用于数组的每一层返回与第一层大小相同的另一个数组我觉得我应该
为绘图制作 2D 图例 - 双变量分区统计图

我一直在玩双变量 choropleth 地图并且一直在如何创建类似于 2d 图例的问题上陷入困境约书亚史蒂文斯 http www joshuastevens net cartography make a bivariate chorop
如何将此“for”循环转换为向量解

这个问题与将嵌入其他文本的长州名称转换为两个字母的州缩写 https stackoverflow com questions 25582518 convert long state names embedded with other te
带 R 的多彩标题

我想添加颜色某些词在我的图表标题中我已经能够在这里找到一些先例 http blog revolutionanalytics com 2009 01 multicolor text in r html 具体来说我希望用撇号括起来的文本在
R - 通过覆盖和递归合并列表

假设我有两个带有名字的列表 a list a 1 b 2 c list d 1 e 2 d list a 1 b 2 b list a 2 c list e 1 f 2 d 3 e 2 我想递归地合并这些列表如果第二个参数包含冲突的值则
ggplot散点图中的图例问题

我想使用 ggplot 创建显示方法比较数据的散点图绘图应包含原始数据理想线和带误差的拟合线图例应显示理想线和拟合线的线型线宽线颜色我可以获得大部分我想要的东西但是图例存在以下问题图例显示每种线型有 2 条线为什么如何解
如何根据两个数据框中最近的日期进行匹配？

假设我有两个数据框例如 set seed 123 df1 lt data frame bmi rnorm 20 25 5 date1 sample seq Date as Date 2014 01 01 as Date 2014 02 2
R - tidyr - 变异并传播多列

我在 R 中有以下数据框 my df test lt data frame V1 c 1 2 1 V2 c A B A V3 c S1 S1 S2 V4 c x x x V5 c y y y V6 c A B C V7 c D E F my
为什么 \K 似乎消耗了基本 R 的 gsub 中的一个字符

这是一个示例字符串 bcadefgh 我希望我能匹配除了 cad 具有以下模式 wa w K w 如果我想替换所有不是的东西 cad 我可以用gsub 像这样gsub wa w K w bcadefgh perl TRUE 但是这输出 ca
在多行中打印带有列名称的 R 数据框

我有一个带有长列名称的 R 数据框所以当我打印数据框时它太宽了有没有一种简单的方法可以将数据框打印到屏幕上并且列名出现在多行中我知道我可以缩短名字但我不想这样做当奥斯卡的答案被接受时我想这可能真的是一个答案不幸的是这只是复
R Tidytext 和 unnest_tokens 错误

对 R 非常陌生已经开始使用 tidytext 包我正在尝试使用参数来填充unnest tokens函数这样我就可以进行多列分析所以而不是这个 library janeaustenr library tidytext library
R - Quantstart：多种股票的测试策略

我正在使用一些指标构建基本交易策略我的问题是我希望它在多个股票上运行而不必指定我想要测试的每个单独的股票目前我可以使用向量一次获取多个符号如下所示 Get Shares from Yahoo Finance Stocks lt AS
如何一次导入多个 .csv 文件？

假设我们有一个包含多个 data csv 文件的文件夹每个文件包含相同数量的变量但每个文件来自不同的时间 R 中有没有办法同时导入它们而不必单独导入它们我的问题是我有大约 2000 个数据文件需要导入并且必须使用以下代码单独导入

随机推荐

具有自定义 HTTP 和 ConfigService 的循环依赖的 DI

我正在尝试实现 ConfigService 来检索项目中正确环境的正确配置我目前遇到了循环依赖 index 28 Error SystemJS Provider parse errors Cannot instantiate cyclic
查看 Node.js String.prototype 的方法？

在 Node js REPL 中如果您输入String prototype 一个空对象被返回但是如果您在 Chrome JavaScript 控制台中键入它则会返回一个带有预期函数名称和功能的对象为什么 Node js 没有表现
启动项目时出现无法理解的错误（gradle）

我连接了一个库compile com balancedpayments balancedpayments 1 4 去项目时没有错误但是当我尝试运行时我看到错误 Executing tasks app assembleDebug Conf
PHP header() 不起作用

有人知道为什么我的 header 不重定向吗我的脚本的最后一部分是 header location test php die died 它写道 died 它应该在死亡之前重定向但它没有你有什么想法吗您可能正在调用 header af
JSONB sqlalchemy 聚合函数

使用 SQLAlchemy 我想重现可用的聚合函数来自子查询的 jsonb object aggsq objects from sqlalchemy import select func s select sq objects c obje
为什么将 html 代码打印为字符串会给出十六进制数字作为 python 中的输出？

我写了一个Python代码来修改我的html内容但是在再次将其写入 html 文件时我得到了奇怪的十六进制数字 import re search www abc com description blah blah f open myht
将三个js的IIFE函数转换为es6？

我正在尝试将我的 Threejs 项目分解为更小的模块但我遇到了困难以这个函数为例 var updateCamera function var euler new THREE Euler 0 0 0 YXZ return functio
Python删除组合字典列表中的重复值

我需要一点家庭作业帮助我必须编写一个将多个字典组合成新字典的函数如果某个键出现多次新字典中与该键对应的值应该是唯一的列表作为一个例子这是我到目前为止所拥有的 f a apple c cat b bat d dog g c car
如何使用make_cudaExtent正确定义cudaExtent？

我想在 CUDA 中有一个 3d 浮点数组这是我的代码 define SIZE X 128 numbers in elements define SIZE Y 128 define SIZE Z 128 typedef float Vol
忍者绑定

如何将我的接口绑定到不同程序集中的具体类我的解决方案中有以下项目 Foo DataFoo 域名在 Structure Map 中我将两个程序集名称添加到 StructureMap config 文件中然后使用 PluginFamil
可以在导航选项中使用 navigation.toggleDrawer()

在我的导航文件中当我想切换抽屉时出现以下错误类型错误 navigation openDrawer 不是一个函数在 navigation openDrawer navigation openDrawer 未定义这是我的抽屉 cons
Laravel：preg_replace（）：参数不匹配，模式是字符串，而替换是数组

我想将结果保存在数据库中但出现错误异常在我看来我有一个单选按钮数组它可以获取每个学生的结果即出席迟到缺席其他这是我的观点 td users gt student id td td users gt student fir
jQuery：执行同步 AJAX 请求

我过去曾做过一些 jQuery 但我完全坚持这一点我知道使用同步 ajax 调用的优点和缺点但在这里它是必需的远程页面已加载由 firebug 控制但未显示返回我应该做些什么来使我的函数正确返回 function getRemo
函数内的右值引用参数的类型是什么？ [复制]

这个问题在这里已经有答案了我这里有一个非常简单的函数定义 void testRvalue int r printf rvalue ref is called n testRvalue r this line gives no known
Docker 出现错误“无法计算缓存密钥：未找到” - 在 Visual Studio 中运行正常

我使用 Visual Studio 生成了一个 Dockerfile 它在 Visual Studio 中运行得很好现在我正在尝试从 Windows 本身构建它 docker build 并且我尝试了很多组合但我收到以下错误 gt bu
SqlAlchemy Postgres JSON如何使用问号运算符进行过滤？

我正在努力将其转换为 ORM 过滤器查询 select count from issues WHERE pending notifications flooby ending notifications 是一个包含简单 JSON 数组的 J
如何为 MvxItemTemplate 创建视图的操作侦听器

我有一个包含 MvxListView 和表单的视图我可以在视图代码中使用以下代码隐藏软键盘因为这是纯粹的视图问题 var editText FindViewById
流式传输 MP3，而不是使用 HTML5 音频标签下载它

In the document ready功能我有这个 audioElement document createElement audio audioElement setAttribute src http www mfiles co
当的值更改时，会触发哪些事件？

只是想知道是否有人知道 HTML5 发生了什么事件
根据向量指定的变量“开头为”字符串过滤行

我正在尝试根据特定的 ICD9 诊断代码过滤患者数据库我想使用一个向量来指示 ICD9 代码的前 3 个字符串示例数据库包含每次患者就诊的 IC9 代码的 3 个字符变量 var1 到 var3 下面是数据示例 patient lt

根据向量指定的变量“开头为”字符串过滤行

根据向量指定的变量“开头为”字符串过滤行 的相关文章

随机推荐

热门标签

根据向量指定的变量“开头为”字符串过滤行的相关文章