R，dplyr：如果每组只有一个唯一的非 NA 元素，则按组折叠字符变量元素

2024-01-04

假设我有以下 data.framedf患者家乡和一项任意临床指标（心率）：

id          <- c(rep(1:3, each = 2), rep(4, 3))
pt_hometown <- c("Atlanta", NA, 
                 NA, "San Diego", 
                 NA, NA, 
                 "San Francisco", "Seattle", NA)
pt_heartrate <- c(NA, 82,
                  NA, NA,
                  76, 76,
                  90, 93, NA)

df <- data.frame(id = id, 
                 pt_hometown = pt_hometown,
                 pt_heartrate = pt_heartrate,
                 stringsAsFactors = FALSE)
df

这使

id   pt_hometown pt_heartrate
 1       Atlanta           NA
 1          <NA>           82
 2          <NA>           NA
 2     San Diego           NA
 3          <NA>           76
 3          <NA>           76
 4 San Francisco           90
 4       Seattle           93
 4          <NA>           NA

正如我在这里学到的 https://stackoverflow.com/questions/28509462/how-to-collapse-many-records-into-one-while-removing-na-values, summarise_each可以将一个或多个函数应用于分组数据框，以将记录折叠为每组一个。最简单的情况可能是从所有变量中选择第一个非 NA 值df并将它们折叠成每组一个。

  df1 <- df %>%  
    group_by(id) %>%
    summarise_each(funs(first(.[!is.na(.)]))

df1

id   pt_hometown pt_heartrate
 1       Atlanta           82
 2     San Diego           NA
 3            NA           76
 4 San Francisco           90

当然，对于实际应用，人们可能希望以更具体的方式折叠。我知道如何分组df按类型划分的变量，例如，选择max每心率id并折叠成一条记录，但是我不知道该怎么做是有条件地将字符变量折叠为每组一个记录，因为只有一个唯一的非 NA 值.

更具体地说，考虑患者id数字 4。它们有两个独特的值pt_hometown、“旧金山”和“西雅图”。显然两者都不可能都是正确的。所以我想折叠只有一个非 NA 值的每个组的记录，但保留存在多个非 NA 元素的行然后引起我们小组的注意，以决定如何纠正原始数据集中的错误。

所以我想df1看起来像这样：

id   pt_hometown pt_heartrate
 1       Atlanta           82
 2     San Diego           NA
 3          <NA>           76
 4 San Francisco           90
 4       Seattle           93

这是我尝试过的：

df1 <- df %>%  
  group_by(id) %>%
  summarise_each_(funs(first(.[!is.na(.)])), df[length(unique(.[!is.na(.)])) == 1])

我有点不清楚你想要什么边缘情况，但这适用于OP：

library(data.table)
dt = as.data.table(df) # or convert in place using setDT

unique(dt, by = c('id', 'pt_hometown'))[, lapply(.SD, na.omit), by = id]
#   id   pt_hometown pt_heartrate
#1:  1       Atlanta           82
#2:  2     San Diego           NA
#3:  3            NA           76
#4:  4 San Francisco           90
#5:  4       Seattle           93

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

R，dplyr：如果每组只有一个唯一的非 NA 元素，则按组折叠字符变量元素的相关文章

我无法下载 R 中的 reshape2 包 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我在尝试安装 R 包时收到此响应 gt installed packages reshape2 Package LibPath V
正则表达式字符串中第一个和最后一个非点的位置

我希望找到字符串的第一个和最后一个非点元素的位置理想情况下我想这样做regex在基地R 我已经写过R解决问题的代码不过我对一个感兴趣regex解决方案感谢您的任何建议这是一个示例数据集和R代码以获得所需的结果此代码拆分字符串并使
如何计算R中移动窗口内的平均斜率

我的数据集包含2个变量y 和 t 05s y 每 05 秒测量一次我正在尝试计算移动中的平均坡度20秒窗口即计算第一个 20 秒斜率值后窗口向前移动一个时间单位 05 秒并计算下一个 20 秒窗口在以下位置生成连续 20 秒斜率值
多功能测试仪替代 system.time

我已经看到我认为是这样使用了类似于 system time 的函数它可以同时评估多个函数的时间并输出一个输出我不记得它是什么并且用我正在使用的术语进行互联网搜索并没有得到我想要的响应有人知道我正在谈论的功能的名称位置吗你想要
将绘图调用拆分为多个块

我正在编写一个图的解释其中我基本上将在第一个块中创建图然后描述该输出并在第二个块中添加一个轴然而似乎每个块都会强制一个新的绘图环境因此当我们尝试使用以下命令运行块时会出现错误axis独自的观察 output html docu
在 R 中绘制 Likert 变量的堆积条形图

假设我有一个如下所示的数据框 P Q1 Q2 1 1 4 1 2 2 3 4 3 1 1 4 其中的列告诉我哪个人相应地回答了问题 q1 q2 中的哪一个这些问题需要按照 4 分李克特量表进行回答例如批准表示 1 稍微批准表示 2
API 请求和curl::curl_fetch_memory(url, handle = handle) 中的错误：SSL 证书问题：证书已过期

几天前我运行了代码几个月没有任何问题 GET url myurl query 今天我遇到一个错误 Error in curl curl fetch memory url handle handle SSL certificate pro
只读取选定的列

谁能告诉我如何仅读取下面每年数据的前 6 个月 7 列例如使用read table Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 41 27 25 31 31 39 2
将数据框中重叠的范围合并到唯一的组中

我有一个 n 行 3 的数据框 df lt data frame start c 178 400 983 1932 33653 end c 5025 5025 5535 6918 38197 group c 1 1 2 2 3 df sta
使用 Shiny 发布平行坐标图表时出现“错误：路径[1]="”：没有这样的文件或目录”

我有一个似乎很常见但我还没有找到解决方案的问题当尝试使用 rCharts Parcoords 发布 Web 应用程序时出现以下错误错误路径 1 没有这样的文件或目录奇怪的是该应用程序在我的笔记本电脑上运行得很好下面是我正在使用
ddply 和aggregate 之间的区别

有人可以通过以下示例帮助我了解聚合和 ddply 之间的区别数据框 mydat lt data frame first rpois 10 10 second rpois 10 10 third rpois 10 10 group c re
在 Rcpp 中使用其他包中的 C 函数

我试图从 C 函数中的 cubature 包调用 C 例程来执行多维积分我试图重现的基本 R 示例是 library cubature integrand lt function x sin x adaptIntegrate integr
如何在 R 中匹配多个 ggplot2 图中的调色板？

自从被问到这个问题以来已经有一段时间了但我知道一个事实我很快就会提取新数据我想弄清楚如何用这种技术来绘制它看起来评论和答案中的人知道如何做到这一点但我无法完全弄清楚所给我的内容还有人想尝试一下吗我正在尝试使用具有多个级别的因子
为什么 R 更新后 sim_slopes() 中会出现此错误？

我正在尝试使用交互包来创建简单斜率的约翰逊尼曼图但是当尝试运行 sim slopes 函数时出现以下错误直到我将R更新到4 2 2 我才没有遇到这个问题我使用的是 macOS Ventura 13 1 Error class
如何从 R 读取 PDF 元数据

我们很好奇有没有一种方法可以从 R 读取 PDF 元数据例如下面显示的信息通过搜索我对此无能为力 r pdf metadata在当前的问题库中非常欢迎任何指点我想不出纯 R 的方法来执行此操作但您可能可以安装您最喜欢的 PDF
如何使用 SparkR 1.6.0 写入 JDBC 源？

使用 SparkR 1 6 0 我可以使用以下代码从 JDBC 源读取数据 jdbc url lt jdbc mysql localhost 3306 dashboard user
如何在将两根柱子保持在一起的同时熔化柱子？

我有这种宽格式的数据我想将其转换为长格式 Cond Construct Line Plant Tube shoot weight shoot Tube root weight root 1 Standard NA NA 2 199 95
SPSS 中的标准化残差与 R rstandard(lm()) 不匹配

在寻找 R 相关解决方案时我发现 R 和 SPSS 版本 24 在计算简单线性模型中的标准化残差方面存在一些不一致看来SPSS所谓的标准化残差匹配 R学生化残差我完全不认为某处存在软件错误但显然这两个程序之间存在差异看看这个例子
Shiny：动态数据框构建； renderUI、观察、reactiveValues

我认为如何使用 Shiny 的 renderUI 功能动态子集数据的问题经常出现但我很难理解何时使用 renderUI 带有 uiOutput 而不是其他功能包括观察反应反应值甚至条件面板我想构建一个完全交互式的数据框架其中每个
如何使用 tidymodels 和工作流集在同一数据集上拟合多个不同的线性模型

我想评估同一数据集上多个主要是线性回归模型的性能我想也许使用tidymodels包连同workflowsets workflow set 可能会起作用我按照这个例子here https workflowsets tidymodels

随机推荐

Google OR 工具：如何评估复杂或多级布尔约束

Set up 我使用 google OR 工具作为约束编程求解器 from ortools sat python import cp model 我定义了以下 BoolVars model cp model CpModel a model
IntelliJ 和 JSP/JSTL 无法解析 tomcat7 中 JSTL 的 taglib [重复]

这个问题在这里已经有答案了首先我的 JSTl 代码可以在我的服务器上运行因为我在 tomcat7 的 Lib 文件夹中有正确的 Jar 文件这实际上只是一个 IDEA 问题我的问题归结为我将相同的 jar 文件放在 Intelli
隐藏盒子阴影的部分

免责声明我已经看到以下问题尽管它们的情况非常相似但它们的解决方案并不适用于我在除一侧以外的所有面上创建 CSS3 框阴影 https stackoverflow com questions 1429605 css3 box shad
如何通过 Terraform 将 Iceberg 表部署到 AWS

尝试确定将一些 Iceberg 表部署到我们的 AWS 环境中的最佳方法有人通过 Terraform 取得成功吗我有以下配置但当我查询我创建的表时 Athena 抱怨缺少元数据位置或者将永远旋转如果有更好的方法可以自动化部署请告
如何知道 uitableview 是否有选定的单元格

我正在开发一个应用程序有时我有几个 uitableview 我想知道委托方法之外的操作例如表视图是否有选定的单元格以及是哪个单元格我尝试使用 NSIndexPath indexPathForSelectedRow但它不起作用因为如果
通过选项选择更新 SVG

我正在尝试获取 SVG 中的文本元素以通过选项更改进行更新搜索后我已经能够到达在控制台中在页面初始加载期间以及选项更改时看到选项更改的位置但我未能成功更改数字任何帮助将不胜感激
VIM 中更好的自动完成功能

All 我使用 vim 已经有一段时间了并且喜欢它的一切我真正怀念 RubyMine 这样的 IDE 中只有一件事那就是高级自动完成功能作为参考这是我的标准 VIM 设置 https github com wrwright vim
如何在 spring mvc 中提供静态内容？

我在当前的项目中使用 spring mvc 框架 ROOT文件夹有很多包含html jsp css js等的web文件夹我的spring mvc配置如下
UIScrollView 如何更改框架而不更改边界？ UIScrollView 是如何工作的？

我理解框架和边界之间的区别我认为边界是视图的本地坐标系而框架是超级视图然而对于滚动视图我有点困惑当我在 UIScrollView 中有一个 UIImageView 并将其放大时似乎框架变大宽度和高度也会增加相应 UIIm
在 google 地图中查找给定点 5 公里半径范围内的位置

嘿我只是想收集谷歌地图数据库中给定点 5 公里半径以下的位置我会将它们存储在数据库中以供以后处理这可以完成吗谢谢如何获取所需圆内点的经度和纬度您可以使用地点搜索 http code google com intl fr apis
有没有办法通过作业名称获取 Quartz 中的作业密钥

现在我正在寻找在 Quartz 库中通过作业名称获取作业密钥的功能我看到Scheduler有方法通过组名称获取作业密钥GroupMatcher
Android 中是否有 API 支持以编程方式进行电话会议？

我想通过从我的应用程序中选择一些联系人来进行电话会议可以吗电话会议中的设备数量是否有限制有没有 Android SDK 支持任何版本都适合我吗请提供一些意见提前致谢您无法使用智能手机管理会议您需要一个可以为您完成此操作的中间
django 脆皮形式内联表单

我正在尝试采用脆形式和引导程序并尽可能多地使用它们的功能而不是一遍又一遍地发明一些东西有没有一种方法可以像 django admin 表单那样使用 Cripy forms bootstrap 来实现内联表单功能这是一个例子 clas
如何在 Perl 中连接两个散列而不使用循环？

如何在 Perl 中将哈希 a 附加到哈希 b 而不使用循环如果您的意思是合并他们的数据只需执行以下操作 c a b
如何在Python中用单反斜杠替换双反斜杠？ [复制]

这个问题在这里已经有答案了我有一根绳子该字符串中有双反斜杠我想用单反斜杠替换双反斜杠以便可以正确解析 unicode 字符代码 Pdb p fetched page p style text align center align c
在 Android Studio 中导入 Facebook 库：找不到属性“ANDROID_BUILD_SDK_VERSION”

我想将库项目导入到我的应用程序中但每当我尝试这样做时 Android Studio 都无法识别它它还在 build gradle 中给了我错误该库是 PagerSlidingTabStrip 以下是一些图片到目前为止我已经尝试了三天
.NET StringBuilder 在前面添加一行

我知道System Text StringBuilder在 NET中有一个AppendLine 方法但是我需要在 a 的开头预先附加一行StringBuilder 我知道你可以使用Insert 附加一个字符串但我似乎无法用一行来做到这
@Scheduled 方法内部的 Spring @Async 方法调用

我正在使用 Spring boot EnableScheduling and EnableAsync 我有一个注释为的方法 Scheduled 我还有几个方法注释为 Async 现在我称这些为 Async中的方法 Scheduled方法并
在Powershell中使用Import-CSV，忽略注释行

我认为我一定错过了一些明显的东西因为我正在尝试使用 Import CSV 导入已在文件顶部注释掉行始终以作为第一个字符开头的 CSV 文件因此文件看起来像这样 SpecialCSV Version 1 0 0 Table Head
R，dplyr：如果每组只有一个唯一的非 NA 元素，则按组折叠字符变量元素

假设我有以下 data framedf患者家乡和一项任意临床指标心率 id lt c rep 1 3 each 2 rep 4 3 pt hometown lt c Atlanta NA NA San Diego NA NA San Fr

R，dplyr：如果每组只有一个唯一的非 NA 元素，则按组折叠字符变量元素

R，dplyr：如果每组只有一个唯一的非 NA 元素，则按组折叠字符变量元素 的相关文章

随机推荐

热门标签

R，dplyr：如果每组只有一个唯一的非 NA 元素，则按组折叠字符变量元素的相关文章