我想使用 dplyr summarize 按组对计数进行求和。具体来说,如果并非所有求和值都是 NA,我想删除 NA 值,但如果所有求和值都是 NA,我想显示 NA。例如:
name <- c("jack", "jack", "mary", "mary", "ellen", "ellen")
number <- c(1,2,1,NA,NA,NA)
df <- data.frame(name,number)
在这种情况下,我想要以下结果:
但是如果我设置na.rm = F
:
df %>% group_by(name) %>% summarise(number = sum(number, na.rm = F))
结果是:
如果我设置na.rm = T
:
df %>% group_by(name) %>% summarise(number = sum(number, na.rm = T))
结果是
我该如何解决这个问题,以便具有数字和 NA 的情况得到数字作为输出,但只有 NA 的情况得到 NA 作为输出。
我们可以有一个if/else
健康)状况 -if
all
'number 中的值为NA
,然后返回NA
or else
得到sum
library(dplyr)
df %>%
group_by(name) %>%
summarise(number = if(all(is.na(number))) NA_real_ else sum(number, na.rm = TRUE))
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)