假设我有一个这样的数据集:
id <- c(1, 1, 2, 2, 3, 3)
code <- c("a", "b", "a", "a", "b", "b")
dat <- data.frame(id, code)
I.e.,
id code
1 1 a
2 1 b
3 2 a
4 2 a
5 3 b
6 3 b
使用 dplyr,我如何计算每个 id 有多少个 a
i.e.,
id countA
1 1 1
2 2 2
3 3 0
我正在尝试类似这样的东西,但不起作用,
countA<- dat %>%
group_by(id) %>%
summarise(cip.completed= count(code == "a"))
上面给了我一个错误,“错误:没有适用于‘group_by_’的方法应用于类‘逻辑’的对象”
感谢您的帮助!
请尝试以下方法:
library(dplyr)
dat %>% group_by(id) %>%
summarise(cip.completed= sum(code == "a"))
Source: local data frame [3 x 2]
id cip.completed
(dbl) (int)
1 1 1
2 2 2
3 3 0
这是有效的,因为逻辑条件code == a
只是一系列 0 和 1,该系列的总和就是出现的次数。
请注意,您不一定会使用dplyr::count
inside summarise
无论如何,因为它是一个包装summarise
呼叫任一n()
or sum()
本身。看?dplyr::count
。如果你真的想使用count
,我想您可以通过首先过滤数据集以仅保留其中的所有行来做到这一点code==a
,并使用count
然后会给你所有严格的正数(即非零)计数。例如,
dat %>% filter(code==a) %>% count(id)
Source: local data frame [2 x 2]
id n
(dbl) (int)
1 1 1
2 2 2
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)