我的数据如下所示:
id |
date |
1 |
a |
1 |
a |
1 |
b |
1 |
c |
1 |
c |
1 |
c |
2 |
z |
2 |
z |
2 |
e |
2 |
x |
我想计算每个 id 的重复项的平均值,即对于 id=1,我们有 2a 1b 3c 我希望输出为 2。
结果应该是这样的:
您可以使用mean(table(date))
要获得计数平均值,请将其应用于每个id
value.
使用 dplyr -
library(dplyr)
df %>%
group_by(id) %>%
summarise(mean = mean(table(date)))
# id mean
# <int> <dbl>
#1 1 2
#2 2 1.33
或与碱基Raggregate
.
aggregate(date~id, df, function(x) mean(table(x)))
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)