如果这个问题已经在 SO 上得到处理,我深表歉意,但我似乎还无法找到快速的解决方案。
我正在尝试按特定年份聚合数据集。我的数据框包含 10 年期间每小时的气候数据。
head(df)
# day month year hour rain temp pressure wind
#1 1 1 2005 0 0 7.6 1016 15
#2 1 1 2005 1 0 8.0 1015 14
#3 1 1 2005 2 0 7.7 1014 15
#4 1 1 2005 3 0 7.8 1013 17
#5 1 1 2005 4 0 7.3 1012 17
#6 1 1 2005 5 0 7.6 1010 17
为了计算上述数据集的每日平均值,我使用了这个聚合函数
g <- aggregate(cbind(temp,pressure,wind) ~ day + month + year, d, mean)
options(digits=2)
head(g)
# day month year temp pressure wind
#1 1 1 2005 6.6 1005 25
#2 2 1 2005 6.5 1018 25
#3 3 1 2005 9.7 1019 22
#4 4 1 2005 7.5 1010 25
#5 5 1 2005 7.3 1008 25
#6 6 1 2005 9.6 1009 26
不幸的是,我得到了一个跨越整个 10 年(2005 年至 2014 年)的庞大数据集。我想知道是否有人能够帮助我调整上述聚合代码,以便我能够汇总特定年份的每日平均值,而不是一次性汇总所有平均值?
您可以使用subset
论证中aggregate
aggregate(cbind(temp,pressure,wind) ~ day + month + year, df,
subset=year %in% 2005:2014, mean)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)