应用 dplyr 代码后我得到了以下数据框
Final_df<- df %>%
group_by(clientID,month) %>%
summarise(test=toString(Sector)) %>%
as.data.frame()
这给了我以下输出
ClientID month test
ASD Sep Auto,Auto,Finance
DFG Oct Finance,Auto,Oil
我想要的也是计算扇区数
ClientID month test
ASD Sep Auto:2,Finance:1
DFG Oct Finance:1,Auto:1,Oil:1
我怎样才能用 dplyr 实现它?
这是与 @akrun 的解决方案类似但略有不同的解决方案:
count(df, ClientID, month, Sector) %>%
summarise(test = toString(paste(Sector, n, sep=":")))
#Source: local data frame [4 x 3]
#Groups: ClientID [?]
#
# ClientID month test
# <chr> <chr> <chr>
#1 ASD. Oct Finance:2
#2 ASD. Sep Auto:2, Finance:1
#3 DFG. Oct Oil:2
#4 DFG. Sep Auto:1, Finance:2
在这种情况下,count
做同样的事group_by
+ tally
你不需要另一个group_by
自从count
删除最外面的分组变量(Sector
)自动地。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)