我需要帮助根据原始数据创建队列退出表。
我有一个如下所示的数据集:
DT<-data.table(
id =c (1,2,3,4,5,6,7,8,9,10,
11,12,13,14,15,16,17,18,19,20,
21,22,23,24,25,26,27,28,29,30,31,32,33,34,35),
year =c (2014,2014,2014,2014,2014,2014,2014,2014,2014,2014,
2015,2015,2015,2015,2015,2015,2015,2015,2015,2015,
2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016),
cohort =c(1,1,1,1,1,1,1,1,1,1,
2,2,2,1,1,2,1,2,1,2,
1,1,3,3,3,2,2,2,2,3,3,3,3,3,3))
我想按队列计算辍学率,并得到一个像这样的表:
cohortdt<-data.table(
cohort =c(1,2,3),
drop_rateY1 =c(.60,0.0,0.0),
droprate_Y2 =c (.50,.33,0.0))
对于第 1 组,第 1 年末的辍学率为 60%。 (即 60% 最初入学的学生在第 1 年末退学。第 2 年的值意味着 50% 在第 1 年末留下的学生在第 2 年末退学。
如何从原始数据创建这样的表?