我有一个数据框,如下所示:
Subject = c(1,1,1,1,2,2,2,2)
OBS = c(1.3,2.4,3.3,4.2,1.2,2.7,3.6,4.9)
REFDATE = as.Date(c('2013-09-25', '2013-09-25', '2013-09-26', '2013-09-26', '2013-09-27', '2013- 09-27', '2013-09-30', '2013-09-30'))
df1 = data.frame(Subject, OBS, REFDATE)
我想添加一个新列 (REFDATE2),其中仅包含最早的 REFDATEeach主题,产生这个:
Subject = c(1,1,1,1,2,2,2,2)
OBS = c(1.3,2.4,3.3,4.2,1.2,2.7,3.6,4.9)
REFDATE = as.Date(c('2013-09-25', '2013-09-25', '2013-09-26', '2013-09-26', '2013-09-27', '2013- 09-27', '2013-09-30', '2013-09-30'))
REFDATE2 = as.Date(c('2013-09-25', '2013-09-25', '2013-09-25', '2013-09-25', '2013-09-27', '2013- 09-27', '2013-09-27', '2013-09-27'))
df2 = data.frame(Subject, OBS, REFDATE, REFDATE2)
数据集中有相当多的主题。我怀疑某种可以识别最早日期的循环函数可以解决这个问题?
任何帮助将非常感激。
真挚地,
ykl