假设我有一些看起来像这样的东西
df = pd.DataFrame({'Event':['A','A','A','A', 'A' ,'B','B','B','B','B'], 'Number':[1,2,3,4,5,6,7,8,9,10],'Ref':[False,False,False,False,True,False,False,False,True,False]})
我想要做的是创建一个新列,该列是 Number 与 ref 中 True 的差异。因此,对于 A 组,True 是最后一个,因此该列将显示为 -4,-3,-2,-1,0。我一直在考虑做以下事情:
for col in df.groupby('Event'):
temp = col[1]
reference = temp[temp.Ref==True]
dist1 = temp.apply(lambda x:x.Number-reference.Number,axis=1)
这似乎对每个组都正确计算,但我不确定如何将结果加入到 df 中。