我有一个时间序列数据框,它包含三列......日期、时间和值,它看起来像这样:
**date** **time** **value**
11.03.2020 1103 5
11.03.2020 0000 10
11.03.2020 0100 6
12.03.2020 0201 8
12.03.2020 0305 7
12.03.2020 0400 4
基本上,时间列每行增加 60 (+-5) 分钟。我想以这样的方式更正我的日期列值:每当时间为 0000 (+-5) 时,日期列的日期部分就会递增 1,直到遇到下一个 0000 (+-5) 时间值,然后它才会递增再次加 1,直到遇到下一个这样的时间值或到达数据帧的末尾。
结果应该是这样的:
**date** **time** **value**
11.03.2020 1103 5
12.03.2020 0000 10
12.03.2020 0100 6
12.03.2020 0201 8
12.03.2020 0305 7
12.03.2020 0400 4
我希望得到一些帮助。谢谢
解析列中的字符串date
as datetime
df['date'] = pd.to_datetime(df['date'], dayfirst=True)
创建布尔掩码m
通过比较time
列与0000
,使用布尔索引添加DateOffset
of 1 days
到日期列中布尔掩码为 true 的值,然后mask
and forward fill
更新日期列中的值,其中当前日期小于前一个日期
m = df['time'].eq('0000')
df.loc[m, 'date'] += pd.DateOffset(days=1)
df['date'] = df['date'].mask(df['date'].diff().dt.days.lt(0)).ffill()
date time value
0 2020-03-11 1103 5
1 2020-03-12 0000 10
2 2020-03-12 0100 6
3 2020-03-12 0201 8
4 2020-03-12 0305 7
5 2020-03-12 0400 4
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)