您可以使用该功能tz_localize
使 Timestamp 或 DateTimeIndex 时区感知,但如何做相反的事情:如何将时区感知时间戳转换为天真的时间戳,同时保留其时区?
一个例子:
In [82]: t = pd.date_range(start="2013-05-18 12:00:00", periods=10, freq='s', tz="Europe/Brussels")
In [83]: t
Out[83]:
<class 'pandas.tseries.index.DatetimeIndex'>
[2013-05-18 12:00:00, ..., 2013-05-18 12:00:09]
Length: 10, Freq: S, Timezone: Europe/Brussels
我可以通过将时区设置为 None 来删除时区,但随后结果会转换为 UTC(12 点变为 10 点):
In [86]: t.tz = None
In [87]: t
Out[87]:
<class 'pandas.tseries.index.DatetimeIndex'>
[2013-05-18 10:00:00, ..., 2013-05-18 10:00:09]
Length: 10, Freq: S, Timezone: None
有没有另一种方法可以将 DateTimeIndex 转换为天真的时区,但同时保留它设置的时区?
Some context我问这个问题的原因是:我想使用时区天真的时间序列(以避免时区的额外麻烦,并且我不需要它们来处理我正在处理的情况)。
但由于某种原因,我必须处理本地时区(欧洲/布鲁塞尔)中的时区感知时间序列。由于我的所有其他数据都是天真的时区(但以我的本地时区表示),我想将此时间序列转换为天真以进一步使用它,但它也必须以我的本地时区表示(因此只需删除时区信息,无需转换用户可见UTC 时间)。
我知道时间实际上是内部存储为 UTC 的,只有当您表示它时才转换为另一个时区,因此当我想要“非本地化”它时必须进行某种转换。例如,使用 python datetime 模块,您可以像这样“删除”时区:
In [119]: d = pd.Timestamp("2013-05-18 12:00:00", tz="Europe/Brussels")
In [120]: d
Out[120]: <Timestamp: 2013-05-18 12:00:00+0200 CEST, tz=Europe/Brussels>
In [121]: d.replace(tzinfo=None)
Out[121]: <Timestamp: 2013-05-18 12:00:00>
因此,基于此,我可以执行以下操作,但我认为在处理较大的时间序列时这不会非常有效:
In [124]: t
Out[124]:
<class 'pandas.tseries.index.DatetimeIndex'>
[2013-05-18 12:00:00, ..., 2013-05-18 12:00:09]
Length: 10, Freq: S, Timezone: Europe/Brussels
In [125]: pd.DatetimeIndex([i.replace(tzinfo=None) for i in t])
Out[125]:
<class 'pandas.tseries.index.DatetimeIndex'>
[2013-05-18 12:00:00, ..., 2013-05-18 12:00:09]
Length: 10, Freq: None, Timezone: None