我已经在这个 python 问题上苦苦挣扎了一段时间,但陷入了困境。我正在循环遍历多个 csv 文件,并希望有一个数据框以每个 csv 文件中的一列作为列名称并设置 date_time 的公共索引的方式附加 csv 文件。
有 11 个 csv 文件看起来像这个数据框,除了不同之处value
and pod
数,但是time_stamp
所有 csv 都相同。
data
pod time_stamp value
0 97 2016-02-22 3.048000
1 97 2016-02-29 23.622001
2 97 2016-03-07 13.970001
3 97 2016-03-14 6.604000
4 97 2016-03-21 NaN
这是我到目前为止的 for 循环:
import glob
import pandas as pd
filenames = sorted(glob.glob('*.csv'))
new = []
for f in filenames:
data = pd.read_csv(f)
time_stamp = [pd.to_datetime(d) for d in time_stamp]
new.append(data)
my_df = pd.DataFrame(new, columns=['pod','time_stamp','value'])
我想要的是一个看起来像这样的数据框,其中每一列都是以下结果value
来自每个 csv 文件。
time_stamp 97 98 99 ...
2016-02-22 3.04800 4.20002 3.5500
2016-02-29. 23.62201 24.7392 21.1110
2016-03-07 13.97001 11.0284 12.0000
但现在的输出my_df
是非常错误的,看起来像这样。对我哪里出错有什么想法吗?
0
0 pod time_stamp value 0 22 2016-...
1 pod time_stamp value 0 72 2016-...
2 pod time_stamp value 0 79 2016-0...
3 pod time_stamp value 0 86 2016-...
4 pod time_stamp value 0 87 2016-...
5 pod time_stamp value 0 88 2016-...
6 pod time_stamp value 0 90 2016-0...
7 pod time_stamp value 0 93 2016-0...
8 pod time_stamp value 0 95 2016-...