我通过从 Azure 数据库提取数据创建了一个大型 Dataframe。数据框的构造并不简单,因为我必须分部分完成,使用 concat 函数将新列添加到从数据库中提取的数据集中。
这工作得很好,但是我按输入日期建立索引,并且在连接时有时会得到两个具有相同索引的数据行。我可以合并具有相同索引的行吗?我在网上搜索了解决方案,但我总是遇到尝试合并两个单独的数据帧而不是合并同一数据帧中的行的示例。
总之:
This
Col1 Col2
2015-10-27 22:22:31 1400
2015-10-27 22:22:31 50.5
To this
Col1 Col2
2015-10-27 22:22:31 1400 50.5
我尝试过在索引上使用 groupby 函数,但这只是搞砸了。大多数数据列消失了,一些非常大的数字被吐出。
Note:
数据采用这种格式,除了有更多的列之外,并且通常非常稀疏!
Col1 Col2 ... Col_n-1 Col_n
2015-10-27 21:15:60+0 1220
2015-10-27 21:25:4+0 1420
2015-10-27 21:28:8+0 1410
2015-10-27 21:37:10+0 51.5
2015-10-27 21:37:11+0 1500
2015-10-27 21:46:14+0 51
2015-10-27 21:46:15+0 1390
2015-10-27 21:55:19+0 1370
2015-10-27 22:04:24+0 1450
2015-10-27 22:13:28+0 1350
2015-10-27 22:22:31+0 1400
2015-10-27 22:22:31+0 50.5
2015-10-27 22:25:33+0 1300
2015-10-27 22:29:42+0 ... 1900
2015-10-27 22:29:42+0 63
2015-10-27 22:34:36+0 1280
You can groupby http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html#pandas.DataFrame.groupby在您的索引上并调用sum http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.sum.html#pandas.DataFrame.sum:
In [184]:
df.groupby(level=0).sum()
Out[184]:
Col1 Col2
index
2015-10-27 22:22:31 1400 50.5
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)