如果索引相同，则合并同一数据框中的两行？

2024-01-04

我通过从 Azure 数据库提取数据创建了一个大型 Dataframe。数据框的构造并不简单，因为我必须分部分完成，使用 concat 函数将新列添加到从数据库中提取的数据集中。

这工作得很好，但是我按输入日期建立索引，并且在连接时有时会得到两个具有相同索引的数据行。我可以合并具有相同索引的行吗？我在网上搜索了解决方案，但我总是遇到尝试合并两个单独的数据帧而不是合并同一数据帧中的行的示例。

总之：

This

                      Col1  Col2
2015-10-27 22:22:31   1400  
2015-10-27 22:22:31         50.5

To this

                      Col1  Col2
2015-10-27 22:22:31   1400  50.5

我尝试过在索引上使用 groupby 函数，但这只是搞砸了。大多数数据列消失了，一些非常大的数字被吐出。

Note:

数据采用这种格式，除了有更多的列之外，并且通常非常稀疏！

                        Col1    Col2    ...    Col_n-1 Col_n    
2015-10-27 21:15:60+0   1220        
2015-10-27 21:25:4+0    1420        
2015-10-27 21:28:8+0    1410        
2015-10-27 21:37:10+0           51.5    
2015-10-27 21:37:11+0   1500        
2015-10-27 21:46:14+0           51  
2015-10-27 21:46:15+0   1390        
2015-10-27 21:55:19+0   1370        
2015-10-27 22:04:24+0   1450        
2015-10-27 22:13:28+0   1350        
2015-10-27 22:22:31+0   1400        
2015-10-27 22:22:31+0           50.5
2015-10-27 22:25:33+0   1300        
2015-10-27 22:29:42+0                   ...    1900 
2015-10-27 22:29:42+0                                  63       
2015-10-27 22:34:36+0   1280

You can groupby http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html#pandas.DataFrame.groupby在您的索引上并调用sum http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.sum.html#pandas.DataFrame.sum:

In [184]:
df.groupby(level=0).sum()

Out[184]:
                     Col1  Col2
index                          
2015-10-27 22:22:31  1400  50.5

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

如果索引相同，则合并同一数据框中的两行？的相关文章

编辑 scikit-learn 决策树

我想编辑 sklearn DecisionTree 例如改变条件或切割节点叶子等但似乎没有功能可以做到这一点如果我可以导出到文件编辑它以导入如何编辑决策树环境 Windows 10 python3 3 sklearn 0 17
为什么 tkinter / window.update 在我的程序中随着时间的推移变得更慢？

我发现当我调用 window update 时当向窗口写入的内容较少时它的运行速度会更快但后来当我向窗口写入更多元素时 window update 需要更长的时间请参阅下面的我的代码您可以看到它在更新窗口之前一次向屏幕 100
Python 遍历目录树的方法是什么？

我觉得分配文件和文件夹并执行 item 部分有点黑客有什么建议么我正在使用Python 3 2 from os import from os path import def dir contents path contents list
Python sqlite3游标没有属性commit

当我运行这段代码时 path Scripts wallpapers single png conn sqlite3 connect Users Heaven Library Application Support Dock desktopp
conda 无法从 yml 创建环境

我尝试运行下面的代码来从 YAML 文件创建虚拟 Python 环境我在 Ubuntu 服务器上的命令行中运行代码虚拟环境名为 py36 当我运行下面的代码时我收到下面的消息环境也没有被创建这个问题是因为我有几个必须使用 pip
如何从谷歌云存储桶读取音频文件并在datalab笔记本中使用ipd播放

我想在数据实验室笔记本中播放我从谷歌云存储桶中读取的声音文件这个怎么做 import numpy as np import IPython display as ipd import librosa import soundfile as
html 解析器 python

我正在尝试解析一个网站我正在使用 HTMLParser 模块问题是我想解析第一个 a href 评论后但我真的不知道该怎么做所以我在文档中发现有一个函数叫做handle comment 但我还没有找到如何正确使用它我有以下内容 i
字典中的列表，Python 中的循环

我有以下代码 TYPES hotmail type hotmail lookup mixed dkim no signatures S Return Path email protected cdn cgi l email protecti
使用 Scipy imsave 将 Numpy 数组保存到图像时保留未更改的数据

使用 Scipy 保存二维 Numpy 数组单个值时toimage or imsave像素值与 Numpy 数组中的像素值不完全匹配相反在某些区域主要是边缘图像算法似乎使用某种插值是否有一个选项可以停止插值并保留准确的数据例
在 Flask (WSGI) 中使用全局单例，我是否需要担心竞争条件？ [复制]

这个问题在这里已经有答案了 Flask 的 hello world 演示是 from flask import Flask app Flask name app route def hello return Hello World if n
用Python中的嵌套for循环替换重复的if语句？

在我编写的下面的代码中 n 4 所以有五个 if 语句所以如果我想将 n 增加到比如说 10 那么就会有很多 if 语句因此我的问题是如何用更优雅的东西替换所有 if 语句 n p 4 5 number of trials prob
Python 视频框架

我正在寻找一个 Python 框架它将使我能够播放视频并在该视频上绘图用于标记目的我尝试过 Pyglet 但这似乎效果不是特别好在现有视频上绘图时会出现闪烁即使使用双缓冲和所有这些好东西而且似乎没有办法在每帧回调期间获取视频中
如何获得没有前缀的虚拟人物？

我想从两个不同的列中获取虚拟数据但没有任何前缀资料说明 X Y 123 AAA 456 BBB 123 AAA 789 CCC 预期结果 X Y 789 456 123 CCC BBB AAA 123 AAA 0 0 1 0 0 1 4
从 IMDbPy 结果中的片目中获取电影 ID

我正在尝试创建一个数据集允许我根据 Python IMDb API 中的演员 ID 和电影 ID 加入演员和电影现在我正在尝试从演员的电影作品中提取电影 ID 列表但无法做到例如我知道 Rodney Dangerfield 在
如何设置 matplotlib 表中列的背景颜色

我在一个目录中有多个 txt 文件例如 d memdump 0 txt 1 txt 10 txt 示例文本文件如下 Applications Memory Usage kB Uptime 7857410 Realtime 7857410
如何正确消除字典中的元素直到只剩下一个字符串

我真的需要这方面的帮助 def get winner dict winner new dict for winner in dict winner first letter winner 0 value dict winner winner
SQLAlchemy：避免声明式样式类定义中的重复

我正在使用 SQLAlchemy 并且我的对象模型中的许多类具有相同的两个属性 id 和整数和主键以及名称字符串我试图避免在每个类中声明它们如下所示 class C1 declarative base id Column Inte
scipysolve_ivp() 中的访问时间步长

我有一个常微分方程系统正在使用 scipy 的solve ivp 函数求解它运行良好但我在访问每个步骤中使用的时间步时遇到问题我知道solve ivp 将当前时间传递给用户定义的函数但我需要使用的时间步长而不是当前时间为了解决
在Python中从日期时间中减去秒

我有一个 int 变量它实际上是秒让我们调用这个秒数X 我需要得到当前日期和时间以日期时间格式减去的结果X秒 Example If X是 65 当前日期是2014 06 03 15 45 00 那么我需要得到结果2014 06 03
为什么用字符串和时间增量转置 DataFrame 会转换数据类型？

这种行为对我来说似乎很奇怪 id列字符串在转置后转换为时间戳df如果另一列是时间增量 import pandas as pd df pd DataFrame id 00115 01222 32333 val 12 14 170 df v

随机推荐

使用 webpack 2 分割“vendor”块

我有类似于官方的代码分割配置docs https webpack js org guides code splitting libraries manifest file一切都很完美我的所有节点模块都在供应商块中包括 babel p
request_threaded_irq()在驱动程序中使用，为什么不使用request_irq()？两者有什么区别？

我发布了这是讨论 request threaded irq 的线程但我没有得到任何回复所以我新鲜发布它我正在开发电容式触摸屏的触摸屏驱动程序它使用 request threaded irq 调用而不是 request irq 我无法
水平滚动到锚点

我有一个水平导航的网站这是代码 ul li a href box 1 a li li a href box 2 a li li a href box 3 a li li a href box 4 a li li a href box 5
ggplot箱线图+填充+颜色布鲁尔光谱

我似乎无法fill使用 color Brewer 绘制连续值的箱线图我知道它一定只是某个地方的简单语法交换因为我可以根据连续值调整框的轮廓这是我正在使用的数据 data lt data frame value sample 1 50
Keycloak v.18：如何使用 Keycloak API 与用户进行操作

我试图获取并更改某些特定用户姓名电子邮件等但我的链接返回一些未知错误这是我的链接 http localhost 8080 admin realms space realm users 你能解释一下我做错了什么吗将不胜感激 This
在我的网站上流式传输音频

我对在我的网站上流式传输音频感兴趣但我不知道从哪里开始我希望实现两种类型的流媒体第一个是流式传输服务器上存储的歌曲播放列表第二个是实时音频流谁能推荐一些好的网站或插件来使用声音管理器2 http www schillmania
如何打开 STDIN/STDOUT 句柄并正确使用 utf8 编码？

我的代码中有 utf8 字符所以我这样做 use utf8 my line 382 I 03 02 2020 print line Wide character in print at 然后我想我的 STDOUT 应该在utf8 use
如何使用 T32_WriteMemory 函数将值写入 python 中的内存地址

我正在尝试使用 python 自动化 Trace32 函数我正在尝试使用 T32 WriteMemory 函数将值写入内存地址有人可以帮助我如何继续使用此功能吗以下是 T32 Api pdf api remote pdf 的参考 in
如何获取express.js中请求查询参数的数量？

目前我必须单独检查每个可能存在的参数 if req query param1 undefined if req query param2 undefined if req query param3 undefined 获取所有查询参数 Ob
关于 ADC，-1 (0xFFFFFFFF) 有什么特别之处吗？

在我的一个研究项目中我正在编写 C 代码然而生成的程序集是该项目的关键点之一 C 不提供对标志操作指令的直接访问特别是ADC但这不应该是一个问题只要编译器足够聪明来使用它考虑 constexpr unsigned X 0 uns
Hadoop安装：Namenode无法启动

目前我正在尝试在我的 ubuntu 14 10 32 位 utopic 上安装 hadoop 2 6 0 我按照这里的说明进行操作 http www itzgeek com how tos linux ubuntu how tos inst
比在 python 中连接多个 cv2 图像（numpy 数组）更快的方法？

我有 100 张小图像我想将它们组合成一张大 10x10 网格图像以便用 imshow 显示每个图像作为 numpy 数组都位于单元对象的变量内目前我使用连接首先创建垂直条带然后使用连接来连接所有这些条带但看起来有点笨重
Puma Rails 5 Binding.pry 在超时前仅可用 60 秒

当我使用时 Puma 超时了我的请求binding pry 在我的控制器中 def new require pry binding pry end 然后我发出一个请求该请求会击中控制器并进入 pry 会话 60秒后彪马超时我的请求重
如何实现时间跨度到字符串的转换？

我尝试搜索here http msdn microsoft com en us library 1ecy8h51 aspx 但这对我帮助不大我想要converttime span 为字符串我不想返回以天为单位的时间跨度而只想返回 HH
第三方 IPC 调用 Chromium 来捕获/过滤流量

我想为 Chromium 实现一个类似网络级 AdBlock NoScript 的工具但 Chromium Extension API 在控制原始请求数据方面无能为力所以这是我的想法捕获所有 HTTP 查询如果 URL 或 MIME
当 crtdbg.h 导致冲突时覆盖 C++ 中的 new 运算符

在尝试一些内存跟踪和为我自己的内存管理器做准备时我尝试覆盖新的运算符关于 Flipcode 的文章是我在此过程中的主要指南 http www flipcode com archives How To Find Memory Leaks
使用 db.StringProperty() 作为 Google App Engine 中的唯一标识符

我对此只是有一种预感但如果感觉我做错了我想要做的是将 db StringProperty 作为唯一标识符我有一个简单的 db Model 带有属性名称和文件如果我添加另一个与 db Model 中已有的名称相同的条目我想更新它
使用 Boost.Log 的通道层次结构进行严重性和接收器过滤

我已经研究 Boost Log 一段时间了我相信现在是我将代码库从 log4cxx 转换到 Boost Log 的时候了我相信Boost Log的设计和实现将显着改善我的代码维护和使用我知道 Boost Log FAQ 有一个页面说
asp.net mvc中的jQuery ajax上传文件

我的视图中有一个文件
如果索引相同，则合并同一数据框中的两行？

我通过从 Azure 数据库提取数据创建了一个大型 Dataframe 数据框的构造并不简单因为我必须分部分完成使用 concat 函数将新列添加到从数据库中提取的数据集中这工作得很好但是我按输入日期建立索引并且在连接时有时会得到

热门标签