如何在循环中追加多个 pandas DataFrame？

2023-12-03

我已经在这个 python 问题上苦苦挣扎了一段时间，但陷入了困境。我正在循环遍历多个 csv 文件，并希望有一个数据框以每个 csv 文件中的一列作为列名称并设置 date_time 的公共索引的方式附加 csv 文件。

有 11 个 csv 文件看起来像这个数据框，除了不同之处value and pod数，但是time_stamp所有 csv 都相同。

data

    pod time_stamp  value
0   97  2016-02-22  3.048000
1   97  2016-02-29  23.622001
2   97  2016-03-07  13.970001
3   97  2016-03-14  6.604000
4   97  2016-03-21  NaN

这是我到目前为止的 for 循环：

import glob
import pandas as pd

filenames = sorted(glob.glob('*.csv'))

new = []

for f in filenames:
    data = pd.read_csv(f)

    time_stamp = [pd.to_datetime(d) for d in time_stamp]

    new.append(data)

my_df = pd.DataFrame(new, columns=['pod','time_stamp','value'])

我想要的是一个看起来像这样的数据框，其中每一列都是以下结果value来自每个 csv 文件。

time_stamp  97        98       99 ...
2016-02-22  3.04800   4.20002  3.5500
2016-02-29. 23.62201  24.7392  21.1110
2016-03-07 13.97001   11.0284  12.0000

但现在的输出my_df是非常错误的，看起来像这样。对我哪里出错有什么想法吗？

    0
0   pod time_stamp value 0 22 2016-...
1   pod time_stamp value 0 72 2016-...
2   pod time_stamp value 0 79 2016-0...
3   pod time_stamp value 0 86 2016-...
4   pod time_stamp value 0 87 2016-...
5   pod time_stamp value 0 88 2016-...
6   pod time_stamp value 0 90 2016-0...
7   pod time_stamp value 0 93 2016-0...
8   pod time_stamp value 0 95 2016-...

我建议首先将所有数据框连接在一起pd.concat，然后做最后一项pivot手术。

filenames = sorted(glob.glob('*.csv'))

new = [pd.read_csv(f, parse_dates=['time_stamp']) for f in filenames]
df = pd.concat(new) # omit axis argument since it is 0 by default

df = df.pivot(index='time_stamp', columns='pod')

请注意，我是强迫的read_csv解析time_stamp when loading数据帧，因此不再需要加载后解析。

MCVE

df

   pod  time_stamp      value
0   97  2016-02-22   3.048000
1   97  2016-02-29  23.622001
2   97  2016-03-07  13.970001
3   97  2016-03-14   6.604000
4   97  2016-03-21        NaN

df.pivot(index='time_stamp', columns='pod')

                value
pod                97
time_stamp           
2016-02-22   3.048000
2016-02-29  23.622001
2016-03-07  13.970001
2016-03-14   6.604000
2016-03-21        NaN

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

csv

DataFrame

append

如何在循环中追加多个 pandas DataFrame？的相关文章

如何使用包含代码的“asyncio.sleep()”进行单元测试？

我在编写 asyncio sleep 包含的单元测试时遇到问题我要等待实际的睡眠时间吗 I used freezegun到嘲笑时间当我尝试使用普通可调用对象运行测试时这个库非常有用但我找不到运行包含 asyncio sleep 的测
R 中的列乘以子字符串

假设我有一个数据框其中包含多个组件及其在多个列中列出的属性并且我想对这些列运行多个函数我的方法是尝试将其基于每个列标题中的子字符串但我无法弄清楚如何做到这一点下面是数据框的示例 Basket F Type 1 F Qty 1 F
将每列的值乘以 R 中另一个 data.frame 中的权重

我有两个data frames df and weights 代码如下 df看起来像这样 id a b d EE f 1 this 0 23421153 0 02324956 0 5457353 0 73068586 0 5642554 2
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
用于运行可执行文件的python多线程进程

我正在尝试将一个在 Windows 上运行可执行文件并管理文本输出文件的 python 脚本升级到使用多线程进程的版本以便我可以利用多个核心我有四个独立版本的可执行文件每个线程都知道要访问它们这部分工作正常我遇到问题的地方是当它们
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例

随机推荐

使用虚方法的 C++ 对象大小

我对虚拟对象的大小有一些疑问 1 虚函数 class A public int a virtual void v A类的大小是8字节一个整数 4字节加1个虚拟指针 4字节天气晴朗 class B public A public int
Bullet/ammo.js 中的刚体（形状）来自 Three.js 中的网格

我将bullet ammo js 与 Three js 一起使用我有一个 3d 网格我想使用精确的形状与软体进行碰撞检测有没有办法从网格在 Three js 中创建 3D 刚体在项目符号中这是一个例子 http kidzins
对子数组进行向量化 numpy 唯一

我有一个形状为 N 20 20 的 numpy 数组数据其中 N 是一个非常大的数字我想获取每个 20x20 子数组中唯一值的数量循环如下 values for i in data values append len np uniqu
为什么java支持原始数据类型的函数重载？ [复制]

这个问题在这里已经有答案了在学习java中的自动装箱和拆箱时我了解到java会在需要时将原始数据类型转换为包装类反之亦然例如如果函数正在执行Integer作为参数如果我们将值传递为1然后java编译器会将其转换为new Integ
内存中、独立、断开连接的 ADO 记录集

当我的表单加载时我在数据表子表单上运行此代码并且没有收到任何错误消息或代码中断我的 debug print 显示记录集 rs 充满了 2131 条记录就像它应该的那样但我的表单显示单行带有 Name 在各个领域我的控件上的控件源
在Android中浏览并上传pdf或word文件

private void getDocument Intent intent new Intent Intent ACTION GET CONTENT intent setType application msword applicatio
ASP.Net MVC4 将“创建视图”绑定到包含列表的模型

你好在互联网领域我有一个有趣的难题要问你如果该对象包含纯粹使用 MVC 视图部分视图的其他对象的列表是否可以绑定视图来创建对象伙计结果很复杂就像让我给你一个快速的代码示例来说明我的意思 Models public clas
mongodb是否会自动在嵌入文档的_id字段上创建索引？

在 node js 项目上使用 mongodb 和 mongoose 我想知道是否必须在嵌入项目的 id 字段上确保索引也就是说我看到 mongodb 自动在集合的 id 字段上创建索引它是否也对嵌入集合的 id 字段执行相同的操作
使用反射在抽象类中创建实例

是否可以使用反射在抽象祖先类中创建派生类的实例可以说 abstract class Base public Base createInstance using reflection Class ctor c getConstructor
Google 日历 api（超出日历使用限制）

我在我的 php 项目中使用 Google Calendar Api 每天在执行插入查询时都会收到超出日历使用限制消息但删除和列表方法工作正常这是我的插入功能谁能帮我 function insertEvent start end
使用复选框在 ReactJS 中保存表单值

我使用反应钩子表单创建了一个表单组件该组件由一组复选框和一个文本输入组成当用户单击最后一个复选框时出现文本输入custom 这个的想法是当用户单击时会出现一个文本输入并且用户可以添加自定义答案选项例如如果用户输入test在输
Django：通过查询计算列值的总和

我有一个模型 class ItemPrice models Model price models DecimalField max digits 8 decimal places 2 我尝试用这个来计算总和price在此查询集中 items
两个卷积层之间的互连

我有一个关于 CNN 中两个卷积层之间互连的问题例如假设我有这样的架构输入 28 28 conv1 3 x 3 滤波器编号过滤器数量 16 conv2 3 x 3 滤波器编号过滤器数量 32 假设图像尺寸没有减小经过 conv
值传递和 std::move 相对于引用传递的优点

我现在正在学习C 尽量避免养成坏习惯据我了解 clang tidy包含许多最佳实践我尝试尽可能地坚持它们尽管我不一定理解why它们还被认为是好的但我不确定我是否理解这里推荐的内容我使用了教程中的此类 class Creature
如何使用 Mongoose 删除数据库？

我正在 Node js 和 Mongoose 中准备一个数据库创建脚本如何检查数据库是否已存在如果存在则使用 Mongoose 删除删除它我找不到用 Mongoose 删除它的方法没有方法可以从猫鼬中删除集合您能做的最好的事
Oracle 根据出生日期和今天计算年龄

我想在 Oracle 函数中根据出生日期计算当前年龄我正在使用的是 Today Dob 30 12 但这并不准确因为有些月份有 31 天我需要以最高精度获得正确的年龄我怎样才能做到这一点 SQL gt select trunc mo
带有附加列的sql批量插入

csv 文件包含 8 列 col1 col2 col8 文件名也包含必须插入表中的日期如果表中的列数和 csv 文件中的列数相等则以下查询将文件中的所有记录导入到表中 query BULK INSERT real data FROM p
如何从分类分布中抽取样本

我有一个 3D numpy 数组其中最后一个维度中包含每个类别的概率就像是 import numpy as np from scipy special import softmax array np random normal size
在控制台显示上对齐 printf() 列并防止溢出到下一行？

printf processid t threadid t refilling t drinking t thinking t waiting t terminated t p type t required t consumed t wa
如何在循环中追加多个 pandas DataFrame？

我已经在这个 python 问题上苦苦挣扎了一段时间但陷入了困境我正在循环遍历多个 csv 文件并希望有一个数据框以每个 csv 文件中的一列作为列名称并设置 date time 的公共索引的方式附加 csv 文件有 11 个 cs

如何在循环中追加多个 pandas DataFrame？

如何在循环中追加多个 pandas DataFrame？ 的相关文章

随机推荐

热门标签

如何在循环中追加多个 pandas DataFrame？的相关文章