循环遍历目录中的文件，在 pandas 中添加日期列

2024-03-18

我的所有文件都具有以下标题，并且它们可以追溯到几年前。我希望能够读取每个文件，然后将文件名中的日期添加为一列。

截至 2015-04-01.csv 的文件类型

path = 'C:\\Users\\'  
filelist = os.listdir(path)     #All of my .csv files I am working with
file_count = len(filelist)      #I thought I could do a for loop and use this as a the range
df = Series(filelist)           #I just added this because I couldn't get the date from a list
date_name = df.str[15:-4]       #This gives me the date

所以我尝试过的是：

for file in filelist:
    df = pd.read_csv(file)

现在我想从文件名中获取 date_name 并添加一个名为 date 的列。每个文件都完全相同，但我想跟踪一段时间内的更改，并且唯一的日期只能在文件名上找到。

然后我会追加它。

path = 'C:\\Users\\'
filelist = glob.glob(path + "/*.csv")
frame = pd.DataFrame()
list = []
for file in filelist:
    df = pd.read_csv(file)
    list_.append(df)
frame = pd.concat(list)

如何将 date_name 添加到文件/数据框？ 1) 读取文件，2) 根据文件名添加日期列，3) 读取下一个文件，4) 添加日期列，5) 追加，6) 对路径中的所有文件重复

编辑 - - 我想我有事情要做——这是最好的方法吗？有人可以解释一下 list = [] 在做什么吗？

path = 'C:\\Users\\'
filelist = os.listdir(path) 
list = []
frame = pd.DataFrame()
for file in filelist:
    df2 = pd.read_csv(path+file)
    date_name = file[15:-4]
    df2['Date'] = date_name
    list.append(df2)
frame = pd.concat(list)

这似乎是一个合理的方法。这pd.concat获取 pandas 对象列表并将它们连接起来。append添加每个frame当您循环浏览文件时到列表中。不过，我认为有两件事需要改变。

你不需要frame = pd.DataFrame()。当您附加时它没有做任何事情dataframes到列表中。
我会更改变量的名称list到别的东西。或许frames因为它是对内容的描述，并不意味着什么。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

循环遍历目录中的文件，在 pandas 中添加日期列的相关文章

Python 类型提示 Dict 语法错误可变默认值是不允许的。使用“默认工厂”

我不知道为什么解释器会抱怨这个类型的字典对于这两个实例我得到一个不允许可变默认值使用默认工厂语法错误我使用的是 python 3 7 3 from dataclasses import dataclass from typing
如何在 __init__ 中使用await设置类属性

我如何定义一个类await在构造函数或类体中例如我想要的 import asyncio some code class Foo object async def init self settings self settings setti
为什么 dataclasses.astuple 返回类属性的深层副本？

在下面的代码中astuple函数正在执行数据类的类属性的深层复制为什么它不能产生与函数相同的结果my tuple import copy import dataclasses dataclasses dataclass class Dem
在 Python 中将列表元素作为单独的项目返回

Stackoverflow 的朋友们大家好我有一个计算列表的函数我想单独返回列表的每个元素如下所示接收此返回的函数旨在处理未定义数量的参数 def foo my list 1 2 3 4 return 1 2 3 4 列表中的元素数
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
pandas DataFrame.join 的运行时间是多少（大“O”顺序）？

这个问题更具概念性理论性与非常大的数据集的运行时间有关所以我很抱歉没有一个最小的例子来展示我有一堆来自两个不同传感器的数据帧我需要最终将它们连接成两个very来自两个不同传感器的大数据帧 df snsr1 and df snsr2
VSCode Settings.json 丢失

我正在遵循教程并尝试将 vscode 指向我为 Scrapy 设置的虚拟工作区但是当我在 VSCode 中打开设置时工作区设置选项卡不在用户设置选项卡旁边我还尝试通过以下方式手动转到文件 APPDATA Code User s
从Django中具有外键关系的两个表中检索数据？ [复制]

这个问题在这里已经有答案了 This is my models py file from django db import models class Author models Model first name models CharFie
PyQt 使用 ctrl+Enter 触发按钮

我正在尝试在我的应用程序中触发确定按钮我当前尝试的代码是这样的 self okPushButton setShortcut ctrl Enter 然而它不起作用这是有道理的我尝试查找一些按键序列here http ftp ics
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
Python 内置的 super() 是否违反了 DRY？

显然这是有原因的但我没有足够的经验来认识到这一点这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
通过Python连接到Bigquery：ProjectId和DatasetId必须非空

我编写了以下脚本来通过 SDK 将 Big Query 连接到 Python 如下所示 from google cloud import bigquery client bigquery Client project My First Pr
pandas - 包含时间序列数据的堆积条形图

我正在尝试使用时间序列数据在 pandas 中创建堆积条形图 DATE TYPE VOL 0 2010 01 01 Heavy 932 612903 1 2010 01 01 Light 370 612903 2 2010 01 01 Me
Pandas 组合不同索引的数据帧

我有两个数据框df 1 and df 2具有不同的索引和列但是有一些索引和列重叠我创建了一个数据框df索引和列的并集因此不存在重复的索引或列我想填写数据框df通过以下方式 for x in df index for y in df
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
python 中的“槽包装器”是什么？

object dict 和其他地方的隐藏方法设置为这样的
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
python 对浮点数进行不正确的舍入

gt gt gt a 0 3135 gt gt gt print 3f a 0 314 gt gt gt a 0 3125 gt gt gt print 3f a 0 312 gt gt gt 我期待 0 313 而不是 0 312 有没有
NLTK：查找单词大小为 2k 的上下文

我有一个语料库我有一个词对于语料库中该单词的每次出现我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表我在算法上做得很好见下文但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size

随机推荐

PascalScript 是否与 Delphi XE5 兼容以创建 Android/iOS/Windows 应用程序？

我想创建一个基于 JSON 数据绘制简单表单的应用程序我需要一个脚本来对此进行情报处理 RemObjects 的 Pascal Script 可以解决这个问题吗是否兼容为 Android iOS 和 Windows 生成具有相同源代码的
filterContentForSearchText:scope: 方法从哪里来？

最近我注意到filterContentForSearchText scope 出现在有关如何实现搜索栏的多个教程中不过我查阅了两者的参考资料UISearchDisplayDelegate and UISearchBarDelegate
Keras提前停止回调错误，val_loss指标不可用

我正在训练 Keras Tensorflow 后端 Python 在 MacBook 上并且在 fit generator 函数的早期停止回调中遇到错误错误如下 RuntimeWarning Early stopping conditi
如何使用 python3 在 aws 上使用过滤表达式作为嵌套映射属性？

我一直在尝试扫描 DynamoDB 以检查名为可交付成果的嵌套地图属性中的特定值但是使用带有过滤表达式的扫描会导致空结果 import boto3 result dynamo client boto3 client dynamodb
Numpy 确实以不同方式对待 float('nan') 和 float - 转换为 None

我想从普通数组创建一个 Numpy 数组并转换nan价值观None 但成功取决于天气第一个值是正常浮点数或者float nan 这是我的代码从初始数组开始 print a array d 3 2345 nan 2 0 3 2 1
iOS SDK v2 的 Amazon S3 视频上传问题

尊敬的开发人员我遇到了与 Amazon S3 视频上传相关的问题我正在使用 iOS SDK V2 来安排 iOS 客户端和 Amazon 之间的交互我已经阅读了亚马逊开发人员提供的所有文档并调查了手册并且出现了一些未记录的问题我将
nginx 和 Perl：FastCGI 与反向代理 (PSGI/Starman)

如今运行 Perl Web 应用程序的一个非常流行的选择似乎是在 nginx Web 服务器后面将请求代理到 FastCGI 守护程序或启用 PSGI 的 Web 服务器例如 Starman 关于为什么人们会这样做有很多疑问例如为什么将
如何使用带有多个子节点的sql将表数据转换为xml格式

我有一个如下表结构 SELECT EmpID EmpName DeptName BirthDate FROM dbo Employees 我想将此表数据转换为 XML 最终输出如下
两个数组的和

练习说创建一个函数参数为两个 int 数组 k 是它们的大小该函数应该返回另一个数组大小 k 其中每个元素都是同一位置的两个数组的总和这就是我写的但是它崩溃了我必须用指针来做吗 include
Backbone.js 路由可选参数

Backbone js 路由中是否可以有可选参数例如这个 routes search query searchIndex 代替 routes search searchIndex search query searchIndex 从 Ba
如何在 Visual Studio 2010 for Linux 中编译

是否可以使用 Visual Studio 2010 不一定是 MSVC 编译器在 Windows 上开发 C C 并获得可以上传到 Linux 计算机并运行它的二进制文件我检查的可能性是使用 MinGW 或类似的东西来让 Windo
编译时（constexpr）浮点模？

考虑以下函数该函数在编译时根据参数类型计算积分或浮点模 template
如何切换 NSSplitView 子视图的可见性 + 隐藏窗格拆分器分隔符？

我们有一个父母Split view NSSplitView 和两个子视图 Content and SideBar 侧边栏位于右侧什么是最佳的可可友好方式来切换SideBar view 如果建议的解决方案包含动画我真的很喜欢我真的不需要
跳过 UIImagePickerController 预览视图？

我正在使用 UIImagePickerController 允许我的用户从资源库中选择视频当 UIImagePickerController 最初显示时它会显示已录制的各种电影的缩略图用户选择电影后它会显示预览视图允许他们播放
用于命名 CLS 兼容替代属性的模式

如果我有这样的房产 CLSCompliant false public uint Something 并且想要编写一个替代方案我不能像编写方法那样只编写一个重载但我该怎么命名呢 NET 库中有一些通用的方法吗 public long S
启动待办事项示例时出错

菜鸟在这里在Linux上我安装了meteor 尝试加载 todos 应用程序收到此错误好像和文件系统监控有关我缺少包裹或烫发吗我用 sudo 安装了meteor 但我安装了 todos 作为我的基本用户提前致谢 mkdir m
对 JS 和 CSS 的请求改为给出 index.html

我在用着Express and create react app 我的 React 应用程序已经发展了很长一段时间现在我正在尝试从 Express 服务器提供它 server app js const express require ex
Inno Setup：将 DLL 放入子目录中

我想将依赖项几个 DLL 文件复制到单独的子目录中安装我的程序后目录结构将如下所示 dlls a dll b dll sample pg exe 我的脚本的相关部分如下 Dirs Name app sample Name app d
Django 可重用应用程序教程，ImportError：没有名为“polls”的模块

我试图跟随本教程 https docs djangoproject com en 1 8 intro reusable apps 重用民意调查应用程序但是当我成功打包应用程序并安装包后 Unpacking home julia Docu
循环遍历目录中的文件，在 pandas 中添加日期列

我的所有文件都具有以下标题并且它们可以追溯到几年前我希望能够读取每个文件然后将文件名中的日期添加为一列截至 2015 04 01 csv 的文件类型 path C Users filelist os listdir path All

循环遍历目录中的文件，在 pandas 中添加日期列

循环遍历目录中的文件，在 pandas 中添加日期列 的相关文章

随机推荐

热门标签

循环遍历目录中的文件，在 pandas 中添加日期列的相关文章