使用 Python Pandas 读取 .txt 文件 - 字符串和浮点数

2024-03-04

我想使用 Pandas 读取 Python (3.6.0) 中的 .txt 文件。 .txt 文件的第一行如下所示：

要读取的文本文件

Location:           XXX
Campaign Name:      XXX
Date of log start:  2016_10_09
Time of log start:  04:27:28
Sampling Frequency: 1Hz
Config file:        XXX
Logger Serial:      XXX

CH Mapping;;XXXC1;XXXC2;XXXC3;XXXC4
CH Offsets in ms;;X;X,X;X;X,X
CH Units;;mA;mA;mA;mA
Time;msec;Channel1;Channel2;Channel3;Channel4
04:30:00;000; 0.01526;10.67903;10.58366; 0.00000
04:30:01;000; 0.17090;10.68666;10.58518; 0.00000
04:30:02;000; 0.25177;10.68284;10.58442; 0.00000

我正在使用下面的简单代码行：

Python代码

import pandas
df = pandas.read_csv("TextFile.txt", sep=";", header=[10])
print(df)

然后在终端中得到以下输出：

端子输出

    Time msec Channel1 Channel2 Channel3 Channel4
0    NaN  NaN      NaN      NaN      NaN      NaN
1    NaN  NaN      NaN      NaN      NaN      NaN
2    NaN  NaN      NaN      NaN      NaN      NaN
..   ...  ...      ...      ...      ...      ...
599  NaN  NaN      NaN      NaN      NaN      NaN

我立即想到的是 Pandas 不“喜欢”前两列。您有什么建议吗？我可以让 Pandas 读取 .txt 文件而不更改文件本身的任何内容。

先感谢您。

你想通过skiprows=11, and skipinitial_space=True to read_csv随着sep=';'因为你有空格和分隔符：

In [83]:
import io
import pandas as pd
t="""Location:           XXX
Campaign Name:      XXX
Date of log start:  2016_10_09
Time of log start:  04:27:28
Sampling Frequency: 1Hz
Config file:        XXX
Logger Serial:      XXX

CH Mapping;;XXXC1;XXXC2;XXXC3;XXXC4
CH Offsets in ms;;X;X,X;X;X,X
CH Units;;mA;mA;mA;mA
Time;msec;Channel1;Channel2;Channel3;Channel4
04:30:00;000; 0.01526;10.67903;10.58366; 0.00000
04:30:01;000; 0.17090;10.68666;10.58518; 0.00000
04:30:02;000; 0.25177;10.68284;10.58442; 0.00000"""

df = pd.read_csv(io.StringIO(t), skiprows=11, sep=';', skipinitialspace=True)
df

Out[83]:
       Time  msec  Channel1  Channel2  Channel3  Channel4
0  04:30:00     0   0.01526  10.67903  10.58366       0.0
1  04:30:01     0   0.17090  10.68666  10.58518       0.0
2  04:30:02     0   0.25177  10.68284  10.58442       0.0

您可以看到数据类型现在是正确的：

In [84]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 6 columns):
Time        3 non-null object
msec        3 non-null int64
Channel1    3 non-null float64
Channel2    3 non-null float64
Channel3    3 non-null float64
Channel4    3 non-null float64
dtypes: float64(4), int64(1), object(1)
memory usage: 224.0+ bytes

您可能还想选择将时间解析为日期时间：

In [86]:    
df = pd.read_csv(io.StringIO(t), skiprows=11, sep=';', skipinitialspace=True, parse_dates=['Time'])
df

Out[86]:
                 Time  msec  Channel1  Channel2  Channel3  Channel4
0 2017-03-16 04:30:00     0   0.01526  10.67903  10.58366       0.0
1 2017-03-16 04:30:01     0   0.17090  10.68666  10.58518       0.0
2 2017-03-16 04:30:02     0   0.25177  10.68284  10.58442       0.0

In [87]:    
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 6 columns):
Time        3 non-null datetime64[ns]
msec        3 non-null int64
Channel1    3 non-null float64
Channel2    3 non-null float64
Channel3    3 non-null float64
Channel4    3 non-null float64
dtypes: datetime64[ns](1), float64(4), int64(1)
memory usage: 224.0 bytes

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

使用 Python Pandas 读取 .txt 文件 - 字符串和浮点数的相关文章

Python - StatsModels、OLS 置信区间

在 Statsmodels 中我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
基于代理的模拟：性能问题：Python vs NetLogo & Repast

我正在 Python 3 中复制一小段 Sugarscape 代理模拟模型我发现我的代码的性能比 NetLogo 慢约 3 倍这可能是我的代码的问题还是Python的固有限制显然这只是代码的一个片段但 Python 却花费了三分
Python 函数可以从作用域之外赋予新属性吗？

我不知道你可以这样做 def tom print tom s locals locals def dick z print z name z name z guest Harry print z guest z guest print di
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
绘制方程

我正在尝试创建一个函数它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
IO 密集型任务中的 Python 多线程

建议仅在 IO 密集型任务中使用 Python 多线程因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权然而多线程对于 IO 密集型操作有意义吗 https stackoverflow c
python获取上传/下载速度

我想在我的计算机上监控上传和下载速度一个名为 conky 的程序已经在 conky conf 中执行了以下操作 Connection quality alignr wireless link qual perc wlan0 downspe
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
如何在seaborn displot中使用hist_kws

我想在同一图中用不同的颜色绘制直方图和 kde 线我想为直方图设置绿色为 kde 线设置蓝色我设法弄清楚使用 line kws 来更改 kde 线条颜色但 hist kws 不适用于显示我尝试过使用 histplot 但我无法为
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
解释 Python 中的数字范围

在 Pylons Web 应用程序中我需要获取一个字符串例如关于如何做到这一点有什么建议吗我是 Python 新手我还没有找到任何可以帮助解决此类问题的东西该列表将是 1 2 3 45 46 48 49 50 51 77 使用
Conda SafetyError：文件大小不正确

使用创建 Conda 环境时conda create n env name python 3 6 我收到以下警告 Preparing transaction done Verifying transaction SafetyError Th
从列表指向字典变量

假设你有一个清单 a 3 4 1 我想用这些信息来指向字典 b 3 4 1 现在我需要的是一个常规看到该值后在 b 的位置内读写一个值我不喜欢复制变量我想直接改变变量b的内容假设b是一个嵌套字典你可以这样做 reduce di
Python 类继承 - 诡异的动作

我观察到类继承有一个奇怪的效果对于我正在处理的项目我正在创建一个类来充当另一个模块的类的包装器我正在使用第 3 方 aeidon 模块用于操作字幕文件但问题可能不太具体以下是您通常如何使用该模块 project aeidon P
导入错误：没有名为 site 的模块 - mac

我已经有这个问题几个月了每次我想获取一个新的 python 包并使用它时我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误实际上我无法使用任何新软件包因为每次我
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

弯曲等高列，但尊重另一列的最大高度[重复]

这个问题在这里已经有答案了我如何使下面的代码仅使用CSS flex 而不使用Javascript 第二列有动态内容列表我需要根据第一列的高度应用滚动条 HTML div class row d flex div class col lg
是否存在类似于 Nonetype 路径的东西？

在我的课程中我喜欢用 None 来启动我的路径变量如果我使用os path很容易与其他路径进行比较但我更喜欢pathlib风格有没有解决方案可以做到这一点 import os path1 os path dirname D test
Selenium Grid：org.openqa.selenium.WebDriverException：转发新会话时出错用于设置功能的 VM 池为空

我正在尝试使用 Cucumber 在硒网格上进行 POC 我收到此错误转发新会话时出错用于设置功能的虚拟机池为空这是我的示例代码公共静态无效configureServer GridHubConfiguration gridHubCo
为什么 Swift 的 AVPlayer 在一场比赛中会加载两次playerItem？

我正在使用 AVFoundation 的 AVPlayer 来流式传输外部 mp3 文件我的后端有一个计数器可以计算文件加载的次数该服务的唯一客户端只有我一个每当我触发播放 AVPlayer 时计数器就会增加 2 这意味着 AVP
使用 Bootstrap Accordion 添加向右箭头

我想看看是否可以在 Bootstrap Accordion 标题的右侧添加箭头我希望箭头在手风琴折叠时从下变为向上这很复杂吗我只希望标题带有箭头并让它们在折叠时发生变化但我在试图解决这个问题时遇到了最大的麻烦这是代码 Accor
使用 R 优化/向量化数据库查询

我正在尝试使用 R 查询大型数据库由于数据库的大小我编写了一次获取 100 行的查询我的代码如下所示 library RJDBC library DBI library tidyverse options java parameter
架构组件改造和 RxJava 2 错误处理

我目前正在尝试使用来自改造和 Okhttp 的 API 请求在架构组件中实现新的 ViewModel 一切正常但我不知道如何将错误响应从改造传递到LiveDataReactiveStreams fromPublisher然后上游到片段中的
C++：遍历对象的所有成员？

假设我有一个包含许多成员的对象 class Example AnotherClass member1 AnotherClass member2 YetAnotherClass member3 有没有一种简短简洁的方法可以做类似的事情 fo
如何列出包含等效提交的分支

在之前的问题中有人提供了查找包含确切提交的分支的答案如何列出包含给定提交的分支 https stackoverflow com questions 1419623 how to list branches that contain a
从两位数月份号获取月份名称

我想从两位数的月份号例如 09 中获取月份名称我尝试使用这段代码但这不起作用该代码仅给出当前月份名称它的正确代码是什么 var formattedMonth moment month 09 format MMMM 虽然凯文的答案没
如何让 cscope 结果显示在 gvim7 的拆分窗口中？

我已经尝试过这里的教程 Vim Cscope 教程 http cscope sourceforge net cscope vim tutorial html 更改后是在cscope maps vim文件到SPACE I got Ctrl
require.js：访问所有加载的模块

有没有办法访问require js所有加载的模块背景我想自动调用init 我的 javascript 模块在全部加载后的功能请参阅require js backbone js 如何构建具有初始化功能的模块 https stackove
使用 TypeScript 返回 AngularJS $q 承诺

我有一个服务它用返回延迟对象的函数包装 http 我的界面 export interface MyServiceScope get ng IPromise lt gt 我的课 export class MyService implemen
渐进增强不再是当前的问题吗？

我听到了一些为渐进增强辩护的说法 JavaScript 已关闭或不可用根据W3Schools Javascript 统计 http www w3schools com browsers browsers stats asp 95 的人在
使用 ASP.NET Forms 身份验证应用程序的当前用户

我正在尝试检索使用 ASP NET Forms 身份验证的 Web 应用程序中的当前用户然而 System Security Principal WindowsIdentity GetCurrent Name返回域 windows 用户
mongodb中日志分析数据库的最佳可能模式设计

我必须将以下数据存储在 mongodb 中uid gender country city date of visit url of visit 我想将 uid 性别国家和城市存储在一个集合中因为这些信息对于特定用户来说永远不会改变在我
jquery 中的最后一个兄弟？

有人可以帮我选择 jquery 中单击元素的最后一个同级元素吗 myElement click function this siblings last hide
我找不到不使用 EL 访问 spring 模型的方法

我在创建与 Spring 一起使用的 JSP 时遇到问题我将所有对象放在 ModelAndView 的模型中使用 EL 可以轻松访问它们问题是从平常访问它们假设我有一个名为 foo 的模型参数有没有办法将它放在一个变量中我可以在
错误 mysqli_fetch_array() 期望参数 1 为 mysqli_result，给定字符串

警告 mysqli fetch array 期望参数 1 为 mysqli result 给定字符串这是我的代码谁能告诉我出了什么问题吗 result SELECT FROM report if mysqli query cons re
使用 Python Pandas 读取 .txt 文件 - 字符串和浮点数

我想使用 Pandas 读取 Python 3 6 0 中的 txt 文件 txt 文件的第一行如下所示要读取的文本文件 Location XXX Campaign Name XXX Date of log start 2016 10 0