Python-读取具有不同分隔符的数据文本文件

2024-01-14

我有一个文件,其中字段由“:”分隔,子字段由“;”分隔,子字段中的项目由“,”分隔。

我想读Python。一段时间后,我可能可以逐行阅读它,然后分割所有内容,但我相信这种事情已经存在了?

文件的一行:

   0 :   16,  250 :  1 :  0.053 :RIG : DIS :  1 :   48, 220;  2 :   42, 241;  2 :   43, 251;  3 :   25, 266;  1 :   36, 287;  2 

我实际上尝试过:

Dat = np.genfromtxt(path, delimiter= ':', dtype = None, skip_header = 4,  skip_footer = 5, encoding = None)

由于我不明白的原因,它只返回了文件的第一列。但是,如果我改为delimiter= ','.

这给了我 7 个字段,我实际上可以自己分割。

然后: 1)你会如何读取该文件? 2)使用np.genfromtxt,为什么我只获得使用':'作为分隔符的第一列?


使用pandas的解决方案:

data = pd.read_csv('data.txt',
                   sep=";|:|,",
                   header=None,
                   engine='python')

这会将每个值写入新列中。希望这会有所帮助。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python-读取具有不同分隔符的数据文本文件 的相关文章

  • SQLAlchemy 通过关联对象声明式多对多自连接

    我有一个用户表和一个朋友表 它将用户映射到其他用户 因为每个用户可以有很多朋友 这个关系显然是对称的 如果用户A是用户B的朋友 那么用户B也是用户A的朋友 我只存储这个关系一次 除了两个用户 ID 之外 Friends 表还有其他字段 因此
  • 将数据从 python pandas 数据框导出或写入 MS Access 表

    我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表 我想用已更新的数据替换 MS Access 表 在 python 中 我尝试使用 pandas to sql 但收到错误消息 我觉得很奇怪 使用 p
  • 将 Matplotlib 误差线放置在不位于条形中心的位置

    我正在 Matplotlib 中生成带有错误栏的堆积条形图 不幸的是 某些层相对较小且数据多样 因此多个层的错误条可能重叠 从而使它们难以或无法读取 Example 有没有办法设置每个误差条的位置 即沿 x 轴移动它 以便重叠的线显示在彼此
  • 使 django 服务器可以在 LAN 中访问

    我已经安装了Django服务器 可以如下访问 http localhost 8000 get sms http 127 0 0 1 8000 get sms 假设我的IP是x x x x 当我这样做时 从同一网络下的另一台电脑 my ip
  • Python(Selenium):如何通过登录重定向/组织登录登录网站

    我不是专业程序员 所以请原谅任何愚蠢的错误 我正在做一些研究 我正在尝试使用 Selenium 登录数据库来搜索大约 1000 个术语 我有两个问题 1 重定向到组织登录页面后如何使用 Selenium 登录 2 如何检索数据库 在我解决
  • 通过最小元素比较对 5 个元素进行排序

    我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划 除此之外 复杂性是无关紧要的 结果是一个对的列表 表示在另一时间对列表进行排序所需的比较 我知道有一种算法可以通过 7 次比较 总是在元素之间
  • 如何从网页中嵌入的 Tableau 图表中抓取工具提示值

    我试图弄清楚是否有一种方法以及如何使用 python 从网页中的 Tableau 嵌入图形中抓取工具提示值 以下是当用户将鼠标悬停在条形上时带有工具提示的图表示例 我从要从中抓取的原始网页中获取了此网址 https covid19 colo
  • OpenCV 无法从 MacBook Pro iSight 捕获

    几天后 我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回 并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗 示例代码
  • 如何加速Python中的N维区间树?

    考虑以下问题 给定一组n间隔和一组m浮点数 对于每个浮点数 确定包含该浮点数的区间子集 这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树 已经针对一
  • AWS EMR Spark Python 日志记录

    我正在 AWS EMR 上运行一个非常简单的 Spark 作业 但似乎无法从我的脚本中获取任何日志输出 我尝试过打印到 stderr from pyspark import SparkContext import sys if name m
  • 无法在 Python 3 中导入 cProfile

    我试图将 cProfile 模块导入 Python 3 3 0 但出现以下错误 Traceback most recent call last File
  • 将图像分割成多个网格

    我使用下面的代码将图像分割成网格的 20 个相等的部分 import cv2 im cv2 imread apple jpg im cv2 resize im 1000 500 imgwidth im shape 0 imgheight i
  • 有没有办法检测正在运行的代码是否正在上下文管理器内执行?

    正如标题所述 有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
  • Python:如何将列表列表的元素转换为无向图?

    我有一个程序 可以检索 PubMed 出版物列表 并希望构建一个共同作者图 这意味着对于每篇文章 我想将每个作者 如果尚未存在 添加为顶点 并添加无向边 或增加每个合著者之间的权重 我设法编写了第一个程序 该程序检索每个出版物的作者列表 并
  • 导入错误:没有名为 site 的模块 - mac

    我已经有这个问题几个月了 每次我想获取一个新的 python 包并使用它时 我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误 实际上 我无法使用任何新软件包 因为每次我
  • Python Selenium:如何在文本文件中打印网站上的值?

    我正在尝试编写一个脚本 该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中 最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物 的 HTML span class
  • neo4j - python 驱动程序,服务不可用

    我对 neo4j 非常陌生 我正在尝试建立从 python3 6 到 neo4j 的连接 我已经安装了驱动程序 并且刚刚开始执行第一步 导入请求 导入操作系统 导入时间 导入urllib 从 neo4j v1 导入 GraphDatabas
  • 如何将输入读取为数字?

    这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章 目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数 注意 在Python 2
  • NotImplementedError:无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

    张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe
  • Statsmodels.formula.api OLS不显示截距的统计值

    我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

  • 复制 TensorFlow contrib 层

    这是我的代码 sess tf Session input tf placeholder tf float32 None 3 w1 tf contrib layers fully connected input 1 w2 tf contrib
  • ReactJS - 标记上的未知属性 `activeClassName`。从元素中删除此道具

    我正在使用react 15 4 2和react router4 0 0 这个项目是用创建反应应用程序 https github com facebookincubator create react app 这是我的代码 import Rea
  • 通过脚本将网站和 FTP 添加到 IIS 7 中

    我们正在将 100 多个域转移到新服务器 我创建了一个脚本 允许使用简单的 BAT 文件将网站条目和 FTP 条目添加到 IIS 7 中 我发现了几个使用 AppCmd ADD SITE 的教程 效果非常好 通过运行 c scripts c
  • lldb 可以与 fortran 一起使用吗?

    我正在尝试对 Fortran 程序设置断点lldb在 Mac OS 10 12 5 系统上 我有 program badcall integer a b a 2 b 3 write a b end I have to 使用英特尔编译器进行编
  • 在批处理文件中显示 .txt 的内容?

    我现在正在处理一个批处理文件 我已经完成了我需要的一切 但我陷入了困境 我使用的程序之一会输出一个日志文件 我让它将该文件放在 C 驱动器上的一个文件夹中 我想做的是让它读取这个 txt 并将其作为回显返回到批处理文件中 您可以将其放入批处
  • 如何设置 jQuery UI 对话框默认值

    如何设置 jQuery UI 对话框的默认值 例如 这就是我在 jQuery UI 日期选择器中设置默认值的方式 datepicker setDefaults dateFormat dd mm yy 我在中找不到相同的功能对话 文档 htt
  • 如何在 Emacs 初始化文件中生成键盘宏?

    我经常定义一个特定的键盘宏 因此我认为如果每次加载 Emacs 时它都自动可用 可能会很方便 我怎样才能做到这一点 怎么样保存键盘宏 http www gnu org software emacs manual html node emac
  • Android模拟器和virtualbox不能同时运行

    每当我运行 Virtualbox 时 我都无法启动 Android 模拟器映像 反之亦然 AVD管理器中的错误消息是 ioctl KVM CREATE VM failed Device or resource busy ko failed
  • PowerShell - 匹配运算符和多个组

    我正在 PowerShell 中处理以下日志条目 我正在尝试使用以下命令提取所有活动名称和持续时间 match操作员 但我只拿回一组比赛 当我使用 C 做同样的事情时 我没有得到我看到的所有匹配项Regex目的 有人可以解释我做错了什么吗
  • 在 lucene 索引中存储和检索 Json 对象

    我已经将一组 json 对象存储到 lucene 索引中 并且还想从索引中检索它 我使用的是lucene 3 4 那么有没有任何库或简单的机制可以在 lucene 中实现这一点 例如 Json 对象 BOOKNAME1 id 1 name
  • Python Pandas 警告:尝试在 DataFrame 切片的副本上设置值

    我有一个 Pandas DataFrame 我想用以下代码更改列的所有值 df Population round df Population 1000000 1 我收到以下警告 A value is trying to be set on
  • ruby 中的字节与代码点

    ruby 字符串函数之间有什么区别 代码点和字节 abcd bytes gt 97 98 99 100 abcd codepoints gt 97 98 99 100 bytes无论字符大小如何 都返回单个字节 而codepoints返回
  • Powershell 版本 5 Copy-Item -FromSession 找不到

    我正在尝试通过以下方式从远程会话复制一些日志文件 FromSession的参数Copy Itemcmdlet 在呼叫计算机上我安装了 PS 版本 5 运行脚本时我收到以下错误 Copy Item A parameter cannot be
  • Lodash 地图并返回唯一值

    我有一个 lodash 变量 var usernames map data usernames 产生以下结果 joebloggs joebloggs simongarfunkel chrispine billgates billgates
  • URIencode 和冒号

    冒号是一个可以根据许多站点编码为 3A 的字符 当我尝试使用编码时URIencode它不工作 例如 如果我尝试编码URIencode 然后什么也没有发生 返回冒号 为什么是这样 有人可以帮我吗 提前致谢 The encodeURI 对特殊字
  • 如何运行 Alamofire 库

    I downloaded the alamofire library and opened the iOS Example xcodeproj but it won t run In import Alamofire when i comm
  • 到 Task.Run 或不到 Task.Run

    假设我有一个包含异步方法的接口 并且该接口有两个不同的实现 这两种实现之一自然是异步的 而另一个则不是 实现非异步方法的 最正确 方法是什么 public interface ISomething Task
  • 无法在 xcode 崩溃报告中找到发生崩溃的代码

    我在 x code 中收到了几个崩溃报告 由用户报告 但无法找出它的用途 我在项目中打开它 但它没有显示发生崩溃的代码行 显然我尝试单击堆栈跟踪的每一行 如果您想在已发布的版本中触发崩溃 那么您应该将崩溃报告程序集成到您的项目中 并且Cra
  • 如何检查两个异步任务是否成功完成

    在函数中实现此流程图的最佳和最简单的方法是什么 现在我正在使用两个调度组 但我需要检查它们是否都已完成 而不仅仅是它们何时完成 如果他们完成了 那么 Friends 数组将包含元素 昵称数组将包含元素 注 FB是Facebook FIR是F
  • Python-读取具有不同分隔符的数据文本文件

    我有一个文件 其中字段由 分隔 子字段由 分隔 子字段中的项目由 分隔 我想读Python 一段时间后 我可能可以逐行阅读它 然后分割所有内容 但我相信这种事情已经存在了 文件的一行 0 16 250 1 0 053 RIG DIS 1 4