提取包含特定名称的列

2023-11-26

我正在尝试使用它来操作大型 txt 文件中的数据。

我有一个包含 2000 多列的 txt 文件，其中大约三分之一的标题包含“Net”一词。我只想提取这些列并将它们写入新的 txt 文件。关于我如何做到这一点有什么建议吗？

我四处搜寻了一下，但没能找到对我有帮助的东西。如果之前曾提出并解决过类似问题，我们深表歉意。

编辑1：谢谢大家！在撰写本文时，3 位用户提出了解决方案，而且它们都运行得很好。老实说，我不认为人们会回答，所以我一两天没有检查，对此感到高兴和惊讶。我印象非常深刻。

编辑2：我添加了一张图片，显示原始txt文件的一部分是什么样子，以防将来对任何人有帮助：

Sample from original txt-file

一种无需安装第三方模块（如 numpy/pandas）的方法如下。给定一个名为“input.csv”的输入文件，如下所示：

a、b、c_net、d、e_net

0,0,1,0,1

（删除中间的空行，它们只是为了格式化这篇文章的内容）

下面的代码可以实现你想要的功能。

import csv


input_filename = 'input.csv'
output_filename = 'output.csv'

# Instantiate a CSV reader, check if you have the appropriate delimiter
reader = csv.reader(open(input_filename), delimiter=',')

# Get the first row (assuming this row contains the header)
input_header = reader.next()

# Filter out the columns that you want to keep by storing the column
# index
columns_to_keep = []
for i, name in enumerate(input_header):
    if 'net' in name:
        columns_to_keep.append(i)

# Create a CSV writer to store the columns you want to keep
writer = csv.writer(open(output_filename, 'w'), delimiter=',')

# Construct the header of the output file
output_header = []
for column_index in columns_to_keep:
    output_header.append(input_header[column_index])

# Write the header to the output file
writer.writerow(output_header)

# Iterate of the remainder of the input file, construct a row
# with columns you want to keep and write this row to the output file
for row in reader:
    new_row = []
    for column_index in columns_to_keep:
        new_row.append(row[column_index])
    writer.writerow(new_row)

请注意，没有错误处理。至少有两个需要处理。第一个是检查输入文件是否存在（提示：检查 os 和 os.path 模块提供的功能）。第二个是处理空白行或列数不一致的行。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

textfiles

extract

提取包含特定名称的列的相关文章

Django REST序列化器：创建对象而不保存

我已经开始使用 Django REST 框架我想做的是使用一些 JSON 发布请求从中创建一个 Django 模型对象然后使用该对象而不保存它我的 Django 模型称为 SearchRequest 我所拥有的是 api view
如何在python中读取多个文件中的文本

我的文件夹中有许多文本文件大约有 3000 个文件每个文件中第 193 行是唯一包含重要信息的行我如何使用 python 将所有这些文件读入 1 个文本文件 os 模块中有一个名为 list dir 的函数该函数返回给定目录中所有文
如何在刻度标签和轴之间添加空间

我已成功增加刻度标签的字体但现在它们距离轴太近了我想在刻度标签和轴之间添加一点呼吸空间如果您不想全局更改间距通过编辑 rcParams 并且想要更简洁的方法请尝试以下操作 ax tick params axis both whic
如何收集列表、字典等中重复计算的结果（或制作修改每个元素的列表的副本）？

There are a great many existing Q A on Stack Overflow on this general theme but they are all either poor quality typical
如何在android上的python kivy中关闭应用程序后使服务继续工作

我希望我的服务在关闭应用程序后继续工作但我做不到我听说我应该使用startForeground 但如何在Python中做到这一点呢应用程序代码 from kivy app import App from kivy uix floatl
DreamPie 不适用于 Python 3.2

我最喜欢的 Python shell 是DreamPie http dreampie sourceforge net 我想将它与 Python 3 2 一起使用我使用了添加解释器 DreamPie 应用程序并添加了 Python 3 2
Python 多处理示例不起作用

我正在尝试学习如何使用multiprocessing但我无法让它发挥作用这是代码文档 http docs python org 2 library multiprocessing html from multiprocessing imp
如何使用包含代码的“asyncio.sleep()”进行单元测试？

我在编写 asyncio sleep 包含的单元测试时遇到问题我要等待实际的睡眠时间吗 I used freezegun到嘲笑时间当我尝试使用普通可调用对象运行测试时这个库非常有用但我找不到运行包含 asyncio sleep 的测
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9

随机推荐

数据聚合 mongodb vs mysql

我目前正在研究用于具有严格数据聚合要求的项目的后端项目主要要求如下为每个用户存储数百万条记录用户每年可能拥有超过 100 万个条目因此即使有 100 个用户我们每年也会有 1 亿个条目这些条目的数据聚合必须即时执行用户需要能够
无法从 List 转换为 List

我正在尝试传递一个列表DerivedClass一个函数它接受一个列表BaseClass 但我收到错误 cannot convert from System Collections Generic List
React.js Material-UI 中的 BottomNavigation 样式

如何将所选链接本例中为主页的图标和文本颜色更改为红色并将非活动链接本例中为课程和作者的图标和文本颜色更改为绿色文档非常薄 class MyBottomNavigation extends Component render ret
scipy.linalg.solve (LAPACK gesv) 在大矩阵上的时间复杂度？

如果我使用scipy linalg solve 我相信这称为 LAPACK 的 gesv 函数在我的工作站上解决约 12000 个未知问题具有约 12000 个平方密集非对称矩阵时我得到了一个很好的答案10 15分钟只是为了探
sql表中的树形视图

我有如下所示的 sql 表我必须在树视图中显示它 id parentid name 1 NULL outlook 2 1 overcast 3 1 rainy 4 1 sunny 5 2 yes 6 3 wind 7 4 humidity
在 django Forms 中定义 css 类

假设我有一个表格 class SampleClass forms Form name forms CharField max length 30 age forms IntegerField django hacker forms Bool
为什么 Jupyter 显示图表两次？

我将从 Jupiter 开始分析一些销售数据它有效但每次我绘制图表时图表都会显示两次我的笔记本中的前两个图表是在班级内绘制的对于这些图表来说这种情况不会发生注意 Model这里指的是产品的模型而不是预测模型 class Mo
UIStepper - 找出它是递增还是递减

确定在 UIStepper 中是否按下了加号或减号按钮我使用以下方法 void stepperOneChanged UIStepper stepperOne 而我比较stepperOne value全局值保存在我的 TableView 类中
如何使用 Knife 编辑 ec2 节点的 Chef 属性

我想使用编辑 ec2 节点的 node dataknife node命令我可以使用以下命令手动执行此操作 knife node edit NODE NAME它将生成一个我需要编辑的 json name NODE 1 3 chef envi
matplotlib - 从等高线提取数据

我想从均匀间隔的二维数据类似图像的数据的单个轮廓中获取数据基于类似问题中发现的示例如何获取等高线图 matplotlib 绘制的线的 x y 值 gt gt gt import matplotlib pyplot as plt gt
Anaconda Python：删除 pkgs 中的 .tar.gz

删除 tar gz文件会有问题吗C Users username AppData Local conda pkgs 我还看到同一 Python 包的 Python 子目录但版本不同例如 pandas 0 19 2 np111py27 1
Tensorflow 无法识别 cudart64_101.dll

我的路径中有一个DLL文件 C Program Files NVIDIA GPU Computing Toolkit CUDA v10 1 bin cudart64 101 dll but TensorFlow似乎不认识它 2020 03
Maven 多模块：将公共依赖项聚合在一个模块中？

我搜索了这样的问题但没有找到任何东西所以我就在这里我有一个多模块 Maven 项目多个模块都继承同一个父模块其中定义了共同的依赖关系其中有一个我自己的模块一个通用模块其中实现了一些通用功能我的问题是对于常见依赖项更
如何显示字节数组十六进制值？

您好我正在 c 中制作应用程序我有包含十六进制值的字节数组我想将这些值写入文件中而不将其转换为字符串或其他任何内容请帮助我提前致谢我来晚了一点但没人提到比特转换器为你带来一点魔力的课程 public static strin
System.loadLibrary 不起作用。链中第二个库的 UnsatisfiedLinkError

我有java程序Client class 它通过JNI使用cpp共享库libclient so libclient so 构建为共享并使用 cpp 共享库 libhttp so libclient so 和 libhttp so 放在文件夹
如何从字符串中删除精确出现的字符？

例如我有一个像这样的字符串 string str santhosh phani ravi phani123 praveen sathish prakash 我想删除字符 phani from str 现在我正在使用str str Rep
在网页上嵌入 Powerpoint 查看器 (PHP)

我正在构建一个 PHP 应用程序用户可以在其中上传 Powerpoint 文件我希望其他用户在线查看而不是下载使用像google docs这样的第三方应用程序对于用户来说可能有点麻烦是否可以用PHP编写powerpoint查看器代码
Itextsharp 为 IElement 设置字体

var htmlarraylist HTMLWorker ParseToList new StringReader htmlText styles document Open BaseFont Vn Helvetica BaseFont C
尝试访问数据帧列显示“<绑定方法 NDFrame.xxx...”

我在 Jupyter 笔记本中创建 DataFrame 对象 data state Ohio Ohio Ohio Nevada Nevada year 2000 2001 2002 2000 2001 pop 1 5 2 0 3 6 2 4
提取包含特定名称的列

我正在尝试使用它来操作大型 txt 文件中的数据我有一个包含 2000 多列的 txt 文件其中大约三分之一的标题包含 Net 一词我只想提取这些列并将它们写入新的 txt 文件关于我如何做到这一点有什么建议吗我四处搜寻了一下但

提取包含特定名称的列

提取包含特定名称的列 的相关文章

随机推荐

热门标签

提取包含特定名称的列的相关文章