在 Python 中从 CSV 文件访问列数据

2023-11-29

我有一个包含 A、B、C、D 列和 N 行的 CSV 文件。问题是这些列中的数据长度不同，即有些是 4.5，有些是 4.52。

我的问题分为两部分：

我如何从 csv 文件访问这些列。我使用此代码来打印 csv 文件的内容并将它们读入数组

    import csv
    with open('file.csv','rb') as f:
        reader = csv.reader(f)
        for row in reader:
            print row

打印 CSV 文件中的行并替换

    print row

with

    z = row
    z.append(z)

将数据保存到数组中。

但 z 是一个一维数组。并且数据是字符串类型。当我尝试执行 np.median(z) 类型的操作时，它给了我一个错误。另外，我不能做

    z.append(float(z))

这给了我一个类型错误。

而且，当我们从 csv 文件导入这些值时，是否可以截断这些值并将它们设置为一定的精度？！例如，如果文件具有 4.3、4.56、4.299 等值，我想将最终导入的内容限制为仅一位小数。

这个 SE 问题最接近回答我的第二个问题 -Python - CSV：具有不同长度行的大文件- 但我不明白。如果你们中有人能在这方面帮助我，我将不胜感激。

编辑1： @ Richie：这是一个示例数据集 -http://goo.gl/io8Az。它链接到谷歌文档。并注册您的评论，这是我在 csv 文件上运行您的代码的结果 -

     ValueError: could not convert string to float: plate

@ Pieters：z = row，z.append(z) 创建了这个 - ['3836', '55302', '402', '22.945717', '22.771544', '23.081865', '22.428421', '21.78294', '164.40663689', '-1.25641627', '1 .780485', '1237674648848106129', [...]]。

我应该提到的是，我刚刚开始使用 python，并且我正在学习需要知道的东西！我用在网上找到的一些代码进行即兴创作。

编辑2：我听说过熊猫。我想我应该开始使用它。

@ Khalid - 我已经运行了你的代码，并且能够检索我想要的列。我可以访问它，而不是打印整行吗？！作为静态数组？！

编辑3： @ richie：我第一次运行你的代码时，出现了这个 -

回溯（最近一次调用最后一次）：文件“”，第 4 行，位于 ValueError：无法将字符串转换为浮点：板

好吧，我意识到包含列名的第一行是原因，所以我删除了第一行，将其另存为新文件并在该文件上运行代码，它工作得很好。

但是，如果我删除包含列标识符的第一行，我将无法使用下面 khalid 提到的方法。与此同时，我正在观察熊猫。

谢谢你们所做的一切:)

编辑4：学习到教训了。熊猫太棒了。任务完成：）...

有几件事，取决于你想做什么。这是按列引用它们的简单方法：

import csv

with open('file.csv','r') as f:
    reader = csv.DictReader(f, delimiter=',')
    rows = list(reader)

for row in rows:
   print row['plate']

如果你想将它们转换为浮点数或整数，你可以使用map。但是，我怀疑您最终想要进行一些计算，为此最好使用pandas.

作为额外的好处，pandas会给你一个 2D 网格表示，称为DataFrame你的文件。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

csv

multidimensionalarray

在 Python 中从 CSV 文件访问列数据的相关文章

类的 IPython 表示

我正在使用我创建的模块尝试 IPython 但它没有显示类对象的实际表示相反它显示类似的内容 TheClass module TheClass name I heavily在这个模块中使用元类我有真正有意义的类表示应该向用户显示是
Gunicorn 工作人员无论如何都会超时

我正在尝试通过gunicorn运行一个简单的烧瓶应用程序但是无论我做什么我的工作人员都会超时无论是否有针对应用程序的活动工作人员在我设置任何内容后总是会超时timeout值到是什么导致它们超时当我发出请求时请求成功通过但工作
pandas DataFrame.join 的运行时间是多少（大“O”顺序）？

这个问题更具概念性理论性与非常大的数据集的运行时间有关所以我很抱歉没有一个最小的例子来展示我有一堆来自两个不同传感器的数据帧我需要最终将它们连接成两个very来自两个不同传感器的大数据帧 df snsr1 and df snsr2
NLTK 2.0分类器批量分类器方法

当我运行此代码时它会抛出一个错误我认为这是由于 NLTK 3 0 中不存在batch classify 方法我很好奇如何解决旧版本中的某些内容在新版本中消失的此类问题 def accuracy classifier gold resu
VSCode Settings.json 丢失

我正在遵循教程并尝试将 vscode 指向我为 Scrapy 设置的虚拟工作区但是当我在 VSCode 中打开设置时工作区设置选项卡不在用户设置选项卡旁边我还尝试通过以下方式手动转到文件 APPDATA Code User s
使用主题交换运行多个 Celery 任务

我正在用 Celery 替换一些自制代码但很难复制当前的行为我期望的行为如下创建新用户时应向tasks与交换user created路由键该消息应该触发两个 Celery 任务即send user activate email
Python 3d 绘图设置固定色阶

我正在尝试绘制两个 3d 数组第一个数组的 z 值在范围内 0 15 0 15 第二个来自 0 001 0 001 当我绘图时色标自动遵循数据范围如何设置自定义比例我不想看到 0 001 的浅色而应该看到 0 15 的浅色如何修
Python 内置的 super() 是否违反了 DRY？

显然这是有原因的但我没有足够的经验来认识到这一点这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
如何使用 Selenium 和 ChromeDriver 解决 TypeError: 'module' object is not callable 错误 [重复]

这个问题在这里已经有答案了代码试验 from selenium import webdriver from selenium webdriver chrome options import Options as Chromeoptions
导入错误：没有名为flask.ext.login的模块

我的flask login 模块有问题我已经成功安装了flask login模块另外从命令提示符我可以轻松运行此脚本不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
pandas - 包含时间序列数据的堆积条形图

我正在尝试使用时间序列数据在 pandas 中创建堆积条形图 DATE TYPE VOL 0 2010 01 01 Heavy 932 612903 1 2010 01 01 Light 370 612903 2 2010 01 01 Me
Python - 如何确定解析的 XML 元素的层次结构级别？

我正在尝试使用 Python 解析 XML 文件中具有特定标记的元素并生成输出 excel 文档该文档将包含元素并保留其层次结构我的问题是我无法弄清楚每个元素解析器在其上迭代的嵌套深度 XML 示例摘录 3 个元素它们可以任意嵌套
将 Matlab 的 datenum 格式转换为 Python

我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题时间信息以 Matlab 的日期数字格式存储对于那些不熟悉它的人日期序列号将日历日期表示为自固定基准日期以来已经过去的天数在 MATLAB
Spider 必须返回 Request、BaseItem、dict 或 None，已“设置”

我正在尝试从以下位置下载所有产品的图像我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
带有 LSTM 的 GridSearchCV/RandomizedSearchCV

我一直在尝试通过 RandomizedSearchCV 调整 LSTM 的超参数我的代码如下 X train X train reshape X train shape 0 1 X train shape 1 X test X test
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
如何使用 Boto3 启动具有 IAM 角色的 EC2 实例？

我无法弄清楚如何使用指定的 IAM 角色在 Boto3 中启动 EC2 实例以下是迄今为止我如何成功创建实例的一些示例代码 import boto3 ec2 boto3 resource ec2 region name us west 2
python 对浮点数进行不正确的舍入

gt gt gt a 0 3135 gt gt gt print 3f a 0 314 gt gt gt a 0 3125 gt gt gt print 3f a 0 312 gt gt gt 我期待 0 313 而不是 0 312 有没有
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS

随机推荐

在 Java 中运行构造函数代码之前字段是否已初始化？

谁能解释一下以下程序的输出我认为构造函数是在实例变量之前初始化的所以我期望输出是 XZYY class X Y b new Y X System out print X class Y Y System out print Y publ
python - 查找用户的“下载”文件夹

我已经找到了这个问题建议使用os path expanduser path 获取用户的主目录我想通过下载文件夹实现相同的目的我知道这在 C 中是可能的但我是 Python 新手不知道这是否也可能在这里最好是独立于平台 Wind
使用应用程序脚本在过滤器视图之间切换

我想创建一个自定义菜单其中包含可在特定工作表上的过滤器视图之间切换的项目有什么办法吗我需要过滤视图因为需要排序和过滤但仍保留编辑选项由于这个事实过滤器功能不起作用筛选视图尚不支持应用程序脚本这是一个旧的功能要求
通过在特定日期范围之间插入其他列来在数据框中创建新列 - Pandas

我有一个 df 如下所示数据是这样的 Date y 0 2020 06 14 127 1 2020 06 15 216 2 2020 06 16 4 3 2020 06 17 90 4 2020 06 18 82 5 2020 06 19
使用 Python 和 Regex 查找字符串中的所有中文文本

今天我需要从一堆字符串中去掉中文并且正在寻找一个简单的 Python 正则表达式有什么建议么 Python 2 usr bin env python encoding utf8 import re sample u I am from
StreamReader.ReadLine 和 CR

我在这里很密集吗 StreamReader ReadLine指出行定义为一系列字符后跟换行符 n 回车符 r 或回车符后紧跟换行符 r n 那么为什么这没有按预期工作呢 Server Dim tcpL as New TcpListen
当断言失败时继续 Python 的单元测试

编辑切换到一个更好的示例并澄清为什么这是一个真正的问题我想用 Python 编写单元测试当断言失败时继续执行这样我就可以在单个测试中看到多个失败例如 class Car object def init self make mod
为什么我以编程方式创建的按钮的样式不同？

从 Android Studio 中具有空 Activity 的新项目开始我添加了一个带有单个按钮的线性布局activity main xml
iOS Web 应用程序：禁用输入文本字段的自动对焦

我有一个简单的 iOS Web 应用程序问题当您创建输入文本字段时用户单击文本字段 mobile safari 会自动聚焦输入字段自动将用户单击的输入字段移动到屏幕中央视觉键盘将画布推到顶部或左侧或任何可以将输入字段居中的空间好吧
ListSelector适用于整个列表

我有一个带有列表选择器的简单列表如下所示
尝试安装 Homebrew 时出现库未加载错误 (libidn.11.dylib)

尝试在 Lion 上安装 Homebrew 当我做 usr bin ruby e curl fsSL https raw github com gist 323731 我收到此错误 dyld Library not loaded opt l
记录 Jenkins 中的更改

在这里继续我的问题 Jenkins 在外部可执行文件上的构建通过或失败我的构建过程现在使用 MS Build 从源代码构建并作为构建过程的一部分执行自定义程序我在程序中写入控制台的任何内容都将记录在控制台输出中但是我还想在用户界面
C 将 argv[] 中的字符串分配给 char 数组

我有以下代码它从命令行读取文件名并打开该文件 include
setcookie，无法修改标头信息 - 标头已发送[重复]

这个问题在这里已经有答案了我是PHP新手刚刚练习PHP setcookie 失败了 http localhost 测试索引 php
如何将 DNS 条目添加到 Windows 容器的主机文件中？

我的主机的 IIS 中有一个网站可以通过以下方式访问http mysite local地址我还有一个在此主机上运行的 Windows 容器我正在尝试使用 curl http mysite local 从我的 Windows 容器连接到
使用 NDEF Android 应用程序记录 (AAR) 获取 NFC 标签

我正在开发 NFC 应用程序为了启动我的应用程序我使用了 NDEF 标签其中包含 AAR NDEF 记录这很好用但现在我想直接用应用程序读取标签内容我怎样才能做到这一点当我从手机上取下标签并再次触摸它时它已经可以工作了但我
映射超类的命名查询

我试图在映射的超类上声明 NamedQuery 但收到此错误 org hibernate hql ast QuerySyntaxException VoipCall 未映射 select v from VoipCall v where v
TinkerPop：添加顶点图 API 与遍历 API

背景在其中之一SO posts推荐使用 Traversal API 而非 Graph API 来进行变异所以我尝试了一些测试发现 Graph API 似乎更快我完全相信这个建议但我试图了解它如何更好我确实尝试过谷歌搜索但没有找
cout 是同步/线程安全的吗？

一般来说我假设流不同步由用户来执行适当的锁定但是做类似的事情cout在标准库中得到特殊待遇也就是说如果多个线程正在写入cout他们会腐败吗cout目的我知道即使同步您仍然会得到随机交错的输出但交错是否有保证也就是说使用
在 Python 中从 CSV 文件访问列数据

我有一个包含 A B C D 列和 N 行的 CSV 文件问题是这些列中的数据长度不同即有些是 4 5 有些是 4 52 我的问题分为两部分我如何从 csv 文件访问这些列我使用此代码来打印 csv 文件的内容并将它们读入数组 im

在 Python 中从 CSV 文件访问列数据

在 Python 中从 CSV 文件访问列数据 的相关文章

随机推荐

热门标签

在 Python 中从 CSV 文件访问列数据的相关文章