Pandas read_csv,读取缺失值指定为 int 的布尔值

2024-03-07

我正在尝试将 csv 导入到 pandas 数据框中。我有用 1 和 0 表示的布尔变量,其中缺失值用 -9 标识。 当我尝试将 dtype 指定为布尔值时,我会收到许多不同的错误,具体取决于我尝试的内容。

示例数据:test.csv

var1, var2
0,   0
0,   1
1,   3
-9,  0
0,   2
1,   7

我尝试在导入时指定数据类型:

dtype_dict = {'var1':'bool','var2':'int'}
nan_dict = {'var1':[-9]}
foo = pd.read_csv('test.csv',dtype=dtype_dict, na_values=nan_dict)

我收到以下错误:

ValueError:无法安全地将 |b1 的传递用户数据类型转换为 int64 第 0 列中的 dtyped 数据

我也尝试过指定 true 和 false 值,

foo = pd.read_csv('test.csv',dtype=dtype_dict,na_values=nan_dict,
                 true_values=[1],false_values=[0])

但后来我得到了一个不同的错误:

例外:必须是所有编码字节

该错误的源代码说明了有关捕获偶尔的 none 的内容,但 none 或 null 正是我想要的。


您可以指定converters参数为var1 column:

from io import StringIO
import numpy as np
import pandas as pd

pd.read_csv(StringIO("""var1, var2
0,   0
0,   1
1,   3
-9,  0
0,   2
1,   7"""), converters = {'var1': lambda x: bool(int(x)) if x != '-9' else np.nan})
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas read_csv,读取缺失值指定为 int 的布尔值 的相关文章

随机推荐

  • 如何使用 Django ORM 在没有数百个查询的情况下选择多对一对多?

    我的数据库具有以下架构 class Product models Model pass class Tag models Model product models ForeignKey Product attr1 models CharFi
  • 多个WebGLRenderer可以渲染同一个场景吗?

    是否可以使用两个实例WebGLRenderer 使用两个Canvas渲染相同的场景 var renderer new THREE WebGLRenderer canvas canvas1 renderer setSize 100 100 v
  • C# 锁定 WinForm 控件

    在我编写的程序中 用户可以向窗体添加控件并移动它们 并在伪设计模式下设置一些属性 我希望能够在按下按钮切换到 数据模式 时将所有这些控件锁定到一个位置 我怎样才能做到这一点 我希望能够循环遍历所有控件并使用 Lock 属性 但我注意到它没有
  • Xcode:尝试在 iOS 模拟器中运行应用程序时出现无效符号链接错误

    在我的应用程序编译阶段结束时 我看到无效的符号链接错误 这只是我每次运行时创建的一些临时目录 我尝试删除它但无济于事 该应用程序在设备上运行良好 任何帮助将非常感激 当您的应用程序包含指向应用程序包外部的符号链接时 通常会发生该错误 在为设
  • 在javascript中,使用回调执行多个异步函数的最佳实践是什么?

    有一个函数需要调用不确定数量的其他 可能异步 函数 每个函数都带有回调 我使用以下模式 虽然很确定它是正确的 但在美学上不太令人愉悦 fn responsible for figuring out and calling aysnc fun
  • Excel VBA从url获取网站标题

    Excel VBA 中的 HTML 页面标题 https stackoverflow com questions 7625316 html page title in excel vba 14509576 14509576 我知道这已经相当
  • Netty 4.0多端口,每个端口有不同的协议

    我想 netty 是我所知道的最好的 java 网络框架 在阅读并尝试一些示例后我有疑问 1 使用netty 4 0创建具有不同协议的多端口网络服务器的最佳方法是什么 每个服务器创建 EventLoopGroup bossGroup new
  • 如何覆盖引导样式

    我创建了轮播 我需要覆盖样式指示器按钮 我有风格 carousel indicators position absolute bottom 10px left 50 z index 1 width 60 padding left 0 mar
  • D2009 TStringlist ansisstring

    夏天的商业平静已经开始 所以我开始迁移到 D2009 我粗略地确定了程序的每个子系统是否应该保留 ascii 或者可以是 unicode 然后开始移植 一切都很顺利 所有组件都在 D2009 版本中 有些组件 如 VSTView 虽然稍微不
  • 如何将多个参数传递给 apply 函数

    我有一个名为 count 的方法 它需要 2 个参数 我需要使用 apply 方法来调用此方法 但是 当我将两个参数传递给 apply 方法时 出现以下错误 类型错误 counting 恰好需要 2 个参数 给定 1 个 我看过以下主题py
  • NSImage 无法缩放

    我正在开发一个快速应用程序 其中我有一种方法可以将 2x 图像重新缩放为常规图像 问题是它没有 Why BOOL createNormalImage NSString inputRetinaImagePath NSImage inputRe
  • 安装 IPython 开发版本后,IPython 笔记本无法启动

    我今天尝试安装 IPython 的开发版本 但是当我运行 ipython Notebook pylab inline 时 我打开一个空笔记本 没有仪表板 只有一个空白页 命令行显示 WARNING tornado access 404 GE
  • 图表未使用 Shiny R 和 NVD3 渲染

    我一直在尝试使用 NVD3 库创建闪亮的时间序列图 我对 R Shiny 和 NVD3 比较陌生 问题是 当我运行 ShinyApp 时 浏览器上没有呈现任何图表 使用 Chromes 开发人员工具 我可以看到 myChart 的 div
  • VBA:如何将不同工作表上的两个范围合并为一个,以循环遍历

    尝试将两个宽度相等但长度不同的范围 每个范围位于不同的纸张上 读取到另一个范围中 我需要按特定顺序循环组合数据 Set wRIL Worksheets INS Set rRIL wRIL Range L2 Set rRIL rRIL Cur
  • 谷歌地图缩小限制[重复]

    这个问题在这里已经有答案了 How do I set zoom out limit on the map it currently lets me zoom out too far to the point that I see multi
  • 安装具有 CRAN 镜像依赖项的本地 R 包

    我已经构建了一个 R 包 即我有 mypackage tar gz 文件 该软件包依赖于其他几个软件包 所有这些软件包都可以从任何 CRAN 镜像下载和安装 现在我想在尚未安装依赖项的系统上安装此软件包 并且我希望在安装软件包时自动下载并安
  • 项目错误:QT 中的未知模块:webkitwidgets [重复]

    这个问题在这里已经有答案了 我正在尝试使用 MXE 在来自本教程 https stackoverflow com questions 14170590 building qt 5 on linux for windows 14170591
  • 使用 dplyr 和 rle 对条件组中的连续值进行计数

    我的问题与下面提出的问题非常相似 但是我想添加一个附加命令以仅返回序列具有超过 2 个连续值的情况 当给定的序列运行在给定的时代和给定的年份内有超过 2 个连续的数字时 如何计算连续 成功 的数量 即 consec 中的 1 个 类似的问题
  • SQL Server 和 MySQL 同步

    我正在与一个在 SQL Server 和 MySQL 之间同步的客户合作 其中包含完全相同的架构和数据 我们希望将这些数据集中到一个数据库中 除了性能和可维护性问题之外 最初的设计还有什么不好的地方呢 您可以使用 MySQL 实例在 SQL
  • Pandas read_csv,读取缺失值指定为 int 的布尔值

    我正在尝试将 csv 导入到 pandas 数据框中 我有用 1 和 0 表示的布尔变量 其中缺失值用 9 标识 当我尝试将 dtype 指定为布尔值时 我会收到许多不同的错误 具体取决于我尝试的内容 示例数据 test csv var1