使用正则表达式将值替换为 np.nan

2023-12-23

我有一个数据框如下：

data1 = {"first":["alice", "bob", "carol"],
         "last_huge":["foo", "bar", "baz"]}
df = pd.DataFrame(data1)

例如，我想将所有字符“o”替换为“a”：

那我就做

df.replace({"o":"a"},regex=True)
Out[668]: 
   first last
0  alice  faa
1    bab  bar
2  caral  baz

它回馈我所需要的。

However，当我想将 'o' 替换为np.nan, 它将把整个字符串更改为np.nan. pandas的文档有什么解释吗？我可以通过以下方式找到一些信息源代码 https://github.com/pandas-dev/pandas/blob/v0.20.3/pandas/core/generic.py#L3678-L3926 .

更多信息：（它将整个字符串更改为np.nan)

df.replace({"o":np.nan},regex=True)
Out[669]: 
   first last
0  alice  NaN
1    NaN  bar
2    NaN  baz

NaN 始终用作缺失的占位符 https://stackoverflow.com/a/17534682/1240268，当用“missing”替换字符串的一部分时，它只能意味着整个条目被破坏。我听说过这称为 NaN 污染（或类似的，看看我是否能找到一些参考资料），因为如果 NaN 接触到数据就会受到损害。

也就是说，情况并非总是如此：

In [11]: s = pd.Series([1, 2, np.nan, 4])

In [12]: s.sum()
Out[12]: 7.0

In [13]: s.sum(skipna=False)
Out[13]: nan

在某些语言中，您会看到skipna = False作为默认行为，有些人强烈认为NaN应该always污染所有数据。 Pandas 采取了更务实的方法......

真正的问题是你期望它在 NaN 的情况下做什么？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

使用正则表达式将值替换为 np.nan 的相关文章

如何在 Matplotlib 饼图周围绘制箭头以将每个标签指向圆圈中各自的部分？

我一直在用 Matplotlib 绘制一些图表我有一个饼图想要在图表周围绘制箭头使每个标签都指向图表我有一个例子这是我当前的代码 import matplotlib pyplot as plt plt rcParams font
如何在 __init__ 中使用await设置类属性

我如何定义一个类await在构造函数或类体中例如我想要的 import asyncio some code class Foo object async def init self settings self settings setti
为什么 dataclasses.astuple 返回类属性的深层副本？

在下面的代码中astuple函数正在执行数据类的类属性的深层复制为什么它不能产生与函数相同的结果my tuple import copy import dataclasses dataclasses dataclass class Dem
嵌套列表的重叠会产生不必要的间隙

我有一个包含三个列表的嵌套这些列表由 for 循环填充并且填充由 if 条件控制第一次迭代后它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件它们不重叠在第二次迭代之后新
使用主题交换运行多个 Celery 任务

我正在用 Celery 替换一些自制代码但很难复制当前的行为我期望的行为如下创建新用户时应向tasks与交换user created路由键该消息应该触发两个 Celery 任务即send user activate email
在 Django Admin 中调整字段大小

在管理上添加或编辑条目时 Django 倾向于填充水平空间但在某些情况下当编辑 8 个字符宽的日期字段或 6 或 8 个字符的 CharField 时这确实是一种空间浪费字符宽然后编辑框最多可容纳 15 或 20 个字符我如何告
MongoEngine 查询具有以列表中指定的前缀开头的属性的对象的列表

我需要在 Mongo 数据库中查询具有以列表中任何前缀开头的特定属性的元素现在我有一段这样的代码 query mymodel terms term in query terms 并且这会匹配在列表 term 上有一个项目的对象该列表中的
如何将特定范围内的标量添加到 numpy 数组？

有没有一种更简单更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始但它涉及获取给定数
Python 3：将字符串转换为变量[重复]

这个问题在这里已经有答案了我正在从 txt 文件读取文本并且需要使用我读取的数据之一作为类实例的变量 class Sports def init self players 0 location name self players pla
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
当字段是数字时怎么说...在 mongodb 中匹配？

所以我的结果中有一个名为城市的字段结果已损坏有时它是一个实际名称有时它是一个数字以下代码显示所有记录 db zips aggregate project city substr city 0 1 sort city 1 我需要修
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
如何使用 AWS Lambda Python 读取 AWS S3 存储的 Word 文档（.doc 和 .docx）文件内容？

我的场景是我尝试使用 python 实现从 Aws Lambda 读取 AWS 存储的 S3 word 文档 doc 和 docx 文件内容下面的代码是我使用的我的问题是我可以获取文件名但无法读取内容 def lambda hand
python 中的“槽包装器”是什么？

object dict 和其他地方的隐藏方法设置为这样的
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m
如何将Python3设置为Mac上的默认Python版本？

有没有办法将 Python 3 8 3 设置为 macOS Catalina 版本 10 15 2 上的默认 Python 版本我已经完成的步骤看看它安装在哪里 ls l usr local bin python 我得到的输出是这样的

随机推荐

反编译的 .winmd 文件仅包含外部调用

我正在尝试将 Windows 应用商店应用程序的 ComboBox 控件反编译为 C 但没有代码相反似乎所有属性都是对单独程序集的调用如何找到真正的代码存在的位置以及如何读取 C 中的方法体我无法阅读汇编所以这对我没有好处有关
在 Elastic Beanstalk 环境中运行 Rails rake 任务

有谁知道在 Elastic Beanstalk 环境中为 Rails 应用程序运行 rake 任务的最简单方法我有一些数据想要每隔一段时间重置一次时间线待定我看过其他帖子讨论创建 cron 任务但我现在只想能够一次性执行该任务您需
为什么 Bootstrap 包含 bootstrap-theme 文件？

问题是similar对于这个如何在 Bootstrap 3 中使用 bootstrap theme css https stackoverflow com questions 18327543 how to use bootstrap t
在 C++ 中，有处理内存分配/删除的一般准则吗？

也许我所要求的只是一个我尚未找到的网站的链接但是从 Java 背景出发在 C 中处理内存分配和删除的一般准则是什么我觉得我可能会在我的应用程序中添加各种内存泄漏我意识到智能指针有多种变体您也可以向我提及它们但我想重点关注标准 C
正则表达式获取间隔下划线之间的字符串

我见过很多类似的问题但我无法获得所需的输出我有一根绳子means variab textimput x2 200 txt我想抓住ONLY第三个和第四个下划线之间是什么文本输入我用的是R stringr 我尝试了很多方法但都没有解决
使用 Gremlin 和 Java 连接 JanusGraph 出现序列化异常（遇到未注册的类 ID：65536）

我正在尝试使用以下 Java 程序连接到 Janus Graph 我正在尝试从现有图表中获取条目我正在使用 Janusgraph 0 4 0 和 Cassandra 3 11 5 Graph graph EmptyGraph instan
我正在使用 Pylons 并遇到了 response.set_cookie 问题

我认为 Pylons 的一个版本是不同的但我找不到一种简单的方法来判断我正在运行的版本在第一个示例中我相当确定它是 0 9 7 及以上版本使用 webob 设置 cookie 此环境将符号设置为 100 正如您在其他环境中看到的那
求解线性最小二乘法的最快方法

In https math stackexchange com a 2233298 340174 https math stackexchange com a 2233298 340174有人提到如果通过 LU 分解来求解线性方程 M x
如何在flutter应用程序中调整figma尺寸？

我设计了 Figma 我需要将其应用到我的 flutter 应用程序中但我有一定的困难所以按顺序我尝试的第一件事是使用自动导入工具我尝试过 Adobe XD 到 Flutter 超新星工作室不幸的是这些工具仍处于其旅程的开始阶段
Clojure Ref、Var、Agent、Atom 之间的差异以及示例

我对 Clojure 很陌生你们能给我解释一下现实世界的场景吗我的意思是在哪里使用 Ref Var Agent Atom 我读过书但是仍然无法理解现实世界的例子我强烈推荐 The Joy of Clojure 或 programm
如何使用 JavaScript 将部分文本包装在节点中

我有一个具有挑战性的问题需要解决我正在编写一个以正则表达式作为输入的脚本然后该脚本在文档中查找此正则表达式的所有匹配项并将每个匹配项包装在其自己的中 span 元素困难的部分是文本是格式化的 html 文档因此我的脚本需要浏览
Tomcat 和 SSL 客户端证书

我想要一个以下场景创建我自己的 CA 创建服务器证书并使用我的 CA 对其进行签名创建多个客户端证书并使用我的 CA 对其进行签名接下来我想对每个提供由我的 CA 签名的证书的客户端进行身份验证是否可以在不将每个客户端证书添加到我
重用在 R 函数中创建的对象

我已经搜索过并找到了类似的问题 https stackoverflow com questions 15994368 r 2 15 2 how to make object created within function usable ou
python中有一个函数可以将一个单词拆分成一个列表吗？ [复制]

这个问题在这里已经有答案了 python中有一个函数可以将一个单词拆分成单个字母的列表吗例如 s Word to Split to get wordlist W o r d t o S p l i t gt gt gt list Word
自定义路由规则（例如 www.app.com/project/35/search/89/edit/89）

我想创建如下的路由规则 www app com project 35 search 89 edit 48 gt 操作在项目控制器中编辑传递的变量应为project 35 search 89 和edit 48 有人可以帮我为此构造一个rou
CUICatalog：找不到名称的再现：someimage@2x~ipad.png 比例因子：2 设备习惯用语：1 设备子类型：568

我创建了在 xcode 5 上完美运行的应用程序但是当我用 iphone 6 模拟器在 xcode 6 上运行它时它给了我一个错误 CUICatalog 找不到名称的再现 someImage 2x ipad png 比例因子 2 设备习
在 SOAP 客户端中实现会话

我正在开发一个 WP 应用程序其 Web 服务是使用 SOAP 客户端在 NET 中实现的我已经使用添加服务引用选项在我的 WP 应用程序中实现了 SOAP 客户端现在的问题是有两种不同的客户端类一种用于登录功能另一种用于所
kubernetes 持久卷 ReadWriteOnly(RWO) 不适用于 nfs

there 根据文档 ReadWriteOnce the volume can be mounted as read write by a single node 我创建了一个基于nfs的PV apiVersion v1 kind Pers
流口水查询。它们是如何评估和执行的？

我正在概念验证应用程序中评估 Drools 6 我要么误解了 Drools 中的查询是如何工作的要么是我没有正确实现某些功能有人可以向我解释一下这种行为吗我有一条规则应该对经过验证的记录起作用如下所示 rule Patient In
使用正则表达式将值替换为 np.nan

我有一个数据框如下 data1 first alice bob carol last huge foo bar baz df pd DataFrame data1 例如我想将所有字符 o 替换为 a 那我就做 df replace o a

使用正则表达式将值替换为 np.nan

使用正则表达式将值替换为 np.nan 的相关文章

随机推荐

热门标签