在包含缺失值的 Pandas 数据框列上使用 apply 和 lambda 函数

2024-05-27

这是这个问题的后续：如何根据 pandas 数据框中其他列中的子字符串创建新列？ https://stackoverflow.com/questions/70086559/how-to-create-new-column-based-on-substrings-in-other-column-in-a-pandas-datafra

数据框具有以下结构

df = pd.DataFrame({
    'Other input': ['Text A', 'Text B', 'Text C', 'Text D', 'Text E'],
    'Substance': ['(NPK) 20/10/6', NaN, '46%N / O%P2O5 (Urea)', '46%N / O%P2O5 (Urea)', '(NPK) DAP Diammonphosphat; 18/46/0'],
    'value': [0.2, NaN, 0.6, 0.8, .9]
})

    Other Input  substance               value
0   Text A       (NPK) 20/10/6           0.2
1   Text B       NaN                     NaN
2   Text C       46%N / O%P2O5 (Urea)    0.6
3   Text D       46%N / O%P2O5 (Urea)    0.8
4   Text E       (NPK) DAP Diammonphosphat; 18/46/0          0.9

它是通过将两个 df 与左连接合并而创建的，事实证明我有行没有物质 and value。我需要用短名称替换该物质，并且在数据集中缺少值之前，以下代码有效：

test['Short Name'] = test['Substance'].apply(lambda x: 'Urea' if 'Urea' in x else 'DAP' if 'DAP' in x else '(NPK)')

我怎样才能用NaN（或者0，如果更容易的话）来完成这个工作？有没有相当于na_action=None这显然适用于 applymap 吗？

如果你想跳过包含 NaN 的行，只需添加一个调用dropna()在你之前apply()。这将创建数据帧的新临时副本，并删除任何列中包含 NaN 的所有行。

test['Short Name'] = test.dropna()['Substance'].apply(lambda x: 'Urea' if 'Urea' in x else 'DAP' if 'DAP' in x else '(NPK)')

Output:

>>> test
  Other input                           Substance  value     Te
0      Text A                       (NPK) 20/10/6    0.2  (NPK)
1      Text B                                 NaN    NaN    NaN
2      Text C                46%N / O%P2O5 (Urea)    0.6   Urea
3      Text D                46%N / O%P2O5 (Urea)    0.8   Urea
4      Text E  (NPK) DAP Diammonphosphat; 18/46/0    0.9    DAP

这会起作用，因为分配Series反对DataFrame对象使用它们的索引，如果您检查apply()添加后调用dropna():

>>> test.dropna()['Substance'].apply(lambda x: 'Urea' if 'Urea' in x else 'DAP' if 'DAP' in x else '(NPK)')
0    (NPK)
2     Urea
3     Urea
4      DAP
Name: Substance, dtype: object

请注意它是如何从 0 跳到 2 的。这是因为索引 1 处的行已被删除，但索引未更新（在本例中是我们想要的）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

在包含缺失值的 Pandas 数据框列上使用 apply 和 lambda 函数的相关文章

将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
如何在flask中使用g.user全局

据我了解 Flask 中的 g 变量它应该为我提供一个全局位置来存储数据例如登录后保存当前用户它是否正确我希望我的导航在登录后在整个网站上显示我的用户名我的观点包含 from Flask import g among other
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
绘制随时间变化的分类数据计数

我有一个数据框 df 其中有一列包含分类数据 ETH 带有 DateTimeIndex 我想绘制类别counts随着时间的推移它们按天索引我最好按年绘制它们 df pd DataFrame County 0 Bexar 3 Nueces
使用 on_bad_lines 将 pandas.read_csv 中的无效行写入文件

我有一个 CSV 文件我正在使用 Python 来解析该文件我发现文件中的某些行具有不同的列数 001 Snow Jon 19801201 002 Crom Jake 19920103 003 Wise Frank 19880303 l
基于代理的模拟：性能问题：Python vs NetLogo & Repast

我正在 Python 3 中复制一小段 Sugarscape 代理模拟模型我发现我的代码的性能比 NetLogo 慢约 3 倍这可能是我的代码的问题还是Python的固有限制显然这只是代码的一个片段但 Python 却花费了三分
AWS EMR Spark Python 日志记录

我正在 AWS EMR 上运行一个非常简单的 Spark 作业但似乎无法从我的脚本中获取任何日志输出我尝试过打印到 stderr from pyspark import SparkContext import sys if name m
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
Flask如何获取请求的HTTP_ORIGIN

我想用我自己设置的 Access Control Allow Origin 标头做出响应而弄清楚请求中的 HTTP ORIGIN 参数在哪里似乎很混乱我在用着烧瓶 0 10 1 以及HTTP ORIGIN似乎是这个的特点之一object
IO 密集型任务中的 Python 多线程

建议仅在 IO 密集型任务中使用 Python 多线程因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权然而多线程对于 IO 密集型操作有意义吗 https stackoverflow c
在f字符串中转义字符[重复]

这个问题在这里已经有答案了我遇到了以下问题f string gt gt gt a hello how to print hello gt gt gt f a a gt gt gt f a File
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
Conda SafetyError：文件大小不正确

使用创建 Conda 环境时conda create n env name python 3 6 我收到以下警告 Preparing transaction done Verifying transaction SafetyError Th
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
Python：如何将列表列表的元素转换为无向图？

我有一个程序可以检索 PubMed 出版物列表并希望构建一个共同作者图这意味着对于每篇文章我想将每个作者如果尚未存在添加为顶点并添加无向边或增加每个合著者之间的权重我设法编写了第一个程序该程序检索每个出版物的作者列表并
发送用户注册密码，django-allauth

我在 django 应用程序上使用 django alluth 进行身份验证注册我需要创建一个自定义注册表单其中只有一个字段电子邮件密码将在服务器上生成这是我创建的表格 from django import forms from
导入错误：没有名为 site 的模块 - mac

我已经有这个问题几个月了每次我想获取一个新的 python 包并使用它时我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误实际上我无法使用任何新软件包因为每次我

随机推荐

使用动态对象组配置 gradle 插件扩展的正确方法

我正在尝试编写自己的 gradle 插件它需要能够配置一组对象这些对象的数量以及它们的名称取决于用户用于创建具有高级可定制性的自定义 gradle 插件的 doco 相当差它提到project container 方法来做这种事情
要实现 XML 可序列化，从 ICollection 继承的类型必须具有 Add 的实现

我有来自现有项目的 CSLA 1 x 框架对象我试图在新的 Net 4 0 项目中使用它这些对象正在生产中使用如果没有 2 组对象我确实无法将它们转换为 2 x 或 EF 在我的 c webservice 中当我尝试运行它时我
从命令行发布 Azure 项目

我有一个 Azure Web 角色项目我可以使用 Visual Studio 的内置向导成功发布它但我们希望自动化该过程如何使用 MSbuild 或任何其他命令行工具发布 Azure WebRole 您可能还想创建一个控制台应用程序
在 Excel 中的文件夹内的所有文件上添加一列

我在一个文件夹内有 250 个不同的 excel 文件具有相同的布局其中包含列A to F 我需要在列上添加新列G 传统的方法是打开每个文件并在以下位置添加新列G 有没有使用 Excel 宏或任何其他工具的简单过程来完成此任务这个链接
使用运算符 j 操作 zsh 数组

以下代码摘自here http eseth org 2010 git in zsh html function vi git st local ahead behind remote local a gitstatus Are we on
将二维整数作为 Readonly/const 存储在单独的类中，同时保持非公开

这是我在使用这个地方作为我的去处以获取关于什么有效无效为什么等的一般意见之后的第一个问题那么让我们试试这个由于我的经验有限我一直在尝试寻找更好的方法来创建固定数据字段我可以在整个程序中引用这些字段例如我反复显示的最终用户可
cvs rtag：[07:34:59]等待cvsuser的锁定

当我执行 rtag 时进程相当慢并显示消息 cvs rtag 07 34 59 waiting for cvsuser s lock in 是什么原因导致这个问题以及如何解决这个问题提前致谢通过 Google 搜索 cvs wait
IOS - 如何创建具有模糊背景的 Facebook 反应栏？

虽然这周可能不会复制 Facebook 的某些设计但我希望能够设计我自己的下面的反应指示器视图版本我有三个UIImageViews 排列在与上面相同的位置问题是与 Facebook 不同背景颜色可能会改变即位于UIBlurEff
是否可以从同一网络上的另一台计算机访问 Azure 模拟器？

我正在运行带有 VS 2010 SP1 和 Windows Azure SDK 1 5 的 Windows 7 x64 我希望能够在连接到同一网络的 iPhone 上调试 Web 应用程序以缩短调试周期 IIS 正在这台计算机上运行并且
mysql - 有什么方法可以帮助使用另一个索引进行全文搜索？

假设我有一个文章表其中包含以下列 article text fulltext indexed author id indexed 现在我想搜索特定作者撰写的文章中出现的术语所以像这样 select from articles whe
高度在 IOS (iphone) 上无法正常工作

我已经创建了this https codepen io salman15 project live DWbWpo Codepen 上的网站在尝试使其响应所有平台时我遇到了问题看起来单个 div 覆盖了整个页面仅在 IOS 上并且并
大厅 CI 和内部版本号

我将从 Jenkins 转向使用 using广场CI运行我的 Sauce 实验室 e2e 测试 Sauce 实验室将具有相同内部版本号字符串的测试分组在一起 name Chrome XS browserName chrome tunnelI
Android 模拟器问题

当我启动模拟器时我遇到很多问题错误 HttpConnectionApp emulator 5554 disconnected Cancelling net paxcel http HttpConnectionApp activity l
隐藏树视图列表中的节点。在 C# 中

我正在使用 VS 2005 C 正在处理一个未完成的 WinForm 我已将 XML 解析为树视图列表但遇到了一些问题我想知道是否有一种方法可以隐藏过滤删除名称中包含 this text 的某个节点而不必依赖文本框这就是我对这个
如何在单元测试中的请求之间更改 $httpBackend when[method] 语句？

在我的测试中我启动一些模型数据并模拟响应 beforeEach function var re new RegExp http users online httpBackend whenGET re respond id 12345 us
如何使用 php 通过 https 下载文件

我需要使用 PHP 下载 xml 文件我可以在对文件进行curl 调用时通过设置以下选项来读取文件的内容 curl setopt http CURLOPT SSL VERIFYPEER false curl setopt http CUR
方法与管道

在 Angular 应用程序中的模板插值中使用管道和方法有区别吗例如 h1 name toLowerCase h1 vs h1 name lowercase h1 就性能而言是有真正的收获还是只是个人喜好我知道调用模板中的方法通常会降
选中复选框时，角度反应形式禁用输入

我有一个复选框和输入我想要做的是在选中复选框时禁用输入并在取消选中复选框时启用输入这是我的表格组 this workingTime this fb group toggle false this is the checkbox fro
根据值更改 DataGrid 单元格颜色

我有一个 WPF 数据网格我想要根据值使用不同的单元格颜色我的 xaml 上有以下代码 Style TargetType DataGridCell 但不是只选择一个单元格而是选择所有行我缺少什么如果您尝试设置DataGrid Cel
在包含缺失值的 Pandas 数据框列上使用 apply 和 lambda 函数

这是这个问题的后续如何根据 pandas 数据框中其他列中的子字符串创建新列 https stackoverflow com questions 70086559 how to create new column based on sub

在包含缺失值的 Pandas 数据框列上使用 apply 和 lambda 函数

在包含缺失值的 Pandas 数据框列上使用 apply 和 lambda 函数 的相关文章

随机推荐

热门标签

在包含缺失值的 Pandas 数据框列上使用 apply 和 lambda 函数的相关文章