Pandas系列不区分大小写的匹配和值之间的部分匹配

2024-02-08

我有以下操作来添加状态，显示一个数据帧列的列中的任何字符串出现在另一个数据帧的指定列中的位置。它看起来像这样：

df_one['Status'] = np.where(df_one.A.isin(df_two.A), 'Matched','Unmatched')

如果字符串大小写不同，则不会匹配。是否可以在不区分大小写的情况下执行此操作？

另外，当值在时是否可以返回“匹配”df_one.A以完整字符串结尾df_two.A？例如df_one.A abcdefghijkl -> df_two.A ijkl = '匹配'

您可以通过将表达式内的两个字符串转换为小写或大写（都有效）来进行第一个测试（因为您没有将任一列重新分配回 DataFrame，因此大小写转换只是临时的）：

df_one['Status'] = np.where(df_one.A.str.lower().isin(df_two.A.str.lower()), \ 
                            'Matched', 'Unmatched')

您可以通过检查 df_one.A 中的每个字符串是否以 df_two.A 中的任何字符串结尾来执行第二个测试，如下所示（假设您仍然想要不区分大小写的匹配）：

df_one['Endswith_Status'] = np.where(df_one.A.str.lower().apply( \
                                      lambda x: any(x.endswith(i) for i in df_two.A.str.lower())), \ 
                                      'Matched', 'Unmatched')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

NumPy

NP

Pandas系列不区分大小写的匹配和值之间的部分匹配的相关文章

如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
Python 多处理示例不起作用

我正在尝试学习如何使用multiprocessing但我无法让它发挥作用这是代码文档 http docs python org 2 library multiprocessing html from multiprocessing imp
pandas 替换多个值

以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
__del__ 真的是析构函数吗？

我主要用 C 做事情其中析构函数方法实际上是为了销毁所获取的资源最近我开始使用python 这真的很有趣而且很棒我开始了解到它有像java一样的GC 因此没有过分强调对象所有权构造和销毁据我所知 init 方法对我来说在 py
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
Python - 按月对日期进行分组

这是一个简单的问题起初我认为很简单而忽略了它一个小时过去了我不太确定所以我有一个Python列表datetime对象我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量也许一个例子可以更好地证明这
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数

随机推荐

跟踪 Zaber 设备移动时的位置

我正在编写一个 LabVIEW VI 来移动 Zaber 线性执行器并且我想在设备移动时每隔几毫秒记录一次设备的位置我已经安装了Zaber 的 LabVIEW 驱动程序 http www zaber com wiki Software
CloudKit fetchRecordChangesOperation 给出“AppDefaultZone 不支持同步语义”

我使用 CKFetchRecordChangesOperation 和 CKFetchRecordsChangeToken 来获取更改它告诉我 AppDefaultZone 不支持同步语义这是有问题的代码 void downloadSe
混合 Razor 和 Javascript 代码

我对如何混合 razor 和 js 感到非常困惑这是我目前坚持的功能
如何处理 Java BigDecimal 中的舍入错误

我正在与开源项目 axil 合作该项目在java应用程序内部实现了脚本引擎并且在尝试利用BigDecimal的舍入时遇到了一个主要的障碍 BigDecimal 似乎正在将我的输入转换为科学记数法然后将我传递的精度应用于数字的 SN 表
使用 C 编译器选项捕获浮点异常 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 Gfortran有得心应手的 ffpe trap编译器选项但没有类似的选项可用gcc 我隐约意识到他们处理异常的方式不同但不足以知道为什
在 Firefox 中拖动时，输入类型=范围上的 onchange 事件不会触发

当我玩的时候
如何将多个注释合并为一个注释？

我有两个来自框架的注释我经常在同一字段上使用这两个注释因此我试图创建一个包含两者的组合注释但我不知道这是否可能现有注释我无法控制 Target ElementType PARAMETER ElementType METHOD
分享 mkmapview 截图

我有一张地图上面有很多东西我想以图片屏幕截图的形式分享然而据我所知该地图 Apple 的 iOS 6 和 Google 的 iOS 5 均受版权保护我不能简单地这样做我想到了 Google Static Maps API 但
OpenID Connect 和 IDP 发起的 SSO

我有一个作为服务提供商的应用程序是否可以使用 OpenID Connect 实施 Idp 发起的 SSO 对于 Idp 发起的 SSO 来说似乎只能使用 SAML 对吗或者有没有办法让 OpenID Connect 也能工作我正在考
Gridview 在 1 列上禁用编辑 asp.net

我正在使用 gridview 编辑来编辑 gridview 中的值当我按下编辑时所有列都可以编辑我希望不允许编辑其中一列我有什么办法可以做到这一点吗这是我的 aspx 代码
将 JSON 数组转换为
- 元素
我正在 Microsoft Power BI 中创建自定义视觉对象创建 api 使用 typescript 和 d3 库我也在使用jquery 我正在尝试创建一个分层树来表示拖入视觉对象的字段因此树的深度是在运行时决定的所以它不知道
如何通过单击按钮来切换 jTabbedPane 中的选项卡？

我有两个 JTabbedPane JTabbedPane1 和 2 如何按下 JTabbedPane2 中的按钮来显示 JTabbedPane1 这是 JTabbedPane 的代码 public class TabbedPane exte
如何在 R 中分组时创建排名列

我正在使用 R 我想创建一个显示序列或排名的列同时按两个因素 hhid 和句点进行分组例如我有这个数据集 hhid perid 1000 1 1000 1 1000 1 1000 2 1000 2 2000 1 2000 1 200
PHP 高级作业队列

我正在使用 cron 制作一个一天包含 2000 个作业的脚本意味着这是服务器端并自动完成所有作业但该作业需要同时运行 10 个或指定数量的作业作业就像你看到 IDM 互联网下载管理器一样有一个队列功能它一次运行多个作业如
VBA 用户窗体保存文本框。在组合框中选择名称时将值保存到 Excel 工作表

我提前为发布相同的问题表示歉意但我不知道如何添加额外的代码示例如果有办法在上一个问题中添加额外的代码请告知基本上我试图将一些文本框值保存到我的工作表中以便在用户窗体关闭并重新打开时可以重新启动它们这就是我到目前为止所拥有的但
LINQ：如何在 linq 中动态使用 ORDER BY，但前提是变量不是 string.empty 或 null

我正在使用 LINQ2SQL 它运行得很好但是根据 C 中变量类型字符串的值我需要在查询中使用 Order By 或不使用 order by 如果 C 字符串不为 null 或空那么我想对字符串变量的内容进行排序如果 C 字符串
使用 JavaScript 创建和复制/复制选择/选项列表菜单

我有一个select列表菜单
如何表示循环中不再有字符串 ss 输入 while (cin >> ss)

我使用 cin 从输入流中读取单词就像 int main string word while cin gt gt word do sth on the input word perform some other operations 代码
无法检索正则表达式匹配结果 - MFC / C++

我正在阅读 HTML 页面并尝试检索其中的特定字符串我有以下代码 std string str test GetString someString the string i have checked it it s basically a
Pandas系列不区分大小写的匹配和值之间的部分匹配

我有以下操作来添加状态显示一个数据帧列的列中的任何字符串出现在另一个数据帧的指定列中的位置它看起来像这样 df one Status np where df one A isin df two A Matched Unmatched 如

Pandas系列不区分大小写的匹配和值之间的部分匹配

Pandas系列不区分大小写的匹配和值之间的部分匹配 的相关文章

随机推荐

热门标签

Pandas系列不区分大小写的匹配和值之间的部分匹配的相关文章