Pandas：isin() 和 str.contains() 有什么区别？

2023-12-19

我想知道如果我的数据帧的某些列中存在特定字符串（每列有不同的字符串）。据我了解isin() https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.isin.html是为数据帧编写的，但也可以用于系列，而str.contains() https://pandas.pydata.org/pandas-docs/version/0.23/generated/pandas.Series.str.contains.html对于系列来说效果更好。

我不明白我应该如何在两者之间做出选择。（我搜索了类似的问题，但没有找到任何关于如何在两者之间进行选择的解释。）

.isin检查列中的每个值是否包含在任意值列表中。大致相当于value in [value1, value2].

str.contains检查列中的每个值中是否包含任意值。大致相当于substring in large_string.

换句话说，.isin按列工作并且适用于所有数据类型。str.contains按元素工作，并且仅在处理字符串（或可以表示为字符串的值）时才有意义。

来自官方文档：

系列.isin(值) https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.isin.html

检查Series中是否包含值。返回一个布尔系列，显示系列中的每个元素是否与传递的值序列中的元素完全匹配。

Series.str.contains(pat, case=True, flags=0, na=nan,** **正则表达式=真） https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.contains.html

测试模式或正则表达式是否包含在系列或索引的字符串。

根据是否给定模式或返回布尔系列或索引正则表达式包含在系列或索引的字符串中。

例子：

print(df)
#     a
# 0  aa
# 1  ba
# 2  ca

print(df[df['a'].isin(['aa', 'ca'])])
#     a
# 0  aa
# 2  ca

print(df[df['a'].str.contains('b')])
#     a
# 1  ba

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

string

DataFrame

stringcomparison

Pandas：isin() 和 str.contains() 有什么区别？的相关文章

Python 不考虑 distutils.cfg

我已经尝试了给出的所有内容并且所有教程都指向相同的方向即使用 mingw 作为 python 而不是 Visual C 中的编译器我确实有 Visual C 和 mingw 当我想使用 pip 安装时问题开始出现它总是给Unabl
Python 内置对象的 __enter__() 和 __exit__() 在哪里定义？

我读到每次使用 with 时都会调用该对象的 enter 和 exit 方法我知道对于用户定义的对象您可以自己定义这些方法但我不明白这对于打开等内置对象函数甚至测试用例是如何工作的这段代码按预期工作我假设它使用 exit 关
Python Selenium 打印另存为 PDF 等待文件名输入

我正在尝试通过打印对话框将网站另存为 PDF 我的代码允许我另存为pdf 但要求我输入文件名我不知道如何将文件名传递到弹出框附上我的代码 import time from selenium import webdriver import
Python speedtest.net，或等效的[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案是否有一个 Python 库可以实现 SpeedTest net 测试或等效的互联网连接速度测试 GitHub上有一个项目叫速度检查 https gi
列表推导式和 for 循环中的 Lambda 表达式[重复]

这个问题在这里已经有答案了我想要一个 lambda 列表作为一些繁重计算的缓存并注意到这一点 gt gt gt j for j in lambda i for i in range 10 9 9 9 9 9 9 9 9 9 9 Alt
无法通过 Android 应用程序访问我的笔记本电脑的本地主机

因此我在发布此内容之前做了一项研究我发现的解决方案不起作用更准确地说连接到我的笔记本电脑的 IPv4192 168 XXX XXX 没用连接到10 0 2 2 加上端口不起作用我需要测试使用 Django Rest 框架构建的
如何从 python 脚本执行 7zip 命令

我试图了解如何使用 os system 模块来执行 7zip 命令现在我不想用 Popen 或 subprocess 让事情变得复杂我已经安装了 7zip 并将 7zip exe 复制到我的用户文件夹中我只想提取我的测试文件 inst
按字符分割字符串

scala 有一个标准的分割字符串的方法StringOps split 但它的行为有点让我惊讶演示一下使用快捷便利功能 def sp str String str split toList 以下表达式全部计算结果为 true sp Li
Pandas 合并指标自定义值

在 pandas 合并期间将指示器更新为更友好的消息的最快方法是什么默认indicator True yields left only right only both 我想更新为Only present in last month s d
使用 ElementTree 在 python 中解析 xml

我对 python 很陌生我需要解析一些脏的 xml 文件这些文件需要先清理我有以下 python 代码 import arff import xml etree ElementTree import re totstring wit
pandas groupby 操作缺少数据

在 pandas 数据框中我有一列如下所示 0 M 1 E 2 L 3 M 1 4 M 2 5 M 3 6 E 1 7 E 2 8 E 3 9 E 4 10 L 1 11 L 2 12 M 1 a 13 M 1 b 14 M 1 c 15
Eclipse/PyDev 中未使用导入警告，尽管已使用

我正在我的文件中导入一个绘图包如下所示 import matplotlib pyplot as plt 稍后我会在我的代码中成功使用此导入 fig plt figure figsize 16 10 然而 Eclipse 告诉我未使用的导
将图与热图（可能是对数）配对？

How to create a pair plot in Python like the following but with heat maps instead of points or instead of a hex bin plot
哪种方式最适合Python工厂注册？

这是一个关于这些方法中哪一种被认为是最有效的问题 Pythonic 我不是在寻找个人意见而是在寻找惯用的观点我的背景不是Python 所以这会对我有帮助我正在开发一个可扩展的 Python 3 项目这个想法类似于工厂模式只不过它是
获取多个同名请求参数

我的问题是给定的代码 from flask import Flask request app Flask name app route def hello return str request values get param None a
类返回语句不打印任何输出

我正在学习课程但遇到了问题return语句它是语句吗我希望如此程序什么也没有打印出来它只是结束而不做任何事情 class className def createName self name self name name def
用 pandas DataFrame 替换 mysql 数据库表中的行

Python 版本 2 7 6 熊猫版本 0 17 1 MySQLdb 版本 1 2 5 在我的数据库中 PRODUCT 我有一张桌子 XML FEED 表 XML FEED 很大数百万条记录我有一个 pandas DataFrame
为什么从 openAI 导入 Universe 模块时出现“无效语法”错误

当我导入时universe来自 openAI 的模块我收到以下错误 Traceback most recent call last File
PyQt5按钮lambda变量变成布尔值[重复]

这个问题在这里已经有答案了当我运行下面的代码时它显示如下为什么 x 不是 x 而是变成布尔值这种情况仅发生在传递到用 lambda 调用的函数中的第一个参数上错误的 y home me model some file from P
py2exe ImportError：没有名为的模块

我已经实现了一个名为 myUtils 的包它由文件夹 myUtils 文件组成 init py 和许多名称为 myUtils 的 py 文件该包包含在 myOtherProject py 中当我从 Eclipse 运行它们时可以找到

随机推荐

如何在 C#/Win32 api 中找到 Windows 应用程序执行别名的目标？

Microsoft Windows 终端通过 Microsoft Store 安装创建 0 字节wt exe文件是一个Windows 执行别名 https www tiraniddo dev 2019 09 overview of wi
如何计算（数学）字符串表达式，vb.net

我不确定我使用的术语是否正确但我有一个字符串表达式我希望计算它这是一个例子 Dim S 4 4 dim result evaluate S some sort of treatment that return 8 我不确定这将如何运作
与 MinGW-64 的静态链接

我正在尝试使用 64 位 MinGWhttp sourceforge net projects mingw w64 files Toolchains 20targetting 20Win64 Automated 20Builds http
java.net.SocketException：连接由对等方重置：服务文件时套接字写入错误

我正在尝试使用套接字实现 HTTP 服务器如果客户端例如浏览器请求目录服务器将显示可用文件的列表当客户端请求文件时就会出现问题我收到以下错误 java net SocketException Connection reset b
如何在Angular 2中实现AOP

我是 Angular 2 的新手但我在 Angular 1 x 方面有很好的经验我收到错误找不到模块 aspect js dist lib aspect 下面是我的代码日志记录 aspect ts import Injectable
Android OpenGL图像处理——不使用SurfaceView

我想使用 OpenGL ES 2 和着色器进行一些背景图像处理但不绘制到表面即仅离屏渲染到帧缓冲区虽然我已经在 iOS 上做到了这一点但我在 Android 上却遇到了困难我想我已经接近创建一个工作 OpenGL 上下文但还没有
C++：生成函数调用树

我想解析项目中当前的 C 文件并列出其中的所有方法函数然后生成函数调用和调用者树 F g 您可以参考 doxygen 如何生成调用树我已经检查了 gccxml 但它没有列出从另一个函数调用的函数请建议我一些我可以使用的轻量级工具开
检查数字的递归函数

编写一个递归函数来检查数字中有多少位可以除以它们后面的数字例子 84963应该返回 2 因为 8 可以除以 4 6 可以除以 3 我的函数似乎根本没有输出任何内容 include
如何更改表列数据类型[关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 我有以下专
如何建立/模拟持续的 TCP 连接？

看起来 WCF TCP 连接不是持久的第一次 ping 回复需要一段时间但后续过程花费的时间更少过了一会儿又需要很长时间再次重新连接服务器 gt 在 net tcp 0 0 0 0 999 上启动 CLIENT gt Conne
CSS 只适用于 Safari？

是否可以添加一个我只想在 Safari 中显示而不是在其他浏览器中显示的 css 块下面是一个示例如果您的浏览器是 Safari 或 Chrome 两者共享通用的 Webkit 渲染引擎则将网站的字体颜色设置为绿色 media scr
自动调整 WebView 大小以适应内容

我正在开发一个 Xamarin Forms PCL 项目该项目以 WebView 的形式显示帖子因此我添加了可点击的内容例如主题标签我遇到的问题是 WebView 无法适应其内容的大小 WebView 不加载实际站点我使用以下方法将
APC 不记得 CLI 中的缓存

我正在使用以下命令设置 APC 缓存数组 apc add ips ips 通过命令行可以通过以下方式检索此缓存数组 apc fetch ips 在同一个脚本中但是无法从后续 CLI 脚本或通过 Apache 调用的 PHP 访问它虽
什么时候 `new Error()` 比 `Error()` 更好？

ES5 语言规范明确指出 http www ecma international org ecma 262 5 1 sec 15 11 1 that Error foo 做同样的事情new Error foo 但我注意到在野外时间越长ne
发布一对多关系

我正在尝试通过 Django REST 框架向我的 Django 模型公开 API 我有一个对象Observation 一个观察可以包含多个已观察到的事物所以我这样表示 class Observation models Model pho
如何验证 EWS Java API

我们正在使用 EWS Java API 在 Java 应用程序上使用 Outlook 日历我在 EWS 上遇到身份验证问题我在机架空间提供的云 Outlook 帐户上尝试了该应用程序一切正常因此我知道凭据是准确的这是代码 impo
在线性规划中将条件约束转换为线性约束

我有两个变量 x gt 0 和 y 二进制 0 或 1 并且我有一个常数 z gt 0 如何使用线性约束来描述以下条件 If x z then y 1 else y 0 我试图通过定义另一个二元变量 i 和一个足够大的正常数 U 并添加约束
反应式编程中流之间的循环依赖关系

在涉足反应式编程时我经常遇到两个流相互依赖的情况解决这些案例的惯用方法是什么一个最小的例子有按钮 A 和 B 都显示一个值单击 A 必须将 A 的值增加 B 单击 B 必须将 B 的值设置为 A 我能想到的第一个解决方案 F 中的
我如何模拟 sqlite3.Cursor

我一直在绞尽脑汁试图找出如何嘲笑sqlite3 Cursor类具体为fetchall method 考虑以下代码示例 import sqlite3 from mock import Mock patch from nose tools im
Pandas：isin() 和 str.contains() 有什么区别？

我想知道如果我的数据帧的某些列中存在特定字符串每列有不同的字符串据我了解isin https pandas pydata org pandas docs stable generated pandas DataFrame isin ht

Pandas：isin() 和 str.contains() 有什么区别？

Pandas：isin() 和 str.contains() 有什么区别？ 的相关文章

随机推荐

热门标签

Pandas：isin() 和 str.contains() 有什么区别？的相关文章