列包含列 2

2023-12-22

我有一个数据框。我想测试（C），在每行上，（B）列中的数字是否在字符串（A）列中。

df = pd.DataFrame({'A': ["me 123", "me-123", "1234", "me 12", "123 and"],
                   'B': [123,       123,      123,    123,     6]})

我想得到：

         A    B  C
0   me 123  123  1
1   me-123  123  1
2     1234  123  0
3    me 12  123  0
4  123 and    6  0

各种方法几乎可以解决这个问题 (1)：

df['C'] = [str(y) in x for x , y in zip(df.A.str.split(' '),df.B)]

         A    B      C
0   me 123  123   True
1   me-123  123  False
2     1234  123  False
3    me 12  123  False
4  123 and    6  False

or (2):

df['C'] = [str(y) in x for x , y in zip(df.A,df.B)]

         A    B      C
0   me 123  123   True
1   me-123  123   True
2     1234  123   True
3    me 12  123  False
4  123 and    6  False

or (3):

df['C']=df.A.str.contains(r'\b(?:{})\b'.format('|'.join(df.B.astype(str)))).astype(int)

         A    B  C
0   me 123  123  1
1   me-123  123  1
2     1234  123  0
3    me 12  123  0
4  123 and    6  1

or (4):

def fun (A,B):
    return str(B) in str(A)
f = np.vectorize(fun, otypes=[int])
df["C"] = f(df['A'], df['B'])

         A    B  C
0   me 123  123  1
1   me-123  123  1
2     1234  123  1
3    me 12  123  0
4  123 and    6  0

or (5):

df['A1'] = df['A'] .apply(word_tokenize)

无法将 - 识别为空格。请问怎样才能得到上面的结果呢？

向量化的方式来自extract

df.A.str.extract('(\d+)', expand=False).astype(int).eq(df.B,0).astype(int)
Out[347]: 
   0
0  1
1  1
2  0
3  0
4  0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pandas

列包含列 2 的相关文章

使用 pandas 中的数据透视表进行加权平均

我编写了一些代码来使用 pandas 中的数据透视表计算加权平均值但是我不确定如何添加执行加权平均的实际列添加一个新列其中每行包含累积计数值数据看起来像这样 VALUE COUNT GRID agb 1 43 1476 10
对多索引进行排序，同时尊重其索引结构

如何在尊重级别组织的同时对多索引数据框进行排序例如鉴于以下df 假设我们根据C 例如按降序排列 C D E A B bar one 0 346528 1 528538 1 three 0 136710 0 147842 1 flux s
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data
Pandas loc 有条件的替代方案

我计划提高非 Pandas 开发人员的可读性我有以下内容workingPython 代码使用 loc new value stackoverflow s query nbc SUGGESTED suggested QUERY query
识别 pandas 数据框中各组之间的差异

我有一个按日期和 ID 索引的 pandas 数据框我想识别日期之间增删的ID 将 ID 添加到另一个数据帧以及添加删除的日期 date ID value 12 31 2010 13 0 124409 9 0 555959 1 0 7
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class
“DataFrame”对象没有属性“isna”

我为我的一个项目改编了一种机器学习代码在我的笔记本电脑上运行良好的代码现在在我的台式机上出现问题我正在检查所有数据框列是否有缺失值 File g100 py line 11 in
当输入是 DataFrame 时，在seaborn中对箱线图进行分组

我打算在一个图中绘制多个列pandas dataframe 全部按另一列分组使用groupby inside seaborn boxplot 对于类似的问题这里有一个很好的答案matplotlib matplotlib 分组箱线图 ht
替换 Pandas 中各列的重复值

我有一个简单的数据框 df col1 A col2 B col3 C col4 0 col1 M col2 0 col3 M col4 0 col1 B col2 B col3 0 col4 B col1 X col2 0 col3 Y c
按名称获取多个 pandas 列的索引

我想获取选定的 pandas 数据框列的数字索引对于一列来说这非常简单 nonzero df columns values conditionA 但有多个元素我有一些有用的东西但很冗长和巨大 df pd DataFrame colu
带有 join 的 Groupby agg 不会产生预期的输出

我有如下数据框 Wash Month Wash Day 0 3 2 1 4 3 预期输出是 d Wash Month Wash Month Wash Day Wash Day Wash Month Wash Day df T astype
SQLAlchemy 中 mssql+pyodbc 出现“数据源名称太长”错误

我正在尝试使用 SQLAlchemy 和 pyodbc 将数据帧上传到 Azure SQL Server 数据库上的数据库我已建立连接但上传时出现错误 pyodbc Error IM010 IM010 Microsoft ODBC 驱动
如何在 Pandas Python 中按 id 对行进行排名

我有一个像这样的数据框 id points1 points2 1 44 53 1 76 34 1 63 66 2 23 34 2 44 56 我想要这样的输出 id points1 points2 points1 rank points2
Python：json_normalize pandas 系列给出 TypeError

我在 pandas 系列中有数万行像这样的 json 片段df json IDs lotId 1 Id 123456 date 2009 04 17 bidsCount 2 IDs lotId 2 Id 123456 date 2009 0
访问 pandas.Series.apply 中的索引

假设我有一个 MultiIndex 系列s gt gt gt s values a b 1 2 0 1 3 6 0 3 4 4 0 7 我想应用一个使用行索引的函数 def f x conditions or computations us
如何计算 pandas datetime 对象的均值和方差？

如何计算 YYYY MM DD 形式的 python 日期时间对象的汇总统计数据均值和标准差我想对具有不同 ID 的不同日期时间对象组执行此操作数据如下 import datetime as dt df pd DataFrame Da
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
pandas.read_csv 将列名移动一倍

我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是如果我跑 data pd read csv
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并

随机推荐

Visual Studio 最近的“饥饿”或“贪婪”退格行为更新？

截至最近 Visual Studio 2017 以及我刚刚开始使用的 2019 似乎改变了退格按钮的行为具体来说光标位于只有空白比如说制表符位于左侧的位置光标我曾经按退格键删除一个选项卡现在所有空白都被删除我的代码行被放置
无法将 CollectionProxy 对象传递给 ActiveJob

我需要在后台标记一组消息我正在使用delayed job gem 因为它在前台需要一些时间所以我创建了一个ActiveJob class MarkMessagesAsReadJob 并通过了user and messages变量以标记所
模仿 javascript || 的 Python 运算符操作员

我是 Python 新手所以可能不知道这是否显而易见在 JavaScript 中a b回报a if a被评估为 true 否则返回b 除了冗长的 if else 语句之外这在 Python 中是否可能我相信这是正确的 x a or
iPad 未显示在 OSX Safari 上的“开发”菜单中

我需要在 iPad 上调试 HTML 应用程序我以前可以通过 USB 线将 ipad 连接到我的 Mac 它会显示在 Safari 的开发菜单中我现在有两台 ipad 一台装有 iOS 6 另一台装有 iOS 7 iOS 6 的一台
Django 中的字节范围[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案 Django 中是否有 HTTP 字节范围的现有实现 IE 当客户端发送 Range 标头时我希望我的
是否有更有效或更简洁的方法来使用 tidyr::gather 使我的数据看起来“整洁”？

我是使用 tidyverse 的新手我想看看我使用这个包中的函数是否尽可能高效简洁我怀疑我不是我的原始数据将键符号作为每个列名称的一部分 day a x b x a y b y 1 1 0 56047565 1 2240818 1
iOS9 更新 AFNetworking 调用以使用 HTTPS 的正确方法是什么（错误 -1200、-9824）？

我正在从 iOS 8 切换到 iOS 9 之前通过 HTTPS 进行的 AFNetworking Web 服务调用不再有效我越来越error 1200 and error 9824该问题与使用自签名证书有关错误域 kCFErrorDom
RoundUp - AngularJS

我正在使用以下代码来尝试和总结在角度总体上有效但是小于 0 5 的数字四舍五入为 0 我想round up每个数字到下一个整数例如 0 02 应四舍五入为 1 data Virtual SumCores data Physical S
Java 返回错误“无法实例化类型”[重复]

这个问题在这里已经有答案了当我尝试初始化新对象时收到此错误消息 Cannot instantiate the type Car My code 主程序 java public class Main public static void m
Pex 和 Moles 项目还活跃吗？

他们过去每月发布两个新版本但自 2010 年 10 月以来他们没有发布新版本我发现了this http social msdn microsoft com Forums en pex thread e59d72ae 29fd 4251
如何在交互式变基期间取消暂存文件（从旧提交中删除文件）？

我读过Pro Git关于交互式变基以更改多个提交的书所以我正在做git rebase HEAD 3 改了我想修改的一项edit 然后我可以通过更改消息git commit amend 并通过添加一个文件git add file3之后git
打印和格式化字符串文字有什么区别？

当我们可以使用第 8 行和第 9 行代码时使用代码有什么意义print比如10号线 my name Zed A Shaw my age 35 my height 74 my weight 180 my eyes Blue my teeth
如果我将数组初始化为大小 0 会发生什么？

假设我有一个类似的函数 void myFunc List
AJAX 响应时间

如何计算 AJAX 响应时间我在脚本中需要这个因为我得到服务器时间戳但如果请求花费超过 1 秒我需要在时间戳上添加 1 秒您需要获取开始时间就在 AJAX 请求完成之前然后获取脚本完成时的结束时间然后您可以计算出差异如果大
pySerial 2.6：在 readline() 中指定行尾

我正在使用 pySerial 向 Eddie 发送命令我需要在我的阅读行中指定回车符但 pySerial 2 6 去掉了它有解决方法吗这里有艾迪命令集 https www parallax com sites default fil
Spring data jpa，外部化本机查询

我正在使用 Spring data jpa 来执行本机查询这是示例 Query value select name from customer nativeQuery true public List
播放 iOS 时从 HLS 流（视频）中提取/录制音频

我正在使用 AVPlayer 播放 HLS 流当用户按下录制按钮时我还需要录制这些流我使用的方法是分别录制音频和视频然后最后合并这些文件以制作最终视频并且远程 mp4 文件成功但现在对于 HLS m3u8 文件我可以使用 AV
log4j 用于独立的 java 项目

我正在考虑将 log4j 用于我的独立 java 项目是否可以将它用于 java 项目而不是网络应用程序如果可能的话我应该如何初始化属性文件以及应该在哪里初始化我放置了属性文件目录结构任何帮助表示赞赏是的这是可能的我们一
Bing API v1 文档

有谁知道我可以在哪里找到 Bongs API 的最新文档网址如下 https api datamarket azure com Bing Search v1 Web 甚至他们自己的网站在我读过的单词文档中也有错误的 URL 即https
列包含列 2

我有一个数据框我想测试 C 在每行上 B 列中的数字是否在字符串 A 列中 df pd DataFrame A me 123 me 123 1234 me 12 123 and B 123 123 123 123 6 我想得到 A B C

列包含列 2

列包含列 2 的相关文章

随机推荐

热门标签