Python：检查两个列表之间字符串的部分匹配

2024-03-08

我有两个列表，如下所示：

c = ['John', 'query 989877 forcast', 'Tamm']
isl = ['My name is Anne Query 989877', 'John', 'Tamm Ju']

我想检查其中的每一项isl中的每一项c这样我就可以得到所有部分字符串匹配项。我需要的输出如下所示：

out = ["john", "query 989877", "tamm"]

可以看出，我也得到了部分字符串匹配。

我已经尝试过以下方法：

 out = []
 for word in c:
    for w in isl:
        if word.lower() in w.lower():
                 out.append(word)

但这只给我输出

out = ["John", "Tamm"]

我也尝试过以下方法：

print [word for word in c if word.lower() in (e.lower() for e in isl)]

但这只输出“John”。我怎样才能得到我想要的东西？

也许是这样的：

def get_sub_strings(s):
    words = s.split()
    for i in xrange(1, len(words)+1):      #reverse the order here
        for n in xrange(0, len(words)+1-i):
            yield ' '.join(words[n:n+i])
...             
>>> out = []
>>> for word in c:
    for sub in get_sub_strings(word.lower()):
        for s in isl:
            if sub in s.lower():
                out.append(sub)
...                 
>>> out
['john', 'query', '989877', 'query 989877', 'tamm']

如果您只想存储最大的匹配项，那么您需要以相反的顺序生成子字符串，并在找到匹配项后立即中断isl:

def get_sub_strings(s):
    words = s.split()
    for i in xrange(len(words)+1, 0, -1):
        for n in xrange(0, len(words)+1-i):
            yield ' '.join(words[n:n+i])

out = []
for word in c:
    for sub in get_sub_strings(word.lower()):
        if any(sub in s.lower() for s in isl):
            out.append(sub)
            break

print out
#['john', 'query 989877', 'tamm']

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

string

list

Python：检查两个列表之间字符串的部分匹配的相关文章

如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
Pycharm Python 控制台不打印输出

我有一个从 Pycharm python 控制台调用的函数但没有显示输出 In 2 def problem1 6 for i in range 1 101 2 print i end In 3 problem1 6 In 4 另一方面像
DreamPie 不适用于 Python 3.2

我最喜欢的 Python shell 是DreamPie http dreampie sourceforge net 我想将它与 Python 3 2 一起使用我使用了添加解释器 DreamPie 应用程序并添加了 Python 3 2
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
pandas 替换多个值

以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
如何将 std::string& 转换为 C# 引用字符串

我正在尝试将 C 函数转换为std string参考C 我的 API 如下所示 void GetStringDemo std string str 理想情况下我希望在 C 中看到类似的东西 void GetStringDemoWrap r
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
如何在 C++ 中标记字符串？

Java有一个方便的分割方法 String str The quick brown fox String results str split 在 C 中是否有一种简单的方法可以做到这一点 The 增强分词器 http www boost o
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
如何计算特定字符在字符串中出现的次数

我正在尝试创建一个函数来查看数组中的任何字符是否在字符串中如果是有多少个我尝试计算每一种模式但是太多了我尝试使用 Python 中的 in 运算符的替代方案但效果不佳 function calc fit element var
使用 OpenPyXL 迭代工作表和单元格，并使用包含的字符串更新单元格[重复]

这个问题在这里已经有答案了我想使用 OpenPyXL 来搜索工作簿但我遇到了一些问题希望有人可以帮助解决以下是一些障碍待办事项我的工作表和单元格数量未知我想搜索工作簿并将工作表名称放入数组中我想循环遍历每个数组项并搜索包含特
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
Python - 在窗口最小化或隐藏时使用 pywinauto 控制窗口

我正在尝试做的事情我正在尝试使用 pywinauto 在 python 中创建一个脚本以在后台自动安装 notepad 隐藏或最小化 notepad 只是一个示例因为我将编辑它以与其他软件一起使用 Problem 问题是我想在安装程序
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
为美国东部以外地区的 Cloudwatch 警报发送短信？

AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议我想连接我的 CloudWatch 警报并在发生故障时接收短信但无法将其发送到 SMS YES 经过一番挖掘后我能够让它发挥作用它比仅仅选择一个主题或输入闹钟
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9

随机推荐

如何编写一个接受回调作为参数的 jquery 函数

我有以下功能 function ChangeDasPanel controllerPath postParams post controllerPath postParams function returnValue DasSpace hi
简单的“+[NSTimerchedTimerWithTimeInterval:repeats:block:]：无法识别的选择器”错误

迁移到 10 12 Sierra 和 Xcode 8 1 后我遇到了一个奇怪的错误 NSTimer scheduledTimerWithTimeInterval repeats block unrecognized selector se
错误：Java 堆空间

在 Ubuntu 中当我运行 hadoop 示例时 bin hadoop jar hadoop examples 1 0 4 jar grep input output dfs a z echo HADOOP HEAPSIZE 2000
SwiftUI - 用于数组中索引的索引集

我在 NavigationView 和列表中使用 ForEach 并结合用户使用 onDelete 删除行时调用的函数如下所示 struct PeriodListView View ObservedObject var theperiod
NodeJS 需要函数

当我检查节点的全局和模块时我发现 require 不在其中我不知道这是否神奇但如果有人可以解释 require 是否是全局的那么为什么它不在全局对象中也不在模块对象中因为它在scope 当加载到文件中时节点在幕后wraps ht
Html.Textbox VS Html.TextboxFor

Html Textbox 和 Html TextboxFor 有什么区别最终它们都生成相同的 HTML 但是Html TextBoxFor http msdn microsoft com en us library ee834950 as
pandas groupby：每组中前 3 个值并存储在 DataFrame 中

这是后续pandas groupby 每组的前 3 个值 https stackoverflow com questions 47703606 pandas groupby top 3 values for each group 47703
是否可以从 Java Servlet API 发送到相对路径的重定向？

我想将相对重定向到原始请求域和端口发送到浏览器像这样 Location app But Jetty自动发送完整的绝对路径 Location http 10 0 2 17 9080 app The 文档 http docs oracle
可以在Rails中为belongs_to关联添加别名吗？

我有一个模型belongs to协会 class Car lt ActiveRecord Base belongs to vendor end 所以我可以打电话car vendor 但我也想打电话car company 所以我有以下内容
如何编写将表达式绑定到名称的指令“ng-let”

我想编写一个镜像 ng repeat 但将名称绑定到单个变量的指令所以不要写这样的东西 ng repeat summary in data accounts all summaryAsArray 你可以写这样的东西 ng let summ
使用表标签的嵌套重复器

我正在使用以下代码尝试在 WinJS 中使用嵌套转发器 table class grid thead tr th class groupHeader th tr thead tbody tbody table
Unix Bash Shell 编程（如果目录存在）

所以我试图进入 bash shell 脚本中的 if 语句但我认为我做错了什么无论如何这是我的示例代码 bin bash read sd if d tmp sd then echo That directory exists else
LocalSystem vs. System vs. Local System Windows 系统帐户 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我对 Windows 内置帐户的 MS 文档感到完全困惑 SQL Server 2008 R2 在线文档设置 Windows 服务帐户
Selenium：如何获取html页面代码的影子根中的元素？

我需要获取按钮的元素以使用 selenium 将 MetaMask 钱包连接到多边形网桥 the button I need to find But the button as I understand it is hidden in s
如何强制NetStream创建关键帧？

我创建了一个视频流录制应用程序除了录制的 FLV 有点损坏之外该应用程序运行良好如果我在 VLC 播放器中打开 FLV 一切都是绿色的但当发生更改时会变得干净尤其是在视频的开头是分手我用的是Red5 1 0 对于预先录制的流
RDS实例CPU利用率

我的 amazon mysql 大型 RDS 实例的 CPU 利用率非常高大约 70 没有任何真正的原因如何找到哪个查询或进程正在损害我的实例 thanks 标准方法是检查SHOW PROCESSLIST or SHOW ENGINE
Google Drive API，上传文件 [Python]

我使用 API 将备份从服务器上传到我的谷歌驱动器授权顺利通过文件已上传但文件未出现在列表中代码 import httplib2 import pprint from apiclient discovery import build
AttributeError：“识别器”对象没有属性“识别”

我正在尝试 Python 中的语音识别模块版本 3 5 并收到以下错误 AttributeError 识别器对象没有属性识别这是我使用的代码 import pyaudio import speech recognition as s
使用 RMySQL 的 UTF8 编码

我正在尝试从 mysql 数据库查询数据当然其中包含一些字符串对于连接和数据检索我在 R 中使用 RMySQL 效果很好除了一件事我正在检索的字符串似乎不是 utf8 格式的但我需要这个因为这些字符串中有一些德语 Umlau
Python：检查两个列表之间字符串的部分匹配

我有两个列表如下所示 c John query 989877 forcast Tamm isl My name is Anne Query 989877 John Tamm Ju 我想检查其中的每一项isl中的每一项c这样我就可以得到所有

Python：检查两个列表之间字符串的部分匹配

Python：检查两个列表之间字符串的部分匹配 的相关文章

随机推荐

热门标签

Python：检查两个列表之间字符串的部分匹配的相关文章