如何获取与某个单词相关的相似单词?

2024-04-06

我正在尝试解决一个 nlp 问题,其中我有一个单词字典,例如:

list_1={'phone':'android','chair':'netflit','charger':'macbook','laptop','sony'}

现在,如果输入是 'phone' 我可以轻松地使用 'in' 运算符通过按键获取电话及其数据的描述,但问题是输入是否类似于 'phones' 或 'Phones' 。

我想如果我输入“电话”然后我会得到这样的词

'phone' ==> 'Phones','phones','Phone','Phone's','phone's' 

我不知道我可以使用哪个 word2vec 以及哪个 nlp 模块可以提供这样的解决方案。

第二个问题是,如果我给出一个词“狗”,我可以得到“小狗”、“基蒂”、“狗”、“狗”等词吗?

我尝试过类似的方法,但它给出了同义词:

from nltk.corpus import wordnet as wn
for ss in wn.synsets('phone'): # Each synset represents a diff concept.
    print(ss)

但它返回:

Synset('telephone.n.01')
Synset('phone.n.02')
Synset('earphone.n.01')
Synset('call.v.03')

相反,我想要:

'phone' ==> 'Phones','phones','Phone','Phone's','phone's' 

WordNet 索引概念(又名Synsets)不是言语。

Use lemma_names()访问词根(又名Lemma)在WordNet中。

>>> from nltk.corpus import wordnet as wn
>>> for ss in wn.synsets('phone'): # Each synset represents a diff concept.
...     print(ss.lemma_names())
... 
['telephone', 'phone', 'telephone_set']
['phone', 'speech_sound', 'sound']
['earphone', 'earpiece', 'headphone', 'phone']
['call', 'telephone', 'call_up', 'phone', 'ring']

引理作为根形式或单词不应该有额外的词缀,因此您不会找到您在所需单词列表中列出的单词的复数或不同形式。

也可以看看:

  • https://simple.wikipedia.org/wiki/Lemma_(语言学) https://simple.wikipedia.org/wiki/Lemma_(linguistics)
  • https://en.wikipedia.org/wiki/WordNet https://en.wikipedia.org/wiki/WordNet
  • python 中单词的所有同义词? https://stackoverflow.com/questions/19348973/all-synonyms-for-word-in-python

此外,单词是不明确的,可能需要通过上下文或我的词性 (POS) 来消除歧义,然后才能获得“相似”单词,例如,您看到动词含义中的“phone”与“phone”的含义并不完全相同电话如“名词”中所示。

>>> for ss in wn.synsets('phone'): # Each synset represents a diff concept.
...     print(ss.lemma_names(), '\t', ss.definition())
... 
['telephone', 'phone', 'telephone_set']      electronic equipment that converts sound into electrical signals that can be transmitted over distances and then converts received signals back into sounds
['phone', 'speech_sound', 'sound']   (phonetics) an individual sound unit of speech without concern as to whether or not it is a phoneme of some language
['earphone', 'earpiece', 'headphone', 'phone']   electro-acoustic transducer for converting electric signals into sounds; it is held over or inserted into the ear
['call', 'telephone', 'call_up', 'phone', 'ring']    get or try to get into communication (with someone) by telephone
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何获取与某个单词相关的相似单词? 的相关文章

  • 用于将 cython 中的许多 C++ 类包装到单个共享对象的项目结构

    我在文档 邮件列表和这个问题在这里 https stackoverflow com questions 10300660 cython and distutils 但我想得到一个更直接的答案来解决我的具体情况 我正在通过尝试一点一点地包装我
  • 无法“安装”plpython3u - postgresql

    我正在尝试在 postgresql 中使用 python 语言 像这样的事情 create or replace function test a integer returns integer as if a 2 0 return even
  • 使用 pythonbrew 编译 Python 3.2 和 2.7 时出现问题

    我正在尝试使用构建多个版本的 python蟒蛇酿造 http pypi python org pypi pythonbrew 0 7 3 但我遇到了一些测试失败 这是在运行的虚拟机上 Ubuntu 8 04 32 位 当我使用时会发生这种情
  • Django 管理员在模型编辑时间歇性返回 404

    我们使用 Django Admin 来维护导出到我们的一些站点的一些数据 有时 当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时 我们会得到 Django 404 页面 模板 它是偶尔发生的 我们可以通过重新加载三次来重现它
  • SQLAlchemy 通过关联对象声明式多对多自连接

    我有一个用户表和一个朋友表 它将用户映射到其他用户 因为每个用户可以有很多朋友 这个关系显然是对称的 如果用户A是用户B的朋友 那么用户B也是用户A的朋友 我只存储这个关系一次 除了两个用户 ID 之外 Friends 表还有其他字段 因此
  • 将 saxon 与 python 结合使用

    我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用 有两种可能的方法 设置一个 HTTP 服务 接受
  • Django:按钮链接

    我是一名 Django 新手用户 尝试创建一个按钮 单击该按钮会链接到我网站中的另一个页面 我尝试了一些不同的例子 但似乎没有一个对我有用 举个例子 为什么这不起作用
  • Python - StatsModels、OLS 置信区间

    在 Statsmodels 中 我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
  • 使用 on_bad_lines 将 pandas.read_csv 中的无效行写入文件

    我有一个 CSV 文件 我正在使用 Python 来解析该文件 我发现文件中的某些行具有不同的列数 001 Snow Jon 19801201 002 Crom Jake 19920103 003 Wise Frank 19880303 l
  • 根据列值突出显示数据框中的行?

    假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
  • SQLALchemy .query:类“Car”的未解析属性引用“query”

    我有一个这里已经提到的问题https youtrack jetbrains com issue PY 44557 https youtrack jetbrains com issue PY 44557 但我还没有找到解决方案 我使用 Pyt
  • 以编程方式停止Python脚本的执行? [复制]

    这个问题在这里已经有答案了 是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
  • Python pickle:腌制对象不等于源对象

    我认为这是预期的行为 但想检查一下 也许找出原因 因为我所做的研究结果是空白 我有一个函数可以提取数据 创建自定义类的新实例 然后将其附加到列表中 该类仅包含变量 然后 我使用协议 2 作为二进制文件将该列表腌制到文件中 稍后我重新运行脚本
  • BeautifulSoup 中的嵌套标签 - Python

    我在网站和 stackoverflow 上查看了许多示例 但找不到解决我的问题的通用解决方案 我正在处理一个非常混乱的网站 我想抓取一些数据 标记看起来像这样 table tbody tr tr tr td td td table tr t
  • 如何在ipywidget按钮中显示全文?

    我正在创建一个ipywidget带有一些文本的按钮 但按钮中未显示全文 我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
  • 对年龄列进行分组/分类

    我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
  • 如何在 Python 中追加到 JSON 文件?

    我有一个 JSON 文件 其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中 我尝试了这段代码 with open DATA FILENAME a as f json obj js
  • 为字典中的一个键附加多个值[重复]

    这个问题在这里已经有答案了 我是 python 新手 我有每年的年份和值列表 我想要做的是检查字典中是否已存在该年份 如果存在 则将该值附加到特定键的值列表中 例如 我有一个年份列表 并且每年都有一个值 2010 2 2009 4 1989
  • Python:如何将列表列表的元素转换为无向图?

    我有一个程序 可以检索 PubMed 出版物列表 并希望构建一个共同作者图 这意味着对于每篇文章 我想将每个作者 如果尚未存在 添加为顶点 并添加无向边 或增加每个合著者之间的权重 我设法编写了第一个程序 该程序检索每个出版物的作者列表 并
  • 导入错误:没有名为 site 的模块 - mac

    我已经有这个问题几个月了 每次我想获取一个新的 python 包并使用它时 我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误 实际上 我无法使用任何新软件包 因为每次我

随机推荐

  • 如何向 Stripe 客户申请优惠券

    我找不到任何方法将优惠券 折扣应用于重复付款的现有客户 我正在使用stripe宝石 我继续在 Stripe 仪表板上创建了优惠券 我在他们的 API 页面上没有看到如何添加优惠券 我已经尝试过下面的解决方案 但没有成功 cu Stripe
  • read_excel(来自 readxl 包)将 1899-12-30 之前的日期读取为 NA,如何解决此问题?

    我有一个包含 130 场足球比赛的数据集 这些比赛的历史可以追溯到 1893 年 当我从 Excel 导入数据集时 1900 年的日期与 R RStudio 中应有的日期相同 但是 1900 年之前的日期以 NA 形式出现 我该如何解决这个
  • 指向常量字符的指针

    下面的代码指向a中的第一个字符字符数组可在只读存储器中使用 是对的吗 const char ptr String one 现在 当ptr开始指向另一个内存位置 ptr String two 第一个会发生什么字符数组 执行结束时该内存位置是否
  • 是否有跨设备的 CNContact 标识符?

    CNContact 是否有任何 icloud 标识符可以让我在设备上保留并重复使用 这个想法是能够从不同的 iOS 设备再次拉取 CNContact 文档对此没有任何说明 我知道以前的 ABAddressbook 框架也没有这个功能 但我希
  • 如何从 python/scipy/numpy 等中的步骤函数中采样?

    如果我有每个箱的箱边和计数 是否有一种很好的简洁方法可以从这意味着的概率密度函数中进行采样 这是我的意思的一个例子 bin edges 0 2 1 6 3 23 5 counts 5 2 10 概率密度函数是一个阶跃函数 其步长为 0 2
  • 在 iPhone 键盘顶部添加文本框和按钮

    我想在它旁边添加一个文本框和一个按钮 它们将位于窗口的底部 然后 当我触摸文本框 输入内容 时 键盘将出现 整行 带有文本框和按钮 向上滚动 键盘将位于它们的正下方 你能让我知道我该怎么做吗 有示例程序吗 Thanks 马特 加拉格尔 Ma
  • 每个用户“类型”的 PHP 子文件夹

    我有 3 个子文件夹upload文件夹 我的代码如下所示 if isset SESSION u type SESSION u type 3 files scandir path 3 path is set somewhere above 它
  • $scopeProvider <- $scope/ 未知提供者

    我用茉莉花测试我的角度应用程序 http jasmine github io 2 0 http jasmine github io 2 0 并出现下一个错误 未知提供者 scopeProvider testModule controller
  • C#:锚定面板无法正确调整大小

    关于用户控件中面板的自动调整大小 我遇到了一个奇怪的问题 该面板固定在用户控件的所有 4 个侧面 但锚定并不总是按其应有的方式起作用 如果通过调整窗体大小来调整用户控件的大小 则右侧和底部锚点不起作用 但是 如果使用表单中的拆分器调整控件的
  • 尝试在空对象引用上调用虚拟方法“java.lang.Object android.content.Context.getSystemService(java.lang.String)”

    我正在尝试检查我的应用程序是否是第一次启动 如果是 则要求用户输入 然后 检查 Wi Fi 是否已连接 如果连接了 Wi Fi 我将使用用户提供的输入来加载 WebView 但是 该应用程序在启动时崩溃并出现错误 尝试在空对象引用上调用虚拟
  • 显示来自 javascript Chrome 书签的提示

    我想创建一个 chrome 书签 提示用户输入一个值 然后在 cookie 中设置该值 我无法显示提示 有没有办法做到这一点 当前代码 javascript function var days window prompt Number of
  • 在 Woocommerce 中显示特定产品类别的产品

    我的 WordPress 网站中有这段代码 它显示了我拥有的产品 ul li h3 a href a h3 li ul
  • ValidateRequest=“false” 和 .NET 4 问题

    NET 4 崩溃了ValidateRequest false 因为某些原因 解决方案是 只需将
  • 训练新的 AutoTokenizer 拥抱脸部

    收到此错误 AttributeError GPT2Tokenizer 对象没有 属性 train new from iterator 与拥抱面部文档非常相似 我更改了输入 就是这样 不应该影响它 有一次就成功了 2小时后回来查看 发现并没有
  • 命令按钮在第二次按下时调用操作 (jsf)

    我的应用程序出现了奇怪的行为 命令按钮在第二次点击时开始调用操作 首先 什么也没有发生 它对火狐和铬有效 但在顿悟中照常工作 我的环境 Ubuntu 11 04 玻璃鱼 3 1 1 jsf 2 X 素面 3 2 火狐 12 0 顿悟2 30
  • 在气隙环境中使用 docker 的最佳实践

    我是 Docker 新手 想在气隙环境中使用它 我知道我可以在隔离系统中设置自己的存储库 但我不知道如何从 docker hub 获取所需的许多 docker 镜像到环境中 如果我可以将它们下载到 zip 或 tgz 存档中 那就太好了 但
  • 为什么需要 gwt-bootstrap?

    我是 GWT 新手 正在考虑使用 Twitter Bootstrap 作为 CSS 框架 但后来我遇到了gwt 引导程序 http gwtbootstrap github io 它标榜自己是在 GWT 应用程序中使用 Bootstrap 的
  • 如何在 Spring 中注入 List 实例?

    什么有效 假设我有一个 ArrayList 的 spring bean 定义
  • R:从包中覆盖函数的正确方法是什么?

    我使用的是 R 包 其中有 2 个函数 f1 和 f2 其中 f2 调用 f1 我想覆盖函数f1 由于 R 2 15 和包中命名空间的强制使用 如果我只是获取新函数 它确实可以在全局环境中使用 即 只需在控制台中调用 f1 x 即可返回新结
  • 如何获取与某个单词相关的相似单词?

    我正在尝试解决一个 nlp 问题 其中我有一个单词字典 例如 list 1 phone android chair netflit charger macbook laptop sony 现在 如果输入是 phone 我可以轻松地使用 in