否定句子的算法

2024-05-01

我想知道是否有人熟悉算法句子否定的任何尝试。

例如,给定一个句子“这本书很好”,请提供任意数量的意思相反的替代句子,例如“这本书不好”甚至“这本书不好”。

显然,以高精度实现这一点可能超出了当前 NLP 的范围,但我确信在这个主题上已经有了一些工作。如果有人知道任何工作,愿意给我指出一些论文吗?


虽然我不知道有任何专门研究自动生成否定句的工作,但我想一个好的起点是阅读以下语言学工作:形式语义 http://en.wikipedia.org/wiki/Semantics and 语用学 http://en.wikipedia.org/wiki/Pragmatics。一个很好的易于理解的介绍是史蒂文·C·莱文森的语用学 https://rads.stackoverflow.com/amzn/click/com/0521294142 book.

我认为您会遇到的一个问题是,否定句子所传达的所有信息可能非常困难。例如,取:

John fixed the vase that he broke.

即使你将其更改为约翰没有修理他打碎的花瓶,有一个前提 http://en.wikipedia.org/wiki/Presupposition有一个花瓶,约翰打破了它。

同样,简单地否定句子约翰并没有停止吸毒 as 约翰停止吸毒仍然表明约翰曾一度吸毒。更彻底的否定是约翰从未吸毒.

您可能想看看 MacCartney 和 Manning 2007 年的一些现有自然语言处理 (NLP) 工作文本推理的自然逻辑 http://nlp.stanford.edu/~wcmac/papers/natlog-wtep07.pdf。在本文中,他们使用 George Lakoff 的自然逻辑概念和 Sanchez Valencia 的单调性演算来创建自动确定一个句子是否包含另一个句子的软件。您可能可以使用他们的一些技术来检测非蕴涵,从而人为地构建否定和矛盾的句子。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

否定句子的算法 的相关文章

  • BERT 输出不确定

    BERT 输出是不确定的 当我输入相同的输入时 我希望输出值是确定性的 但我的 bert 模型的值正在变化 听起来很尴尬 同一个值返回两次 一次 也就是说 一旦出现另一个值 就会出现相同的值并重复 如何使输出具有确定性 让我展示我的代码片段
  • 是否可以使用 Google BERT 来计算两个文本文档之间的相似度?

    是否可以使用 Google BERT 来计算两个文本文档之间的相似度 据我了解 BERT 的输入应该是有限大小的句子 一些作品使用 BERT 来计算句子的相似度 例如 https github com AndriyMulyar semant
  • AttributeError:类型对象“Word2Vec”没有属性“load_word2vec_format”

    我正在尝试实现 word2vec 模型并收到属性错误 AttributeError 类型对象 Word2Vec 没有属性 load word2vec format 下面是代码 wv Word2Vec load word2vec format
  • 保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

    我创建了自己的 BertClassifier 模型 从预训练开始 然后添加由不同层组成的我自己的分类头 微调后 我想使用 model save pretrained 保存模型 但是当我打印它并从预训练上传时 我看不到我的分类器头 代码如下
  • 缩短文本并仅保留重要句子

    德国网站 nandoo net 提供了缩短新闻文章的可能性 如果使用滑块更改百分比值 文本会发生变化并且某些句子会被遗漏 您可以在这里看到它的实际效果 http www nandoo net read article 299925 http
  • 如何让“grep -zoP”单独显示每个匹配项?

    我有一个此表格的文件 X this is the first match blabla X this is the second match and here we have some fluff 我想提取 X 之后和相同标记之间出现的所有
  • 用于词性标记的优秀 Java 库是什么? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 使用 SciKit-learn 和大型数据集进行文本分类

    首先 我昨天开始学习Python 我正在尝试使用 SciKit 和大型数据集 250 000 条推文 进行文本分类 对于该算法 每条推文都将表示为 4000 x 1 向量 因此这意味着输入为 250 000 行和 4000 列 当我尝试在
  • Java文本输出中的UTF-8编码问题

    我一直致力于测试高棉语 Unicode Wordbreaker 的各种解决方案 高棉语单词之间没有空格 这使得拼写检查和语法检查变得困难 以及从旧高棉语转换为高棉语 Unicode 我得到了一些源代码 现在在线 http www white
  • 使用 OpenNLP 获取句子的解析树。陷入困境。

    OpenNLP 是一个关于自然语言处理的 Apache 项目 NLP 程序的目标之一是解析一个句子 并给出其语法结构的树 例如 天空是蓝色的 这句话 可能会被解析为 S NP VP The sky is blue where S是句子 NP
  • nltk 标记化和缩写

    我用 nltk 对文本进行标记 只是将句子输入到 wordpunct tokenizer 中 这会拆分缩写 例如 don t 到 don t 但我想将它们保留为一个单词 我正在改进我的方法 以实现更精确的文本标记化 因此我需要更深入地研究
  • 对产品列表进行分类的算法? [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我有一个代表或多或少相同的产品的列表 例如 在下面的列表中 它们都是希捷硬盘 希捷硬盘 500Go 适用于笔记本电脑的希捷硬盘 120
  • Rasa core 和 Rasa nlu 之间的区别

    我试图理解之间的区别拉莎核心 https core rasa ai and Rasa NLU https nlu rasa ai installation html从官方文档看的 但我不太明白 我的理解是Rasa core用于引导对话流程
  • NLTK 可用的停用词语言

    我想知道在哪里可以找到 NLTK 停用词支持的语言 及其键 的完整列表 我找到一个列表https pypi org project stop words https pypi org project stop words 但它不包含每个国家
  • Python NLP 英式英语与美式英语

    我目前正在用Python 进行NLP 工作 然而 在我的语料库中 既有英式英语也有美式英语 实现 实现 我正在考虑将英式英语转换为美式英语 但是 我没有找到一个好的工具 包来做到这一点 有什么建议么 我也找不到包 但试试这个 请注意 我必须
  • 在 Python 中识别大型字符串列表中的项目之间的文本相似性的最有效方法是什么?

    下面的代码实现了我想要实现的结果 有一个称为 引理 的字符串列表 其中包含特定类别单词的可接受形式 另一个列表称为 形式 包含在不同时期和特定语言的不同方言的大量文本中发现的单词的许多拼写变体 对于 forms 中的每个单词 我想获取 le
  • 使用 NLP 进行句子压缩 [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 使用机器翻译 我可以获得一个句子的非常压缩的版本 例如 我真的很想喝一杯美味可口的咖啡将被翻译为我想喝咖
  • 使用自定义层运行 Keras 模型时出现问题

    我目前正在攻读学士学位论文FIIT STU https www fiit stuba sk en html page id 749 其主要目标是尝试复制和验证以下结果study http arxiv org abs 2006 00885 这
  • 使用印度名字训练 Spacy NER

    我正在尝试自定义 Spacy 的 NER 来识别印度名字 遵循本指南https spacy io usage training https spacy io usage training这是我正在使用的数据集https gist githu
  • 如何在 bertopic 建模中获取每个主题的所有文档

    我有一个数据集并尝试使用 berTopic 建模将其转换为主题 但问题是 我无法获取主题的所有文档 berTopic 每个主题仅返回 3 个文档 topic model BERTopic verbose True embedding mod

随机推荐

  • 将 Firebase 实时数据库 json 响应从 _InternalLinkedHashMap 转换为 Map

    I have a database in my Firebase Realtime database with children that look like this 以下是我在 Flutter 应用程序中通过 firebase 调用收到
  • sql server中基于分区的Min()和Max()

    我想使用最小和最大函数 但要符合某些标准 Create Table Test Id Int Identity 1 1 Category Varchar 100 DateTimeStamp DateTime Insert into Test
  • 将图像添加到可通过私人存储库中的 github 查看的 jupyter 笔记本

    我发现通过一个简单的例子嵌入 jupyter 标记中的图像 img myimage png 当存储库是私有的时 不会显示在 github 笔记本查看器中 我尝试了很多黑客行为 显然 4 x x 中有将图像嵌入为 Base64 元数据的功能
  • Android:如何创建MotionEvent?

    MotionEvent没有获取构造函数 我想在单元测试中手动创建MotionEvent 那么如何获取它 谢谢 您应该使用静态之一obtain的方法MotionEvent类来创建一个新事件 最简单的方法 除了从现有事件包装新事件之外 是 st
  • Python 3 Tkinter:如何在 Tkinter Text 中自动换行文本

    如何在 Tkinter 中对文本进行自动换行Text小部件 wraplength只接受屏幕单位 而不是WORD option Use the wrap WORD选项 这是一个例子 from tkinter import root Tk t
  • ifstream 不读取 EOF 字符

    我正在创建一个程序 在 C 中 该程序采用 ASCII 文件并从每一行读取一些值 直到到达文件末尾 我在用ifstream读取文件 当我使用ifstream eof 方法 然而 这一次 即使它在我的测试用例中找到了 eof 字符 当我分析其
  • Javascript继承无限循环

    我在 javascript 中创建了这段代码 function Shape Shape prototype name Shape Shape prototype toString function result if this constr
  • maven-compiler-plugin 无法编译 Eclipse 没有问题的文件[重复]

    这个问题在这里已经有答案了 Eclipse 编译以下代码没有任何问题 而当mvn尝试编译此代码 结果编译失败 try Distribution rep get id returns a java util Optional Distribu
  • Python 请求与 PyCurl 性能

    Requests 库与 PyCurl 的性能相比如何 我的理解是 Requests 是 urllib 的 python 包装器 而 PyCurl 是本机 libcurl 的 python 包装器 因此 PyCurl 应该获得更好的性能 但不
  • Java - 哪个是 Graph 的最佳实现结构?

    图很大但是无向 边缘未加权 在我的实现中 我必须找到具有最大度数的顶点并在顶点和边上进行删除 链接列表 数组列表 地图 哪一种更适合我的实施 表示图的两个基本数据结构是 adjacency list the adjacency matrix
  • Angular 2子组件引用父组件

    我有一个包含三个组件的应用程序 应用程序 编辑视图 对话框 应用程序组件包含 EditView 组件 该组件可以包含许多其他 EditView 组件和一个 Dialog 组件 如果 Dialog 组件在页面上可见 对话框组件包含应用程序组件
  • 什么构成“有效”C 标识符?

    根据 Zaibis 的建议 并且与我自己的相关 answer to 宏名称的有效字符是什么 https stackoverflow com a 34315237 547214 也g 不允许的标识符中的 和其他 Unicode 字符 http
  • Timer 和 TimerTask - 如何从 TimerTask 运行中重新安排 Timer

    基本上我想做的是制作一个在 x 秒后运行特定 TimerTask 的计时器 但随后 TimerTask 可以重新安排计时器在 y 秒后执行任务 示例如下 它在我尝试在 TimerTask 运行中安排此任务的行上给出错误 线程 Timer 0
  • SwiftUI如何用TabView隐藏导航栏

    我正在使用 SwiftUITabView inside NavigationView 但我就是无法在iOS 13 0模拟器中隐藏导航栏 这是代码 import SwiftUI struct TestView View var body so
  • 模拟、存根和假对象之间有什么区别[关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 尽管有大量资源 但即使在 SO 上 这些 Q A 中也仅对其中两个术语进行了比较 那么 简而言之 它们各自是什么 它们之间有何关系 或者他们根本就没有
  • 如何通过id获取消息discord.py

    我想知道如何通过消息 ID 获取消息 我努力了discord fetch message id and discord get message id 但两者都会提出 Command raised an exception Attribute
  • 如何从字符串中删除或替换所有标点符号?

    我有一个由单词组成的字符串 其中一些包含标点符号 我想删除它们 但我一直不知道如何做到这一点 例如 如果我有类似的东西 var words Hello this is a string 我希望能够创建一个数组 Hello this is a
  • Rails - 从对象哈希创建选择标签

    我需要根据哈希中的可用值创建一个选择框 例如 我有一个 事物 该 事物 有多种状态字段 1 gt State A 2 gt State B 通过事物上的方法可用 我如何从中构建一个选择标签 正如施罗克韦尔所说 Hash each a 返回以
  • 如何删除WKWebView中的缓存?

    任何一个合作过的人WKWebView并尝试清除缓存 如果是 该怎么做 有什么例子吗 P S Normal NSURLCache不管用 更新的 Swift 5 版本 WKWebsiteDataStore default removeData
  • 否定句子的算法

    我想知道是否有人熟悉算法句子否定的任何尝试 例如 给定一个句子 这本书很好 请提供任意数量的意思相反的替代句子 例如 这本书不好 甚至 这本书不好 显然 以高精度实现这一点可能超出了当前 NLP 的范围 但我确信在这个主题上已经有了一些工作