NLP 中的否定处理

2024-03-23

我目前正在开发一个项目，我想从文本中提取情感。由于我使用的是conceptnet5（一种语义网络），因此我不能简单地在包含否定词的句子中添加单词前缀，因为这些单词根本不会出现在conceptnet5 的API 中。

这是一个例子：

这部电影不太好。

因此，我认为我可以使用 wordnet 的引理功能来替换包含否定词（例如（not，...））的句子中的形容词。

在前面的示例中，算法将检测wasn't并将其替换为was not。此外，它会检测否定词not，并替换good与它的反义词bad。该句子如下：

这部电影太糟糕了。

虽然我发现这不是最优雅的方式，而且在很多情况下它可能会产生错误的结果，但我仍然想以这种方式处理否定，因为坦率地说，我不知道有什么更好的方法。

考虑到我的问题：不幸的是，我没有找到任何库可以让我替换所有出现的附加否定词（wasn't => was not）。我的意思是我可以通过用正则表达式替换出现的事件来手动完成此操作，但那样我就会陷入英语语言的困境。

因此我想问你们中的一些人是否知道一个库、函数或更好的方法这可以帮助我。目前我正在使用 pythonnltk，仍然似乎它不包含这样的功能，但我可能是错的。

提前致谢：）

类似的情况wasn't可以通过标记化简单地解析（tokens = nltk.word_tokenize(sentence)): wasn't会变成was and n't.

但否定意义也可以由“准否定词，如几乎、勉强、很少”和“隐含否定词，如失败、阻止、不情愿、否认、缺席”形成，看看这张纸 http://www.academypublication.com/issues/past/tpls/vol03/07/17.pdf。更详细的分析可以在 Christopher Potts 的文章中找到。论否定的否定性 https://web.stanford.edu/~cgpotts/papers/potts-salt20-negation.pdf.

考虑到您最初的问题，据我所知，情感分析、大多数现代方法都不会明确处理否定；相反，他们使用高阶 n 元语法的监督方法。那些实际处理否定的人通常会在否定和标点符号之间的所有单词后面附加特殊的前缀 NOT_。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

NLP 中的否定处理的相关文章

Flask-login：无法理解它是如何工作的

我试图理解如何Flask Login https flask login readthedocs org en latest works 我在他们的文档中看到他们使用预先填充的用户列表我想使用数据库存储的用户列表但是我不明白其中的一些
Python str.format() 方法的默认 kwarg 值

我希望尝试使现有字符串的复数化尽可能简单并且想知道是否有可能得到str format 在查找 kwargs 时解释默认值这是一个例子 string number of sheep sheep has run away dict comp
使用 pythonbrew 编译 Python 3.2 和 2.7 时出现问题

我正在尝试使用构建多个版本的 python蟒蛇酿造 http pypi python org pypi pythonbrew 0 7 3 但我遇到了一些测试失败这是在运行的虚拟机上 Ubuntu 8 04 32 位当我使用时会发生这种情
使用 psycopg2 在 python 中执行查询时出现“编程错误：语法错误位于或附近”

我正在运行 Python v 2 7 和 psycopg2 v 2 5 我有一个 postgresql 数据库函数它将 SQL 查询作为文本字段返回我使用以下代码来调用该函数并从文本字段中提取查询 cur2 execute SELECT
将大写 URL 重定向为小写（*** 除外） - htaccess

我正在尝试将大写 URL 重定向为小写但有点噩梦主要是我的 htaccess知识缺乏目前我有
Django 代理模型的继承和多态性

我正在开发一个我没有启动的 Django 项目我面临着一个问题遗产我有一个大模型在示例中简化称为MyModel这应该代表不同种类的物品的所有实例对象MyModel应该具有相同的字段但方法的行为根据项目类型的不同而有很大差异到目
Perl 非贪婪

我遇到非贪婪正则表达式 regex 的问题我已经看到有关于非贪婪正则表达式的问题但它们没有回答我的问题 Problem 我正在尝试匹配 lol 锚点的 href Note 我知道这可以通过 Perl HTML 解析模块来完成我的问题是
在 python 程序中合并第三方库的最佳实践是什么？

下午好我正在为我的工作编写一个中小型Python程序该任务需要我使用 Excel 库xlwt and xlrd 以及一个用于查询 Oracle 数据库的库称为CX Oracle 我正在通过版本控制系统即CVS 开发该项目我想知道围
Python 的键盘中断不会中止 Rust 函数 (PyO3)

我有一个使用 PyO3 用 Rust 编写的 Python 库它涉及一些昂贵的计算单个函数调用最多需要 10 分钟从 Python 调用时如何中止执行 Ctrl C 好像只有执行结束后才会处理所以本质上没什么用最小可重现示例 Ca
OpenCV Python cv2.mixChannels()

我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
根据列值突出显示数据框中的行？

假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
OpenCV 无法从 MacBook Pro iSight 捕获

几天后我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗示例代码
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
Fabric env.roledefs 未按预期运行

On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts

随机推荐

如何修复 flutter 上的“simple_permissions”错误？

当我在 flutter 项目上运行包含 simple permissions 的代码时出现错误 Initializing gradle Resolving dependencies Running Gradle task assembleD
散景中的多线悬停

正如在这个问题中多线散景和 HoverTool https stackoverflow com questions 32975709 bokeh multi line and hovertool 我发现悬停工具没有针对多线图实现这是一个
从 UIWebView 创建 PDF 文件

void createPDFfromUIView UIView aView saveToDocumentsWithFileName NSString aFilename Creates a mutable data object for u
有没有办法在 Objective-C 中使用 Swift 结构而不将它们作为类？

我有几个简单的structs在 swift 文件中用 swift 编写这些structs非常简单几乎只包含字符串 struct Letter struct A static let aSome String descASome stat
汇总数据框忽略重复

我有一个数据框其中一列中有重复的条目我想根据该专栏总结其他专栏我希望摘要在进行摘要时考虑每个唯一条目而不是总数例如在下面的数据框示例中如果我想回答以下问题受访者中有多少人是年轻人中年人和老年人 RefID 1 1 在总结 ag
如何解决错误：预期标识符或“(”

我正在编程的东西有问题我一遍又一遍地收到这个错误 jharvard appliance Dropbox pset1 make mario clang ggdb3 O0 std c99 Wall Werror mario c lcs50 l
(obj == null) vs (null == obj)？

我的老板说我应该使用null obj 因为它比obj null 但他不记得为什么要这样做有什么理由使用null obj 我以某种方式感觉到了相反经过谷歌搜索后我唯一发现的是在 C 中它可以防止您意外地在条件结构中键入 obj n
iPhone文档文件夹库/缓存安全问题

我开发了一款iOS应用程序出于安全原因我将所有音频视频文件下载到下的 Documents 文件夹中库缓存对于使用 iTunes 最终用户无法备份此视频但有些外部软件很容易打开库缓存并从此文件夹下载所有文件我的问题是如何保护此
如何在IntelliJ 2021.2.2中使用Lombok插件？

我是从 C 开始接触 Java 的我一直在努力熟悉这门语言我正在尝试使用 IntelliJ IDEA 的 lombok 插件但它似乎根本不适合我这是我的IDEA无法识别 value 注释的屏幕截图 https i stack img
您能否将多个不同的值类型分配给重复的 Protobuf 消息中的一个字段？

我正在尝试对客户端进行逆向工程该客户端将音频文件上传到服务器然后在单独的请求中上传文件的元数据元数据在 Protobuf 中序列化并且使用相当简单且可读的结构这是之后的样子protoc decode raw 1 1 title 2
对 Django 模板中的相关项目进行排序

是否可以对 DJango 模板中的一组相关项目进行排序即这段代码为了清楚起见省略了 HTML 标签 for event in eventsCollection event location for attendee in event
laravel 一个帐户下有多个电子邮件地址

我的 Laravel 应用程序要求用户可以拥有多个可用于登录的电子邮件地址我的问题是如何允许用户在一个帐户下拥有多个电子邮件地址我必须记住每封电子邮件只能由一个用户使用我的想法是为电子邮件创建一个单独的表其中包含用户 ID 我仍
delphi 7 中的 utf8 解码

我需要使用 delphi 7 将字符串从 utf8 转换为宽字符串谁能告诉我为什么下面的代码在delphi 7中不起作用 Utf8Decode 函数的参数只是一个示例 var ws WideString begin ws Utf8Deco
C# 如何杀死阻塞的线程？

我有一个线程 void threadCode object o doStuffHere o Blocking call Sometimes hangs 我这样称呼它 Thread t new Thread new ThreadStart d
如何在 Keras 中定义自定义精度以忽略具有特定金色标签的样本？

我想在 Keras 中编写一个自定义指标我正在使用张量流后端相当于categorical accuracy 但是具有特定金色标签的样本的输出在我的例子中是 0 来自 y true 必须被忽略例如如果我的输出是预测 1 金 0 预
如何验证 angular2 中的 FormArray 长度

我有一个 angular2 数据驱动形式如下所示 this formBuilder group name Validators required description Validators required places this fo
android: 需要为元素显式指定导出

我在 AndroidManifest xml 中遇到 Flutter 构建错误 android exported 需要为元素显式指定面向 Android 12 及更高版本的应用需要指定显式值android exported当相应的组件
直接调用分配给对象属性的闭包

我希望能够直接调用分配给对象属性的闭包而无需将闭包重新分配给变量然后调用它这可能吗下面的代码不起作用并导致Fatal error Call to undefined method stdClass callback obj new s
Ruby 中的“sys.stdout.write()”等价物是什么？

正如 Python 中所见什么是sys stdout write Ruby 中的等价物在 Ruby 中您可以使用以下方式访问标准输出 stdout or STDOUT 所以你可以使用write http ruby doc org co
NLP 中的否定处理

我目前正在开发一个项目我想从文本中提取情感由于我使用的是conceptnet5 一种语义网络因此我不能简单地在包含否定词的句子中添加单词前缀因为这些单词根本不会出现在conceptnet5 的API 中这是一个例子这部电影不太好

NLP 中的否定处理

NLP 中的否定处理 的相关文章

随机推荐

热门标签

NLP 中的否定处理的相关文章