前沿探索｜关于 AIGC 的「幻觉/梦游」问题

2023-11-18

AI语言模型的梦游是指模型产生内容与真实世界不符或者是毫无意义的情况。这种情况主要是由于语言模型缺乏真实世界的知识和语言的含义，导致模型难以理解和表达现实世界的概念和信息。这种情况在现代自然语言处理中普遍存在，尤其是在开放式生成领域的问题中。

深度学习的不确定性

深度学习的不确定性主要包括偶然不确定性和认知不确定性。

偶然不确定性

偶然不确定性无法消除，它来源于数据本身的噪声或者标签的噪声，针对噪声标签目前主流的做法主要包括下面四类：

损失函数校正: the robustness of models against noisy label can be enhanced by adjusting the loss function
转移矩阵估计: Modeling the corruption of noisy label using the transition matrix
一致性正则化: Train multiple models in parallel for self-ensemble
选择性采样: Reduce noisy ratio by selecting samples

认知不确定性

认知不确定性是我们模型中存在的不确定性。就拿我们文章一开始举的例子来说，假设我们训练一个分类人脸和猩猩脸的模型，训练中没有做任何的增强，也就是说没有做数据集的旋转，模糊等操作。如果我给模型一个正常的人脸，或者是正常猩猩的脸，我们的模型应该对他所产生的结果的置信度很高。但是如果我给他猫的照片，一个模糊处理过得人脸，或者旋转90°的猩猩脸，模型的置信度应该会特别低。换句话说，认知不确定性测量的，是我们的input data是否存在于已经见过的数据的分布之中。

多模态模型的幻觉问题

Object Hallucination in Image Captioning (EMNLP, 2018) UC Berkeley & Boston University

代码：https://github.com/LisaAnne/Hallucination

PS：这几位作者还发表过一篇关于模型纠偏的工作，比较有意思：Women Also Snowboard: Overcoming Bias in Captioning Models (ECCV, 2018)
On Hallucination and Predictive Uncertainty in Conditional Language Generation （EACL, 2021) University of California, Santa Barbara
Let there be a clock on the beach:Reducing Object Hallucination in Image Captioning (WACV, 2022) Computer Vision Center, UAB, Spain

代码：https://github.com/furkanbiten/object-bias/tree/main
Plausible May Not Be Faithful: Probing Object Hallucination in Vision-Language Pre-training (EACL, 2023) The Hong Kong University of Science and Technology

代码：https://github.com/wenliangdai/VLP-Object-Hallucination
Deconfounded Image Captioning: A Causal Retrospect (TPAMI, 2021)

后记：一些相关研究方向：
- 价值观引导（大模型紧箍咒）：抑制、控制生成文本，属于可控文本生成的范畴；
- 生成幻觉的检测与避免（不论是多模态文本生成（image captioning）还是单模态文本生成，都存在这一问题）
- 文本纠偏（用别人分类或检测的数据迁移到该任务，旨在消除生成的负面）

参考文献

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

前沿探索｜关于 AIGC 的「幻觉/梦游」问题的相关文章

target_vocab_size 在方法 tfds.features.text.SubwordTextEncoder.build_from_corpus 中到底意味着什么？

根据这个链接 https www tensorflow org datasets api docs python tfds features text SubwordTextEncoder build from corpus target
生成易于记忆的随机标识符

与所有开发人员一样我们在日常工作中不断处理某种标识符大多数时候它与错误或支持票有关我们的软件在检测到错误后会创建一个包该包的名称由时间戳和版本号格式化这是创建合理唯一标识符以避免混淆包的一种廉价方法例子错误报告 20101
否定句子的算法

我想知道是否有人熟悉算法句子否定的任何尝试例如给定一个句子这本书很好请提供任意数量的意思相反的替代句子例如这本书不好甚至这本书不好显然以高精度实现这一点可能超出了当前 NLP 的范围但我确信在这个主题上已经有了一些工作
将 python NLTK 解析树保存到图像文件[重复]

这个问题在这里已经有答案了这可能会复制这个 stackoverflowquestion https stackoverflow com questions 23429117 saving nltk drawn parse tree to
语音识别中如何处理同音词？

对于那些不熟悉什么是同音字 https en wikipedia org wiki Homophone是的我提供以下示例我们的是嗨和高到太二在使用时语音API https developer apple com docume
gensim如何计算doc2vec段落向量

我正在看这篇论文http cs stanford edu quocle paragraph vector pdf http cs stanford edu quocle paragraph vector pdf 它指出段落向量和词向量被平
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
如何提取句子中的主语及其各自的从属短语？

我正在尝试在句子中进行主题提取以便我能够根据主题获得情感我在用nltk在 python2 7 中用于此目的以下面的句子为例 Donald Trump is the worst president of USA but Hillary
如何将标记化中的多单词名称保留在一起？

我想使用 TF IDF 特征对文档进行分类一种方法是 from sklearn feature extraction text import TfidfVectorizer import string import re import n
举例解释bpe（字节对编码）？

有人可以帮忙解释一下背后的基本概念吗BPE模型除了这张纸 https arxiv org abs 1508 07909 目前还没有那么多解释到目前为止我所知道的是它通过将罕见和未知的单词编码为子词单元序列来实现开放词汇表上的 NMT
除非 POS 显式，否则 WordNetLemmatizer 不会返回正确的引理 - Python NLTK

我正在对 Ted 数据集成绩单进行词形还原我注意到一些奇怪的事情并非所有单词都被词形还原要说的是 selected gt select 哪个是对的然而 involved gt involve and horsing gt horse
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
给定文档，选择相关片段

当我在这里提出问题时自动搜索返回的问题的工具提示给出了问题的前一点但其中相当一部分没有给出任何比理解问题更有用的文本标题有谁知道如何制作一个过滤器来删除问题中无用的部分我的第一个想法是修剪仅包含某个列表中的单词的任何前导句子例如
如何使用FeatureUnion转换PipeLine中的多个特征？

我有一个 pandas 数据框其中包含有关用户发送的消息的信息对于我的模型我感兴趣的是预测消息的缺失收件人即给定消息的收件人 A B C 我想预测还有谁应该成为收件人的一部分我正在使用 OneVsRestClassifier 和
nltk 标记化和缩写

我用 nltk 对文本进行标记只是将句子输入到 wordpunct tokenizer 中这会拆分缩写例如 don t 到 don t 但我想将它们保留为一个单词我正在改进我的方法以实现更精确的文本标记化因此我需要更深入地研究
Java 中的自然语言处理 (NLP) [重复]

这个问题在这里已经有答案了可能的重复 Java 有没有好的自然语言处理库 https stackoverflow com questions 870460 java is there a good natural language pro
对产品列表进行分类的算法？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个代表或多或少相同的产品的列表例如在下面的列表中它们都是希捷硬盘希捷硬盘 500Go 适用于笔记本电脑的希捷硬盘 120
使用 NLP 进行句子压缩 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案使用机器翻译我可以获得一个句子的非常压缩的版本例如我真的很想喝一杯美味可口的咖啡将被翻译为我想喝咖
分词统计方法

我想解决分词问题从没有空格的长字符串中解析单词例如我们想要从中提取单词somelongword to some long word 我们可以通过字典的动态方法来实现这一点但我们遇到的另一个问题是解析歧义 IE orcore gt or
使用 NLTK 生成字典以将推文分类为预定义类别

我有一个 Twitter 用户 screen names 列表我需要根据他们的兴趣领域将他们分为 7 个预定义类别教育艺术体育商业政治汽车技术我用 Python 提取了用户的最后 100 条推文并在清理推文后为每个用户创

随机推荐

程序员必知，招聘黑话大全！

大家周末愉快今天分享 IT 行业一些常见的招聘术语准备参加面试的朋友一定要知道 Base base 有两层含义对于薪资来说 base 即为你的基本薪资假设你的薪资组成为 20k 16 签字费股票这个 20k 则为你的薪资 bas
C++中的引用

一引用引用不是定义一个新的变量而是给一个已有的变量起一个别名类型引用变量名已定义过的变量名注 1 一个变量可以有多个别名 2 引用必须初始化 3 引用只能在初始化时引用一次不能在成为其他变量的别名 include
深度神经网络在NLP的应用！

关注后星标 Datawhale 每日干货每月组队学习不错过 Datawhale干货作者张泽华东师范大学 Datawhale优秀学习者深度学习正在给自然语言处理带来巨大的变革例如机器翻译情感分析问答系统等落地实践深度学习
RT-Thread之线程的诞生与消亡史

1 引言本文基于Cotex M内核处理器分析讨论RT Thread中线程从创建到消亡的整个详细过程线程的载体控制块 RT Thread中是用线程控制块来描述线程实体的在 RT Thread 中线程控制块由结构体 struct rt
数字化信道

数字化信道数字化信道主要包括多相滤波和DFT两个模块多相滤波多相滤波就是将滤波器系数按照相数进行重排在D倍抽取后整个频带的频谱将混叠在0频附近 F s
二分查找的总结

一二分查找 1 思路分析这道题目的前提是数组为有序数组同时题目还强调数组中无重复元素因为一旦有重复元素使用二分查找法返回的元素下标可能不是唯一的这些都是使用二分法的前提条件当大家看到题目描述满足如上条件的时候可要想一想是不是
2022第十三届蓝桥杯国赛真题javaB组

文章目录试题A 重合次数试题B 数数试题C 左移右移试题D 窗口试题E 迷宫试题F 小球称重试题G 背包与魔法试题H 修路试题I 围栏试题J 好数之和试题A 重合次数本题总分 5 分问题描述在同一天中从上午6
eclipse debug进入.class_Eclipse的安装与使用

相信大家在用记事本编译运行java程序的同时肯定心里有不少怨言吧要是用这种工具编译一个复杂点的程序简直就有想死的心了更不用说什么大的网站项目了接下来阿Q就带领大家了解一个全新的编译工具Eclipse Eclipse的安装首先进入ec
JS字符串转数字

目录 parseInt parseFloat Number JavaScript中有三种方法可以将字符串转换为数字 parseInt parseInt 函数可以将字符串转换成整数它会忽略字符串的开头空格并读取尽可能多的数字字符直到遇到
2.4.5 Profile CPU参数

最后更新2021 07 19 CPU的状态参数表现出来的是分区的状态和参数 Power 6 7小型机分区有3种模式 Shared Dedicated Shared dedicated partition Dedicated分区同时选择了
求职笔记-操作系统-动态链接库、静态链接库区别

dll什么意思动态链接库存放的是各类程序的函数实现过程当程序需要调用函数时需要先载入DLL 然后取得函数的地址最后进行调用使用DLL文件的好处是程序不需要在运行之初加载所有代码只有在程序需要某个函数的时候才从DLL中取出还可
linux防火墙 ( cent7.*)常用操作：

cent7 防火墙操作注意开通或关闭端口后一定要重启防火墙服务重装防火墙不然无法生效 1 查看系统防火墙是否开启 firewall cmd state 2 开启关闭重启访火墙永久关闭防火墙必须先临时关闭防火墙再执行该命令
Mac终端如何查找具体文件的详细路径

find 命令 find iname test Boston CSV csv
毕业设计-基于计算机图像识别的垃圾智能分类系统

目录前言课题背景和意义实现技术思路一 YOLOv3 算法二基于 Tensorflow2 的 YOLOv3 算法垃圾识别三总结实现效果图样例最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业
win10远程桌面连接提示身份验证错误，要求的函数不受支持的解决方案

报错信息出现问题的原因是微软最近发布的更新补丁要求服务器端和用户端都更新后才可以连接最简单粗暴地方式就是卸载自己电脑的更新而下面的这种方法需要修改注册列表解决方案 1 WIN R 然后运行 regedit 命令 2 找到路径 HK
MySQL——无法打开MySQL8.0软件安装包或者安装过程中失败，如何解决？

在运行MySQL8 0软件安装包之前用户需要确保系统中已经安装了 Net Framework相关软件如果缺少此软件将不能正常地安装MySQL8 0软件解决方案到这个地址 https www microsoft com en us
51 单片机占用 RAM 分析

51 单片机占用 RAM 分析简介很久不用 51 单片机了再拿起 51 的东西发现之前学的时候遗漏很多细节比如 RAM 的占用情况都哪些会占用 RAM 空间当时学习的时候从来没有注意过包括用上 32 位的 MCU 之后也不怎
学习SVG（八）文本

简介在SVG中除了绘图外还可以添加文本需要使用
直播预告

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入 6月9日晚7 30 9 00 AI TIME特别邀请了三位优秀的讲者跟大家共同开启ICLR专场六哔哩哔哩直播通道扫码关注AITIME哔哩哔哩官方账号观看直播链接 http
前沿探索｜关于 AIGC 的「幻觉/梦游」问题

AI语言模型的梦游是指模型产生内容与真实世界不符或者是毫无意义的情况这种情况主要是由于语言模型缺乏真实世界的知识和语言的含义导致模型难以理解和表达现实世界的概念和信息这种情况在现代自然语言处理中普遍存在尤其是在开放式生成领域的问题中