前沿探索|关于 AIGC 的「幻觉/梦游」问题

2023-11-18

AI语言模型的梦游是指模型产生内容与真实世界不符或者是毫无意义的情况。这种情况主要是由于语言模型缺乏真实世界的知识和语言的含义,导致模型难以理解和表达现实世界的概念和信息。这种情况在现代自然语言处理中普遍存在,尤其是在开放式生成领域的问题中。


深度学习的不确定性

深度学习的不确定性主要包括偶然不确定性和认知不确定性。

偶然不确定性

偶然不确定性无法消除,它来源于数据本身的噪声或者标签的噪声,针对噪声标签目前主流的做法主要包括下面四类:

  • 损失函数校正: the robustness of models against noisy label can be enhanced by adjusting the loss function
  • 转移矩阵估计: Modeling the corruption of noisy label using the transition matrix
  • 一致性正则化: Train multiple models in parallel for self-ensemble
  • 选择性采样: Reduce noisy ratio by selecting samples

认知不确定性

认知不确定性是我们模型中存在的不确定性。就拿我们文章一开始举的例子来说,假设我们训练一个分类人脸和猩猩脸的模型,训练中没有做任何的增强,也就是说没有做数据集的旋转,模糊等操作。如果我给模型一个正常的人脸,或者是正常猩猩的脸,我们的模型应该对他所产生的结果的置信度很高。但是如果我给他猫的照片,一个模糊处理过得人脸,或者旋转90°的猩猩脸,模型的置信度应该会特别低。换句话说,认知不确定性测量的,是我们的input data是否存在于已经见过的数据的分布之中。


多模态模型的幻觉问题

  1. Object Hallucination in Image Captioning (EMNLP, 2018) UC Berkeley & Boston University

    代码:https://github.com/LisaAnne/Hallucination

    PS:这几位作者还发表过一篇关于模型纠偏的工作,比较有意思:Women Also Snowboard: Overcoming Bias in Captioning Models (ECCV, 2018)

  2. On Hallucination and Predictive Uncertainty in Conditional Language Generation (EACL, 2021) University of California, Santa Barbara

  3. Let there be a clock on the beach:Reducing Object Hallucination in Image Captioning (WACV, 2022) Computer Vision Center, UAB, Spain

    代码:https://github.com/furkanbiten/object-bias/tree/main

  4. Plausible May Not Be Faithful: Probing Object Hallucination in Vision-Language Pre-training (EACL, 2023) The Hong Kong University of Science and Technology

    代码:https://github.com/wenliangdai/VLP-Object-Hallucination

  5. Deconfounded Image Captioning: A Causal Retrospect (TPAMI, 2021)


后记:一些相关研究方向:
- 价值观引导(大模型紧箍咒):抑制、控制生成文本,属于可控文本生成的范畴;
- 生成幻觉的检测与避免(不论是多模态文本生成(image captioning)还是单模态文本生成,都存在这一问题)
- 文本纠偏(用别人分类或检测的数据迁移到该任务,旨在消除生成的负面)

参考文献

  1. Survey of Hallucination in Natural Language Generation (ACM Computing Surveys, 2023) 港科
  2. Hallucination in Text Generation - 知乎 (zhihu.com)
  3. GPT-4的“hallucination”(幻觉)相关对策 - 知乎 (zhihu.com)
  4. Survey of Hallucination in Natural Language Generation-语言模型幻想问题半文翻译&解读 - 知乎 (zhihu.com)
  5. 偏差(bias)与混淆(confounding) - 知乎 (zhihu.com)
  6. 深度学习不确定性的分类 - 知乎 (zhihu.com)
  7. 深度学习中的两种不确定性(上) - 知乎 (zhihu.com)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

前沿探索|关于 AIGC 的「幻觉/梦游」问题 的相关文章

  • target_vocab_size 在方法 tfds.features.text.SubwordTextEncoder.build_from_corpus 中到底意味着什么?

    根据这个链接 https www tensorflow org datasets api docs python tfds features text SubwordTextEncoder build from corpus target
  • 生成易于记忆的随机标识符

    与所有开发人员一样 我们在日常工作中不断处理某种标识符 大多数时候 它与错误或支持票有关 我们的软件在检测到错误后 会创建一个包 该包的名称由时间戳和版本号格式化 这是创建合理唯一标识符以避免混淆包的一种廉价方法 例子 错误报告 20101
  • 否定句子的算法

    我想知道是否有人熟悉算法句子否定的任何尝试 例如 给定一个句子 这本书很好 请提供任意数量的意思相反的替代句子 例如 这本书不好 甚至 这本书不好 显然 以高精度实现这一点可能超出了当前 NLP 的范围 但我确信在这个主题上已经有了一些工作
  • 将 python NLTK 解析树保存到图像文件[重复]

    这个问题在这里已经有答案了 这可能会复制这个 stackoverflowquestion https stackoverflow com questions 23429117 saving nltk drawn parse tree to
  • 语音识别中如何处理同音词?

    对于那些不熟悉什么是同音字 https en wikipedia org wiki Homophone是的 我提供以下示例 我们的 是 嗨和高 到 太 二 在使用时语音API https developer apple com docume
  • gensim如何计算doc2vec段落向量

    我正在看这篇论文http cs stanford edu quocle paragraph vector pdf http cs stanford edu quocle paragraph vector pdf 它指出 段落向量和词向量被平
  • 保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

    我创建了自己的 BertClassifier 模型 从预训练开始 然后添加由不同层组成的我自己的分类头 微调后 我想使用 model save pretrained 保存模型 但是当我打印它并从预训练上传时 我看不到我的分类器头 代码如下
  • 如何提取句子中的主语及其各自的从属短语?

    我正在尝试在句子中进行主题提取 以便我能够根据主题获得情感 我在用nltk在 python2 7 中用于此目的 以下面的句子为例 Donald Trump is the worst president of USA but Hillary
  • 如何将标记化中的多单词名称保留在一起?

    我想使用 TF IDF 特征对文档进行分类 一种方法是 from sklearn feature extraction text import TfidfVectorizer import string import re import n
  • 举例解释bpe(字节对编码)?

    有人可以帮忙解释一下背后的基本概念吗BPE模型 除了这张纸 https arxiv org abs 1508 07909 目前还没有那么多解释 到目前为止我所知道的是 它通过将罕见和未知的单词编码为子词单元序列来实现开放词汇表上的 NMT
  • 除非 POS 显式,否则 WordNetLemmatizer 不会返回正确的引理 - Python NLTK

    我正在对 Ted 数据集成绩单进行词形还原 我注意到一些奇怪的事情 并非所有单词都被词形还原 要说的是 selected gt select 哪个是对的 然而 involved gt involve and horsing gt horse
  • Python模块可以访问英语词典,包括单词的定义[关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找一个 python 模块 它可以帮助我从英语词典中获取单词的定义 当然有enchant 这可以帮助我检查该单词是否存在于英语中
  • 给定文档,选择相关片段

    当我在这里提出问题时 自动搜索返回的问题的工具提示给出了问题的前一点 但其中相当一部分没有给出任何比理解问题更有用的文本 标题 有谁知道如何制作一个过滤器来删除问题中无用的部分 我的第一个想法是修剪仅包含某个列表中的单词的任何前导句子 例如
  • 如何使用FeatureUnion转换PipeLine中的多个特征?

    我有一个 pandas 数据框 其中包含有关用户发送的消息的信息 对于我的模型 我感兴趣的是预测消息的缺失收件人 即给定消息的收件人 A B C 我想预测还有谁应该成为收件人的一部分 我正在使用 OneVsRestClassifier 和
  • nltk 标记化和缩写

    我用 nltk 对文本进行标记 只是将句子输入到 wordpunct tokenizer 中 这会拆分缩写 例如 don t 到 don t 但我想将它们保留为一个单词 我正在改进我的方法 以实现更精确的文本标记化 因此我需要更深入地研究
  • Java 中的自然语言处理 (NLP) [重复]

    这个问题在这里已经有答案了 可能的重复 Java 有没有好的自然语言处理库 https stackoverflow com questions 870460 java is there a good natural language pro
  • 对产品列表进行分类的算法? [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我有一个代表或多或少相同的产品的列表 例如 在下面的列表中 它们都是希捷硬盘 希捷硬盘 500Go 适用于笔记本电脑的希捷硬盘 120
  • 使用 NLP 进行句子压缩 [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 使用机器翻译 我可以获得一个句子的非常压缩的版本 例如 我真的很想喝一杯美味可口的咖啡将被翻译为我想喝咖
  • 分词统计方法

    我想解决分词问题 从没有空格的长字符串中解析单词 例如我们想要从中提取单词somelongword to some long word 我们可以通过字典的动态方法来实现这一点 但我们遇到的另一个问题是解析歧义 IE orcore gt or
  • 使用 NLTK 生成字典以将推文分类为预定义类别

    我有一个 Twitter 用户 screen names 列表 我需要根据他们的兴趣领域将他们分为 7 个预定义类别 教育 艺术 体育 商业 政治 汽车 技术 我用 Python 提取了用户的最后 100 条推文 并在清理推文后为每个用户创

随机推荐

  • 程序员必知,招聘黑话大全!

    大家周末愉快 今天分享 IT 行业一些常见的招聘术语 准备参加面试的朋友一定要知道 Base base 有两层含义 对于薪资来说 base 即为你的基本薪资 假设你的薪资组成为 20k 16 签字费 股票 这个 20k 则为你的薪资 bas
  • C++中的引用

    一 引用 引用不是定义一个新的变量 而是给一个已有的变量起一个别名 类型 引用变量名 已定义过的变量名 注 1 一个变量可以有多个别名 2 引用必须初始化 3 引用只能在初始化时引用一次 不能在成为其他变量的别名 include
  • 深度神经网络在NLP的应用!

    关注后 星标 Datawhale 每日干货 每月组队学习 不错过 Datawhale干货 作者 张泽 华东师范大学 Datawhale优秀学习者 深度学习正在给自然语言处理带来巨大的变革 例如机器翻译 情感分析 问答系统等落地实践 深度学习
  • RT-Thread之线程的诞生与消亡史

    1 引言 本文基于Cotex M内核处理器分析讨论RT Thread中线程从创建到消亡的整个详细过程 线程的载体 控制块 RT Thread中是用线程控制块来描述线程实体的 在 RT Thread 中 线程控制块由结构体 struct rt
  • 数字化信道

    数字化信道 数字化信道主要包括多相滤波和DFT两个模块 多相滤波 多相滤波 就是将滤波器系数按照相数进行重排 在D倍抽取后 整个频带的频谱将混叠在0频附近 F s
  • 二分查找的总结

    一 二分查找 1 思路分析 这道题目的前提是数组为有序数组 同时题目还强调数组中无重复元素 因为一旦有重复元素 使用二分查找法返回的元素下标可能不是唯一的 这些都是使用二分法的前提条件 当大家看到题目描述满足如上条件的时候 可要想一想是不是
  • 2022第十三届蓝桥杯国赛真题javaB组

    文章目录 试题A 重合次数 试题B 数数 试题C 左移右移 试题D 窗口 试题E 迷宫 试题F 小球称重 试题G 背包与魔法 试题H 修路 试题I 围栏 试题J 好数之和 试题A 重合次数 本题总分 5 分 问题描述 在同一天中 从上午6
  • eclipse debug进入.class_Eclipse的安装与使用

    相信大家在用记事本编译运行java程序的同时肯定心里有不少怨言吧 要是用这种工具编译一个复杂点的程序简直就有想死的心了 更不用说什么大的网站项目了 接下来阿Q就带领大家了解一个全新的编译工具Eclipse Eclipse的安装 首先进入ec
  • JS字符串转数字

    目录 parseInt parseFloat Number JavaScript中有三种方法可以将字符串转换为数字 parseInt parseInt 函数可以将字符串转换成整数 它会忽略字符串的开头空格 并读取尽可能多的数字字符 直到遇到
  • 2.4.5 Profile CPU参数

    最后更新2021 07 19 CPU的状态 参数表现出来的是分区的状态和参数 Power 6 7小型机 分区有3种模式 Shared Dedicated Shared dedicated partition Dedicated分区同时选择了
  • 求职笔记-操作系统-动态链接库、静态链接库区别

    dll什么意思 动态链接库 存放的是各类程序的函数实现过程 当程序需要调用函数时 需要先载入DLL 然后取得函数的地址 最后进行调用 使用DLL文件的好处是程序不需要在运行之初加载所有代码 只有在程序需要某个函数的时候才从DLL中取出 还可
  • linux防火墙 ( cent7.*)常用操作:

    cent7 防火墙操作 注意开通或关闭端口后 一定要重启防火墙服务 重装防火墙 不然无法生效 1 查看 系统防火墙是否开启 firewall cmd state 2 开启 关闭 重启访火墙 永久关闭防火墙 必须先临时关闭防火墙 再执行该命令
  • Mac终端如何查找具体文件的详细路径

    find 命令 find iname test Boston CSV csv
  • 毕业设计-基于计算机图像识别的垃圾智能分类系统

    目录 前言 课题背景和意义 实现技术思路 一 YOLOv3 算法 二 基于 Tensorflow2 的 YOLOv3 算法垃圾识别 三 总结 实现效果图样例 最后 前言 大四是整个大学期间最忙碌的时光 一边要忙着备考或实习为毕业后面临的就业
  • win10远程桌面连接提示身份验证错误,要求的函数不受支持的解决方案

    报错信息 出现问题的原因是微软最近发布的更新补丁 要求服务器端和用户端都更新后才可以连接 最简单粗暴地方式就是卸载自己电脑的更新 而下面的这种方法需要修改注册列表 解决方案 1 WIN R 然后运行 regedit 命令 2 找到路径 HK
  • MySQL——无法打开MySQL8.0软件安装包或者安装过程中失败,如何解决?

    在运行MySQL8 0软件安装包之前 用户需要确保系统中已经安装了 Net Framework相关软件 如果缺少此软件 将不能正常地安装MySQL8 0软件 解决方案 到这个地址 https www microsoft com en us
  • 51 单片机占用 RAM 分析

    51 单片机占用 RAM 分析 简介 很久不用 51 单片机了 再拿起 51 的东西 发现之前学的时候遗漏很多细节 比如 RAM 的占用情况 都哪些会占用 RAM 空间 当时学习的时候从来没有注意过 包括用上 32 位的 MCU 之后也不怎
  • 学习SVG(八)文本

    简介 在SVG中除了绘图外 还可以添加文本 需要使用
  • 直播预告

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入 6月9日晚7 30 9 00 AI TIME特别邀请了三位优秀的讲者跟大家共同开启ICLR专场六 哔哩哔哩直播通道 扫码关注AITIME哔哩哔哩官方账号 观看直播 链接 http
  • 前沿探索|关于 AIGC 的「幻觉/梦游」问题

    AI语言模型的梦游是指模型产生内容与真实世界不符或者是毫无意义的情况 这种情况主要是由于语言模型缺乏真实世界的知识和语言的含义 导致模型难以理解和表达现实世界的概念和信息 这种情况在现代自然语言处理中普遍存在 尤其是在开放式生成领域的问题中