万能近似定理(universal approximation theorrm)

2023-10-31

神经网络的架构architecture)指网络的整体结构。大多数神经网络被组织成称为的单元组,然后将这些层布置成链式结构,其中每一层都是前一层的函数。在这种结构中,第一层由下式给出:


第二层:


第三层,以此类推!

可以看出,每一层的主体都是线性模型。线性模型,通过矩阵乘法将特征映射到输出,顾名思义,仅能表示线性函数。它具有易于训练的优点,因为当使用线性模型时,许多损失函数会导出凸优化问题。不幸的是,我们经常希望我们的系统学习非线性函数。

乍一看,我们可能认为学习非线性函数需要为我们想要学习的那种非线性专门设计一类模型族。幸运的是,具有隐藏层的前馈网络提供了一种万能近似框架。

具体来说, 万能近似定理(universal approximation theorem)(Hornik et al., 1989;Cybenko, 1989) 表明,一个前馈神经网络如果具有线性输出层和至少一层具有任何一种‘‘挤压’’ 性质的激活函数(例如logistic sigmoid激活函数)的隐藏层,只要给予网络足够数量的隐藏单元,它可以以任意的精度来近似任何从一个有限维空间到另一个有限维空间的Borel 可测函数。

万能近似定理意味着无论我们试图学习什么函数,我们知道一个大的MLP 一定能够表示这个函数。然而,我们不能保证训练算法能够学得这个函数。即使MLP能够表示该函数,学习也可能因两个不同的原因而失败。

  1. 用于训练的优化算法可能找不到用于期望函数的参数值。
  2. 训练算法可能由于过拟合而选择了错误的函数。

根据‘‘没有免费的午餐’’ 定理,说明了没有普遍优越的机器学习算法。前馈网络提供了表示函数的万能系统,在这种意义上,给定一个函数,存在一个前馈网络能够近似该函数。但不存在万能的过程既能够验证训练集上的特殊样本,又能够选择一个函数来扩展到训练集上没有的点。

总之,具有单层的前馈网络足以表示任何函数,但是网络层可能大得不可实现,并且可能无法正确地学习和泛化。在很多情况下,使用更深的模型能够减少表示期望函数所需的单元的数量,并且可以减少泛化误差。




本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

万能近似定理(universal approximation theorrm) 的相关文章

  • pyppeteer和selenium远程操控浏览器

    1 配置环境 Chrome浏览器是支持远程调试模式的 这个模式打开的情况下 Puppeteer或者Selenium可以通过websocket连上去 进而控制它 首先我们来启动Chrome的远程调试端口 你需要找到Chrome的安装位置 在C
  • linux ld 链接.o文件,Linux:控制`ld`搜索.o目标文件的位置?

    好吧 情况就是这样 我正在尝试使用一些较旧的软件 在Ubuntu Lucid上工作正常 在Natty上失败 所以 我徘徊了一下 事实证明这个软件调用ld 并且ld最终失败了 ld crt1 o No such file No such fi
  • 机器学习算法简介和代码(P&R语言)

    机器学习算法 P R语言 一般说来 机器学习有三种算法 1 监督式学习 监督式学习算法包括一个目标变量 因变量 和用来预测目标变量的预测变量 自变量 通过这些变量我们可以搭建一个模型 从而对于一个已知的预测变量值 我们可以得到对应的目标变量
  • Matlab学习:读取excel中数据

    Matlab中大部分功能都可以通过函数调用实现 在本文中所涉及的读取excel中数据这一功能可以通过下面的函数 1 实现 num xlsread fileURL n 1 其中 num 表示输出的数据 可以是矩阵也可以是数组 xlsread
  • 用Hadoop流实现mapreduce版推荐系统基于物品的协同过滤算法

    以个性化新闻推荐为例 整个过程分成两个mapreduce阶段 由于hadoop流不支持多个mapreduce过程的自动化 所以所有mapreduce过程命令必须人工一个一个的执行 1 首先需要将原始数据处理成如下形式的两个文件 文件一 It
  • 蓝桥杯JAVA B组 2020(1)第二题 寻找2020

    一 知识点 ToCharArray 的用法 将字符串对象中的字符转换为一个字符数组 二 题目描述小蓝有一个数字矩阵 里面只包含数字 0 和 2 小蓝很喜欢 2020 他想找到这个数字矩阵中有多少个 2020 小蓝只关注三种构成 2020 的
  • LeetCode---搜索算法

    LeetCode 搜索算法 搜索算法 图 图Graph的概念 图的抽象数据类型 邻接矩阵 邻接列表 图的搜索算法 广度优先BFS 深度优先DFS LeetCode BFS 1091 二进制矩阵中的最短路径 解法 广度优先搜索 127 单词接
  • 计算机主机指什么,通常所说的计算机的主机是指什么

    大家好 我是时间财富网智能客服时间君 上述问题将由我为大家进行解答 通常所说的计算机的主机是指cpu和内存 计算机 一般是指 电子计算机 电子计算机 electronic computer 通称电脑 是现代一种用于高速计算的电子计算机器 可
  • Java异常之自定义异常

    自定义异常类自定义异常 1 使用 Java 内置的异常类可以描述在编程时出现的大部分异常情况 除此之外 用户还可以自定义异常 用户自定义异常类 只需继承 Exception 类即可 2 在程序中使用自定义异常类 大体可以分为以下几个步骤 创
  • Widgetkit是什么?

    最近在研究Joomla 发现了一个叫Widgetkit的组件 Widgetkit是什么来的 有什么用呢 它是Yootheme推出的一个综合应用解决方案 它广泛用于Joomla 和Wordpress中 在Widgetkit组件里有很多效果 比
  • ERROR: No matching distribution found for setuptools_scm

    安装paddlenlp时遇到这个问题 解决办法 先把setuptools卸载掉 pip uninstall setuptools 然后重新安装 pip install setuptolls scm pip install seqeval
  • 虚幻引擎 遇到的问题总结

    初学UE 遇到很多问题 这里记录一下 防止以后忘记 还会不断添加 语言设置 UE的中文翻译很多地方翻译的并不是很好 照着视频学习的话还是英文版的比较好 Edit 编辑 gt Editor preferences 编辑器偏好设置 gt Reg
  • Linux下的g++使用总结

    什么是g 和gcc 都是编译器 准确的说都是GNU 组织 的一个编译器 区别 后缀为 c的文件gcc把它当做c程序 g 当做c 程序 后缀为c 的两者都当做c 程序 对于cpp程序 无论gcc或者是g 编译阶段都是相同的 都是用的gcc进行
  • ChatGPT一分钟做流程图

    ChatGPT一分钟做流程图它能不能帮我们制作流程图呢 必须是可以的 今天我们再来介绍一个如何用ChatGPT快速制作流程图的方法 下面以PowerBI分析流程为例 先向ChatGPT进行提问 你是一个高级数据分析师 熟悉数据分析的每个流程
  • 在PPPoE拨号宽带上使用IPv6(Cisco路由器)

    本文于2019年1月成文 在2020年3月进行了修订 更正了部分配置命令的使用 本地联通运营商已经开通了家用宽带的IPv6 通过单独电脑PPPoE拨号证实可用 但是 显然现在几乎没有人用电脑直接拨号了 那么 如何能在不改变现有网络拓扑的情况
  • 印度欲自研系统以替代 iOS 和 Android;基于 OpenJDK 17 的龙芯平台 Java 环境发布;Python 即将支持 WebAssembly

    开源吞噬世界的趋势下 借助开源软件 基于开源协议 任何人都可以得到项目的源代码 加以学习 修改 甚至是重新分发 关注 开源日报 一文速览国内外的开源大事件吧 整理 苏宓 一分钟速览新闻点 基于 OpenJDK 17 的龙芯平台 Java 环
  • Golang Web框架fiber

    Golang Web框架fiber fiber简介 fiber起步 fiber配置 fiber上下文context fiber app fiber常量 fiber中间件 基本认证BasicAuth fiber中间件 缓存 fiber中间件
  • React 类组件和函数组件

    React 类组件和函数组件 目录 1 类组件和函数组件 2 如何使用 props 和 state 3 如何绑定事件 4 复习 this 两个面试题 组件component 一 概念 Element VS Component 元素与组件 不

随机推荐