向量与矩阵求导与实例分析

2023-10-31

【说明】

1. 相关内容经过诸多学习内容整理

2.  比较权威的学习源可参考维基百科  https://en.wikipedia.org/wiki/Matrix_calculus#Scalar-by-vector_identities

3. 机器学习关联内容学习: 1)西瓜书第55页多元线性回归涉及到的公式推导   2)机器学习实战 第138页 

【目录】

一、布局的概念

二、一个求导的例子

三、另一个例子的推导

四、矩阵及向量求导法则

五、求导公司速查表

 

一、布局的概念

重要前提: 若 x 为向量,则默认 x 为列向量, x^{T}为行向量

布局简单地理解就是分子 y、分母 x 是行向量还是列向量。

  • 分子布局(Numerator-layout): 分子为 y 或者分母为  x^{T} (即,分子为列向量或者分母为行向量)
  • 分母布局(Denominator-layout): 分子为  y^{^{T}} 或者分母为 x (即,分子为行向量或者分母为列向量)

为了更加深刻地理解两种布局的特点和区别,下面是从维基百科中布局部分拿来的例子:

分子布局

  • 标量/向量: 标量/向量 (分母的向量为行向量)

  • 向量/标量: 向量/标量 (分子的向量为列向量)

  • 向量/向量: 向量/向量 (分子为列向量横向平铺,分母为行向量纵向平铺)

  • 标量/矩阵: 标量/矩阵注意这个矩阵部分是转置的,而下面的分母布局是非转置的

  • 矩阵/标量: 矩阵/标量

分母布局

  • 标量/向量: 标量/向量 (分母的向量为列向量)

  • 向量/标量: 向量/标量 (分子的向量为行向量)

  • 向量/向量: 向量/向量 (分子为行向量纵向平铺,分母为列向量横向平铺)

  • 标量/矩阵: 标量/矩阵矩阵部分为原始矩阵

二、一个求导的例子

三、另一个例子的推导

看看红框部分的推导过程如下:
对谁求导数,就以谁(分母)作为主序,得出结果。比如这里x是列向量,求Ax关于x求导数,那么对x的每个分量分别求偏导数(写成一行),然后整理排成一列(同x一样是列向量)。 
这里写图片描述 
同理有  
这里写图片描述 
关于x的转置x^{T}求导数,x^{T}是行向量,那么Ax分别对x^{T}向量中的分量求偏导(写成一列),然后整体排成一行(同x^{T}是行向量)。

这里,可以反过来再去理解下前面布局所述的行向量与列向量的差异。

四、矩阵及向量求导法则

五、求导公式速查表

........

更多公式见:

https://en.wikipedia.org/wiki/Matrix_calculus#Scalar-by-vector_identities

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

向量与矩阵求导与实例分析 的相关文章

  • 数学基础--高斯分布详解

    1 简介 正态分布 xff08 Normal Distribution xff09 xff0c 又名高斯分布 xff08 Gaussian Distribution xff09 xff0c 是一个在数学 物理及工程等领域都非常重要的概率分布
  • python 深度学习[数学基础-1-函数,极限]

    文章目录 函数 函数
  • python 深度学习-数学基础-2-导数

    z z的变化值比上距离的极限
  • 矩阵分解(1)-- 矩阵分解之LU、LDLT、Cholesky分解

    1 分类 矩阵分解 decomposition factorization 是多半将矩阵拆解为数个三角形矩阵 triangular matrix 依使用目的的不同 可分为几类 与线性方程解法相关的矩阵分解 LU分解 奇异值分解 QR分解 极
  • 几何平均详解,及其与算术平均、调和平均、均方根的关系

    2 几何平均与算术平均的转换关系 附 3 2 几何平均数适用于求连乘样本的均值 它是变化的中心 代表平均变化率 算术平均数适用于求连加样本的均值 它是数值的中心 代表平均数量 中位数适合求带有离群值样本的均值 它是位置的中心 代表平均位置
  • 【随机过程】 17 -离散时间马氏链典型应用

    离散时间马尔科夫链的典型应用 文章目录 离散时间马尔科夫链的典型应用 0 概述 1 Page Rank 1 1 背景 1 2 模型建立 1 3 模型求解 2 MCMC 2 1 概述 2 2 实现思路 2 3 具体实现 2 3 1 第一步 细
  • 向量与矩阵求导与实例分析

    说明 1 相关内容经过诸多学习内容整理 2 比较权威的学习源可参考维基百科 https en wikipedia org wiki Matrix calculus Scalar by vector identities 3 机器学习关联内容
  • 线性代数——正交矩阵

    正交矩阵 orthogonal matrix 正交矩阵的定义 正交矩阵性质 1 AT是正交矩阵 2 A的各行是单位向量且两两正交 3 A的各列是单位向量且两两正交 4 A 1或 1 正交矩阵的定义 如果 AAT E E为单位矩阵 AT表示
  • 概率论与数理统计(一)随机事件,样本空间

    1 D 2 A 3 C 4 AD 5 正确答案 1 2 1 3 2 1 2 3 3 1 3 2
  • 矩阵的迹(Trace)

    译自维基百科 在线性代数中 方阵A n n 的迹定义为对角线元素的和 即 矩阵的迹表示的是特征值的和 它不随基的变化而变化 通常 这种特性可以用来定义线性算子的轨迹 注意 迹是对方阵而言的 举例 A是一个方阵 如下 则A的迹表示为 迹的特性
  • 【随机过程】19 - 随机过程的线性预测问题

    随机过程的线性预测问题 文章目录 随机过程的线性预测问题 1 随机过程的估计问题概述 1 1 预测问题 1 2 内插问题 1 3 滤波问题 2 随机过程的可预测性 2 1 新息过程 2 1 1 信息过程的定义 2 1 2 估计的子空间分解
  • 标量、向量、矩阵之间求导笔记

    2019 12 06 今天 碰到了下面有关向量对于向量的导数 不太明白为什么最后得到的是A的转置 d A x
  • 【SLAM】卡尔曼滤波(Kalman Filter)

    卡尔曼滤波 Kalman filter 一种利用线性系统状态方程 通过系统输入输出观测数据 对系统状态进行最优估计的算法 由于观测数据中包括系统中的噪声和干扰的影响 所以最优估计也可看作是滤波过程 卡尔曼滤波器的原理解释如下 首先 我们先要
  • 几个常用数学知识点

    机器学习跟数学有着紧密的关系 因此掌握一些常用的数学知识点 有助于我们理解某些模型的底层相关原理 1 泰勒公式 2 驻点 极值点 鞍点 拐点 2 1 驻点 在数学 特别在微积分 函数在一点处的一阶导数为零 该点即函数的驻点 Stationa
  • 非中心卡方分布

    非中心卡方分布 非中心卡方分布是卡方分布的一般化形式 如果 是 个独立的正态分布的随机变量均值为 方差为 表示为 那么随机变量 为非中心卡方分布 非中心卡方分布涉及两个参数 表示自由度 即 的数目 是和随机变量 相关的参数 由以上参数所定义
  • 傅里叶变换公式整理

    1 一维傅里叶变换 1 1 一维连续傅里叶变换 正变换 F
  • 朴素贝叶斯基本原理和预测过程、先验概率、后验概率、似然概率概念

    贝叶斯原理是英国数学家托马斯 贝叶斯提出的 贝叶斯原理 建立在主观判断的基础上 在我们不了解所有客观事实的情况下 同样可以先估计一个值 然后根据实际结果不断进行修正 举例 一个袋子里有10个球 其中6个黑球 4个白球 那么随机抓一个黑球的概
  • 对数损失和交叉熵损失

    从上述的表达式中看 两者的损失函数本质是一样的 但是这里需要注意的是通常情况下 这两种损失函数所对应的上一层结构不同 log loss经常对应的是Sigmoid函数的输出 用于二分类问题 而cross entropy loss经常对应的是S
  • 范数(简单的理解)、范数的用途、什么是范数

    没学好矩阵代数的估计范数也不是太清楚 当然学好的人也不是太多 范数主要是对矩阵和向量的一种描述 有了描述那么 大小就可以比较了 从字面理解一种比较构成规范的数 有了统一的规范 就可以比较了 例如 1比2小我们一目了然 可是 3 5 3 和
  • 矩阵求导常用公式

    矩阵求导常用公式 1 引言 2 向量的导数 2 1 向量对标量求导 Vector by scalar 2 2 标量对向量求导 Scalar by vector 2 3 向量对向量求导 Vector by vector 3 矩阵的导数 3 1

随机推荐

  • pip win上安装gpu版本 pytorch

    检查cuda版本 nvcc V 打开torch previous 版本页面 https pytorch org get started previous versions 选择合适的版本 如 pip install torch 1 13 1
  • C语言指针详解及示例代码

    C语言指针详解及示例代码 指针是C语言中一项重要的概念 它允许我们直接访问和操作内存中的数据 本文将详细介绍C语言中指针的概念 使用方法和示例代码 指针的基本概念 指针是一个变量 它存储了其他变量的内存地址 通过指针 我们可以直接访问和修改
  • 用递归的方法求n!

    用递归的方法求n 在写此函数之前 我们需要知道 函数递归是什么 顾名思义 函数递归 着重在 递归 俩字 对于函数 我想大部分初始者已经不陌生 在这里笔者就不做过多的讲述 在调用一个函数的过程中 又直接或者间接的调用该函数本身 称为函数的递归
  • springboot项目添加lombok日志输出控制台和log文件

    这个配置我也是在网上查找的 但是找不到出处了 首先 在resources下面建立logback spring xml文件 这个logback spring是默认springboot可以扫描到的 不用在yml中配置 也可以自己起名字 要在ap
  • C++ 画热力图

    void get point color float intensity int r int g int b if intensity lt 1 r 0 g 0 b 118 else if intensity lt 2 r 84 g 85
  • 第十四届蓝桥杯软件类 1 期模拟赛填空题及题解

    蓝桥杯还剩仅仅10天 但是本人现在才开始准备啊 不过事已至此只好刷一点题练练手感了 系统地去学算法肯定是来不及啦 题目来源 第十四届蓝桥杯软件类 1 期模拟赛 大学组 填空题3 4 5 填空3 项数 问题描述 小蓝特别喜欢调和级数 S n
  • WebService接口与HTTP接口的联系

    1 WebService有很多协议 为什么HTTP比较流行 WebService是个很重型的规范 它的应用协议是SOAP 简单对象访问协议 它所依赖的下层通信方式不单单是HTTP 也有SOAP over SMTP SOAP over TCP
  • 机器学习之空间滤波器

    目录 空间滤波 原理 平滑滤波 图例 均值平滑滤波器 matlab 代码 中值平滑滤波器 matlab 代码 人脸识别识别率比较 PCA k近邻分类器 锐化滤波 Unsharp Mask 效果图 拉普拉斯 效果图 锐化滤波器 matlab
  • 猿创征文| ‘vue‘ 不是内部或外部命令,也不是可运行的程序 或批处理文件。

    vue 不是内部或外部命令 也不是可运行的程序 或批处理文件 今天在使用vue ui进行搭建项目的时候出现了这个问题 在Visual Studio Code中通过vue ui指令使用脚手架安装项目时 终端报错 vue 不是内部或外部命令 也
  • Facebook数据中心实践分析,OCP主要工作成果介绍

    Facebook数据中心实践分析 OCP主要工作成果介绍 摘要 用讲故事的方式重点介绍了Facebook在数据中心方面的实践 其成立开放计算项目 OCP 以来的主要工作成果 以下为正文 保密本就是数据中心行业的惯例 2014年11月 我独自
  • mw325r已断开服务器无响应,水星mw325r路由器恢复出厂设置之后上不了网怎么办?...

    我把水星mw325r路由器恢复出厂设置之后有点问题了 可以教教我怎么解决吗 这是一个典型的重置路由器没有正确设置的案例 路由器恢复出厂的意思就是跟刚买来的时候一样 没有任何用户自己的配置 所以 正确配置路由器才可以上网 接下来家用路由器网小
  • Python 机器学习实战

    1 机器学习概述 机器学习正在迅速改变我们的世界 作为人工智能的核心 我们几乎每天都会读到机器学习如何改变日常的生活 一些人认为它会带领我们进入一个风格奇异的高科技乌托邦 而另一些人认为我们正迈向一个高科技天启时代 将与窃取我们工作机会的机
  • RabbitMQ消息堆积问题及惰性队列

    一 消息堆积 1 消费者堆积问题 当生产者生产消息的速度超过了消费者处理消息的速度 就会导致消息在队列中进行堆积 一定时间后会造成队列达到存储的上限 那么最开始进入队列的消息可能变成死信 会被丢弃 有关死信以及死信消息的处理问题的详细介绍可
  • LeetCode刷题-6

    数组 88 合并两个有序数组 题目描述 题目样例 Java方法 直接合并后排序 思路及算法 代码 执行结果 复杂度 Java方法 双指针 思路及算法 代码 执行结果 复杂度 Java方法 逆向双指针 思路及算法 代码 执行结果 复杂度 题目
  • 台式机计算机无线开关在哪,电脑无线wifi开关在哪里打开

    电脑无法打开wifi问题有很多 其中物理方面问题就是无线开关根本没打开 怎么可能连得上wifi呢 下面是学习啦小编整理的打开电脑wifi无线开关的方法 供您参考 打开电脑wifi无线开关的方法一 点击右下方图标 选择 所有设置 菜单 然后选
  • C#之按位或‘

    这里不介绍按位或按位与的二进制算法 网上大都说的都是关于int类型二进制的按位与和按位或的用法 这里我们来看看bool类型的用法 具体看代码 static void Main string args int i 0 Console Writ
  • Git操作记录

    版权声明 本文为博主原创文章 转载请注明出处 http blog csdn net shulianghan https blog csdn net han1202012 article details 18812279
  • MongoDB的and和or,嵌入式文档,数组查询

    现在 有一张数据表或者是集合 结构如下 我们现在对集合进行and和or查询 如下 1 隐式and查询 查询年龄大于15 且性别属于男性的数据 db tb find age gt 15 sex male 关键字 gt是大于的意思 结果 2 显
  • 面向对象编程之多态性与鸭子类型

    目录 一 什么是多态 二 多态性 三 abc抽象类模块 四 鸭子类型 六 总结 一 什么是多态 一类事物有多种不同的形态 如 动物有猫 狗 鸡等 二 多态性 所谓多态性指的是不管各对象是什么数据类型就直接使用各对象中统一的方法函数 从一定程
  • 向量与矩阵求导与实例分析

    说明 1 相关内容经过诸多学习内容整理 2 比较权威的学习源可参考维基百科 https en wikipedia org wiki Matrix calculus Scalar by vector identities 3 机器学习关联内容