向量与矩阵求导与实例分析

2023-10-31

【说明】

1. 相关内容经过诸多学习内容整理

2. 比较权威的学习源可参考维基百科 https://en.wikipedia.org/wiki/Matrix_calculus#Scalar-by-vector_identities

3. 机器学习关联内容学习： 1）西瓜书第55页多元线性回归涉及到的公式推导 2）机器学习实战第138页

【目录】

一、布局的概念

二、一个求导的例子

三、另一个例子的推导

四、矩阵及向量求导法则

五、求导公司速查表

一、布局的概念

重要前提： 若 x 为向量，则默认 x 为列向量， $x^{T}$ 为行向量

布局简单地理解就是分子 y、分母 x 是行向量还是列向量。

分子布局（Numerator-layout）： 分子为 y 或者分母为 $x^{T}$ (即，分子为列向量或者分母为行向量)
分母布局（Denominator-layout）： 分子为 $y^{^{T}}$ 或者分母为 x (即，分子为行向量或者分母为列向量)

为了更加深刻地理解两种布局的特点和区别，下面是从维基百科中布局部分拿来的例子：

分子布局

标量/向量：（分母的向量为行向量）
向量/标量：（分子的向量为列向量）
向量/向量：（分子为列向量横向平铺，分母为行向量纵向平铺）
标量/矩阵：（注意这个矩阵部分是转置的，而下面的分母布局是非转置的）
矩阵/标量：

分母布局

标量/向量：（分母的向量为列向量）
向量/标量：（分子的向量为行向量）
向量/向量：（分子为行向量纵向平铺，分母为列向量横向平铺）
标量/矩阵：（矩阵部分为原始矩阵）

二、一个求导的例子

三、另一个例子的推导

看看红框部分的推导过程如下：
对谁求导数，就以谁（分母）作为主序，得出结果。比如这里x是列向量，求Ax关于x求导数，那么对x的每个分量分别求偏导数(写成一行)，然后整理排成一列（同x一样是列向量）。
这里写图片描述
同理有

关于x的转置 $x^{T}$ 求导数， $x^{T}$ 是行向量，那么Ax分别对 $x^{T}$ 向量中的分量求偏导（写成一列），然后整体排成一行（同 $x^{T}$ 是行向量）。

这里，可以反过来再去理解下前面布局所述的行向量与列向量的差异。

四、矩阵及向量求导法则

五、求导公式速查表

........

更多公式见：

https://en.wikipedia.org/wiki/Matrix_calculus#Scalar-by-vector_identities

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

数学基础

矩阵求导

向量与矩阵求导与实例分析的相关文章

数学基础--高斯分布详解

1 简介正态分布 xff08 Normal Distribution xff09 xff0c 又名高斯分布 xff08 Gaussian Distribution xff09 xff0c 是一个在数学物理及工程等领域都非常重要的概率分布
python 深度学习[数学基础-1-函数，极限]

文章目录函数函数
python 深度学习-数学基础-2-导数

z z的变化值比上距离的极限
矩阵分解（1）-- 矩阵分解之LU、LDLT、Cholesky分解

1 分类矩阵分解 decomposition factorization 是多半将矩阵拆解为数个三角形矩阵 triangular matrix 依使用目的的不同可分为几类与线性方程解法相关的矩阵分解 LU分解奇异值分解 QR分解极
几何平均详解，及其与算术平均、调和平均、均方根的关系

2 几何平均与算术平均的转换关系附 3 2 几何平均数适用于求连乘样本的均值它是变化的中心代表平均变化率算术平均数适用于求连加样本的均值它是数值的中心代表平均数量中位数适合求带有离群值样本的均值它是位置的中心代表平均位置
【随机过程】 17 -离散时间马氏链典型应用

离散时间马尔科夫链的典型应用文章目录离散时间马尔科夫链的典型应用 0 概述 1 Page Rank 1 1 背景 1 2 模型建立 1 3 模型求解 2 MCMC 2 1 概述 2 2 实现思路 2 3 具体实现 2 3 1 第一步细
向量与矩阵求导与实例分析

说明 1 相关内容经过诸多学习内容整理 2 比较权威的学习源可参考维基百科 https en wikipedia org wiki Matrix calculus Scalar by vector identities 3 机器学习关联内容
线性代数——正交矩阵

正交矩阵 orthogonal matrix 正交矩阵的定义正交矩阵性质 1 AT是正交矩阵 2 A的各行是单位向量且两两正交 3 A的各列是单位向量且两两正交 4 A 1或 1 正交矩阵的定义如果 AAT E E为单位矩阵 AT表示
概率论与数理统计(一)随机事件,样本空间

1 D 2 A 3 C 4 AD 5 正确答案 1 2 1 3 2 1 2 3 3 1 3 2
矩阵的迹（Trace）

译自维基百科在线性代数中方阵A n n 的迹定义为对角线元素的和即矩阵的迹表示的是特征值的和它不随基的变化而变化通常这种特性可以用来定义线性算子的轨迹注意迹是对方阵而言的举例 A是一个方阵如下则A的迹表示为迹的特性
【随机过程】19 - 随机过程的线性预测问题

随机过程的线性预测问题文章目录随机过程的线性预测问题 1 随机过程的估计问题概述 1 1 预测问题 1 2 内插问题 1 3 滤波问题 2 随机过程的可预测性 2 1 新息过程 2 1 1 信息过程的定义 2 1 2 估计的子空间分解
标量、向量、矩阵之间求导笔记

2019 12 06 今天碰到了下面有关向量对于向量的导数不太明白为什么最后得到的是A的转置 d A x
【SLAM】卡尔曼滤波（Kalman Filter）

卡尔曼滤波 Kalman filter 一种利用线性系统状态方程通过系统输入输出观测数据对系统状态进行最优估计的算法由于观测数据中包括系统中的噪声和干扰的影响所以最优估计也可看作是滤波过程卡尔曼滤波器的原理解释如下首先我们先要
几个常用数学知识点

机器学习跟数学有着紧密的关系因此掌握一些常用的数学知识点有助于我们理解某些模型的底层相关原理 1 泰勒公式 2 驻点极值点鞍点拐点 2 1 驻点在数学特别在微积分函数在一点处的一阶导数为零该点即函数的驻点 Stationa
非中心卡方分布

非中心卡方分布非中心卡方分布是卡方分布的一般化形式如果是个独立的正态分布的随机变量均值为方差为表示为那么随机变量为非中心卡方分布非中心卡方分布涉及两个参数表示自由度即的数目是和随机变量相关的参数由以上参数所定义
傅里叶变换公式整理

1 一维傅里叶变换 1 1 一维连续傅里叶变换正变换 F
朴素贝叶斯基本原理和预测过程、先验概率、后验概率、似然概率概念

贝叶斯原理是英国数学家托马斯贝叶斯提出的贝叶斯原理建立在主观判断的基础上在我们不了解所有客观事实的情况下同样可以先估计一个值然后根据实际结果不断进行修正举例一个袋子里有10个球其中6个黑球 4个白球那么随机抓一个黑球的概
对数损失和交叉熵损失

从上述的表达式中看两者的损失函数本质是一样的但是这里需要注意的是通常情况下这两种损失函数所对应的上一层结构不同 log loss经常对应的是Sigmoid函数的输出用于二分类问题而cross entropy loss经常对应的是S
范数（简单的理解）、范数的用途、什么是范数

没学好矩阵代数的估计范数也不是太清楚当然学好的人也不是太多范数主要是对矩阵和向量的一种描述有了描述那么大小就可以比较了从字面理解一种比较构成规范的数有了统一的规范就可以比较了例如 1比2小我们一目了然可是 3 5 3 和
矩阵求导常用公式

矩阵求导常用公式 1 引言 2 向量的导数 2 1 向量对标量求导 Vector by scalar 2 2 标量对向量求导 Scalar by vector 2 3 向量对向量求导 Vector by vector 3 矩阵的导数 3 1

随机推荐

pip win上安装gpu版本 pytorch

检查cuda版本 nvcc V 打开torch previous 版本页面 https pytorch org get started previous versions 选择合适的版本如 pip install torch 1 13 1
C语言指针详解及示例代码

C语言指针详解及示例代码指针是C语言中一项重要的概念它允许我们直接访问和操作内存中的数据本文将详细介绍C语言中指针的概念使用方法和示例代码指针的基本概念指针是一个变量它存储了其他变量的内存地址通过指针我们可以直接访问和修改
用递归的方法求n!

用递归的方法求n 在写此函数之前我们需要知道函数递归是什么顾名思义函数递归着重在递归俩字对于函数我想大部分初始者已经不陌生在这里笔者就不做过多的讲述在调用一个函数的过程中又直接或者间接的调用该函数本身称为函数的递归
springboot项目添加lombok日志输出控制台和log文件

这个配置我也是在网上查找的但是找不到出处了首先在resources下面建立logback spring xml文件这个logback spring是默认springboot可以扫描到的不用在yml中配置也可以自己起名字要在ap
C++ 画热力图

void get point color float intensity int r int g int b if intensity lt 1 r 0 g 0 b 118 else if intensity lt 2 r 84 g 85
第十四届蓝桥杯软件类 1 期模拟赛填空题及题解

蓝桥杯还剩仅仅10天但是本人现在才开始准备啊不过事已至此只好刷一点题练练手感了系统地去学算法肯定是来不及啦题目来源第十四届蓝桥杯软件类 1 期模拟赛大学组填空题3 4 5 填空3 项数问题描述小蓝特别喜欢调和级数 S n
WebService接口与HTTP接口的联系

1 WebService有很多协议为什么HTTP比较流行 WebService是个很重型的规范它的应用协议是SOAP 简单对象访问协议它所依赖的下层通信方式不单单是HTTP 也有SOAP over SMTP SOAP over TCP
机器学习之空间滤波器

目录空间滤波原理平滑滤波图例均值平滑滤波器 matlab 代码中值平滑滤波器 matlab 代码人脸识别识别率比较 PCA k近邻分类器锐化滤波 Unsharp Mask 效果图拉普拉斯效果图锐化滤波器 matlab
猿创征文｜ ‘vue‘ 不是内部或外部命令,也不是可运行的程序或批处理文件。

vue 不是内部或外部命令也不是可运行的程序或批处理文件今天在使用vue ui进行搭建项目的时候出现了这个问题在Visual Studio Code中通过vue ui指令使用脚手架安装项目时终端报错 vue 不是内部或外部命令也
Facebook数据中心实践分析，OCP主要工作成果介绍

Facebook数据中心实践分析 OCP主要工作成果介绍摘要用讲故事的方式重点介绍了Facebook在数据中心方面的实践其成立开放计算项目 OCP 以来的主要工作成果以下为正文保密本就是数据中心行业的惯例 2014年11月我独自
mw325r已断开服务器无响应,水星mw325r路由器恢复出厂设置之后上不了网怎么办？...

我把水星mw325r路由器恢复出厂设置之后有点问题了可以教教我怎么解决吗这是一个典型的重置路由器没有正确设置的案例路由器恢复出厂的意思就是跟刚买来的时候一样没有任何用户自己的配置所以正确配置路由器才可以上网接下来家用路由器网小
Python 机器学习实战

1 机器学习概述机器学习正在迅速改变我们的世界作为人工智能的核心我们几乎每天都会读到机器学习如何改变日常的生活一些人认为它会带领我们进入一个风格奇异的高科技乌托邦而另一些人认为我们正迈向一个高科技天启时代将与窃取我们工作机会的机
RabbitMQ消息堆积问题及惰性队列

一消息堆积 1 消费者堆积问题当生产者生产消息的速度超过了消费者处理消息的速度就会导致消息在队列中进行堆积一定时间后会造成队列达到存储的上限那么最开始进入队列的消息可能变成死信会被丢弃有关死信以及死信消息的处理问题的详细介绍可
LeetCode刷题-6

数组 88 合并两个有序数组题目描述题目样例 Java方法直接合并后排序思路及算法代码执行结果复杂度 Java方法双指针思路及算法代码执行结果复杂度 Java方法逆向双指针思路及算法代码执行结果复杂度题目
台式机计算机无线开关在哪,电脑无线wifi开关在哪里打开

电脑无法打开wifi问题有很多其中物理方面问题就是无线开关根本没打开怎么可能连得上wifi呢下面是学习啦小编整理的打开电脑wifi无线开关的方法供您参考打开电脑wifi无线开关的方法一点击右下方图标选择所有设置菜单然后选
C#之按位或‘

这里不介绍按位或按位与的二进制算法网上大都说的都是关于int类型二进制的按位与和按位或的用法这里我们来看看bool类型的用法具体看代码 static void Main string args int i 0 Console Writ
Git操作记录

版权声明本文为博主原创文章转载请注明出处 http blog csdn net shulianghan https blog csdn net han1202012 article details 18812279
MongoDB的and和or，嵌入式文档，数组查询

现在有一张数据表或者是集合结构如下我们现在对集合进行and和or查询如下 1 隐式and查询查询年龄大于15 且性别属于男性的数据 db tb find age gt 15 sex male 关键字 gt是大于的意思结果 2 显
面向对象编程之多态性与鸭子类型

目录一什么是多态二多态性三 abc抽象类模块四鸭子类型六总结一什么是多态一类事物有多种不同的形态如动物有猫狗鸡等二多态性所谓多态性指的是不管各对象是什么数据类型就直接使用各对象中统一的方法函数从一定程
向量与矩阵求导与实例分析

说明 1 相关内容经过诸多学习内容整理 2 比较权威的学习源可参考维基百科 https en wikipedia org wiki Matrix calculus Scalar by vector identities 3 机器学习关联内容

热门标签