矩阵理论| 基础:向量范数、赋范向量空间与内积空间、重要不等式

2023-05-16

范数是度量向量/矩阵/张量大小的方法

范数定义了向量到实数的某种映射,并且满足正定性、齐次性、三角不等式
∥ v ∥ ≥ 0 \| \bold v \| \geq 0 v0
∥ c v ∥ = ∣ c ∣ ∥ v ∥ \|c \bold v \| = |c| \| \bold v \| cv=c∣∥v
∥ v + w ∥ ≤ ∥ v ∥ + ∥ w ∥ \left\| {\bold v + \bold w} \right\| \le \left\| \bold v \right\| + \left\| \bold w \right\| v+wv+w

向量范数

Hölder范数/ p范数/ Lp范数: 为x向量各个元素绝对值p次方之和的1/p次方 ∥ v ∥ p = ( ∣ v 1 ∣ p + ⋯ + ∣ v n ∣ p ) 1 / p {\left\|\bold v \right\|_p} = {({\left| {{v_1}} \right|^p} + \cdots + {\left| {{v_n}} \right|^p})^{1/p}} vp=(v1p++vnp)1/p
常用的Lp范数(p一般取1到无穷大):

  • ℓ 1 \ell ^1 1范数 / 曼哈顿范数: ∥ v ∥ 1 = ∣ v 1 ∣ + ⋯ + ∣ v n ∣ {\left\| \bold v \right\|_1} = \left| {{v_1}} \right| + \cdots + \left| {{v_n}} \right| v1=v1++vn
    ℓ 1 \ell ^1 1范数较小的向量,表现为稀疏的,即大部分元素为零
  • ℓ 2 \ell ^2 2范数 / 欧式范数: ∥ v ∥ 2 = ∣ v 1 ∣ 2 + ⋯ + ∣ v n ∣ 2 {\left\| \bold v \right\|_2} = \sqrt {{{\left| {{v_1}} \right|}^2} + \cdots + {{\left| {{v_n}} \right|}^2}} v2=v12++vn2
    ℓ 2 \ell ^2 2范数较小的向量,包含很多较小分量(这是因为一个大分量平方后比重很大),最小化 ℓ 2 \ell ^2 2范数类似于最小二乘法
  • ℓ ∞ \ell ^\infty 范数: ∥ v ∥ ∞ = max ⁡ ∣ v i ∣ {\left\| \bold v \right\|_\infty } = \max \left| {{v_i}} \right| v=maxvi

类比可得 ℓ 0 \ell ^0 0范数 ∥ v ∥ 0 {\left\| \bold v \right\|_0} v0 = v \bold v v中非零分量的个数,可以描述稀疏性
但是注意,这不是一个真正的范数,因为它违反了范数规则( ∥ 2 v ∥ 0 {\left\| 2 \bold v \right\|_0} 2v0= ∥ v ∥ 0 {\left\| \bold v \right\|_0} v0)

向量范数的几何意义

R 2 \mathbf R^2 R2空间中,在不同Lp范数下,满足范数=1的向量集合如图
(向量起点在原点,这里仅画出了向量的终点)
在这里插入图片描述
如图,满足 ∥ v ∥ 1 = ∣ v 1 ∣ + ∣ v 2 ∣ = 1 {\left\|\bold v \right\|_1} = \left| {{v_1}} \right| + \left| {{v_2}} \right| = 1 v1=v1+v2=1的向量集合构成一个菱形;满足 ∥ v ∥ 2 = ∣ v 1 ∣ 2 + ∣ v 2 ∣ 2 = 1 {\left\| \bold v \right\|_2} = \sqrt {{{\left| {{v_1}} \right|}^2} + {{\left| {{v_2}} \right|}^2}} = 1 v2=v12+v22 =1的向量集合构成一个圆;

从左到右,随着p的增大,该图像不断“向外膨胀”;
另外注意,上图中只有p取1到 ∞ \infty 时,得到合法的范数(符合范数规则),因而可以说:合法范数的集合图像都是凸的(而当p小于1,图像为凹的,可能对应了三角不等式等属性的丧失)

由图可得推论:对任意向量 v \bold v v,有 ∥ v ∥ ∞ ≤ ∥ v ∥ 2 ≤ ∥ v ∥ 1 ≤ n ∥ v ∥ 2 {\|\bold v \|_\infty}\le {\|\bold v \|_2}\le {\|\bold v \|_1}\le\sqrt n {\|\bold v \|_2} vv2v1n v2

证明:
①对于向量 [ 1 2 , 1 2 ] [\frac{1}{\sqrt 2},\frac{1}{\sqrt 2}] [2 1,2 1],绘制各范数的等高线:
在这里插入图片描述
显然 ∥ v ∥ ∞ ≤ ∥ v ∥ 2 ≤ ∥ v ∥ 1 {\|\bold v \|_\infty}\le {\|\bold v \|_2}\le {\|\bold v \|_1} vv2v1
②已经知道 ∥ v ∥ 2 ≤ ∥ v ∥ 1 {\|\bold v \|_2}\le {\|\bold v \|_1} v2v1
固定使 ∥ v ∥ 2 = 1 {\|\bold v \|_2}=1 v2=1,对应下图中红色圆上的所有点;
那么圆上所有点中, ∥ v ∥ 1 {\|\bold v \|_1} v1最小为1,最大为 2 \sqrt 2 2 ,显然 ∥ v ∥ 2 ≤ ∥ v ∥ 1 ≤ n ∥ v ∥ 2 {\|\bold v \|_2}\le {\|\bold v \|_1}\le\sqrt n {\|\bold v \|_2} v2v1n v2
在这里插入图片描述

另一类范数是 椭圆范数/ S范数 ∥ v ∥ S = v T S v {\left\|\bold v \right\|_S} = \sqrt {{\bold v^T}\boldsymbol S\bold v} vS=vTSv 其中, S \boldsymbol S S对称正定矩阵/Hermite正定矩阵,而外面的根号是为了保证范数的性质 ∥ c v ∥ S = c ∥ v ∥ S {\left\|c\bold v \right\|_S}=c{\left\|\bold v \right\|_S} cvS=cvS
之所以称为“椭圆范数”,是因为该范数与二次型有关,而且正定二次型的横截面就是椭圆

例如,当 S = [ 2 0 0 3 ] \boldsymbol S=\begin{bmatrix} 2 &0 \\ 0 &3\end{bmatrix} S=[2003] ∥ v ∥ S 2 = 2 v 1 2 + 3 v 2 2 = 1 {\left\|\bold v \right\|_S^2} = 2v_1^2 + 3v_2^2 = 1 vS2=2v12+3v22=1的图像为一个椭圆,这相当于一种用2和3加权后的范数
S = I \boldsymbol S=\boldsymbol I S=I,椭圆范数退化为 ℓ 2 \ell ^2 2范数

范数最小化的优化问题

一个经典的优化问题模型是:

min ⁡ ∥ x ∥ , s . t . A x = b \min \left\| \bold x \right\|, s.t. \boldsymbol A\bold x=\bold b minx,s.t.Ax=b

在L1和L2范数下,最优解的图解:
在这里插入图片描述
在几何上, A x = b \boldsymbol A\bold x=\bold b Ax=b的解空间构成一个流形(上面的直线);
菱形/圆形对应了L1和L2范数的“等高线”,想象菱形/圆形从原点不断向外扩张,它们第一次与直线的交点,就是问题的解

在最优化中,L1范数最小化的方法,称为基追踪(basis pursuit);
L2范数最小化的方法称为岭回归(ridge regression),有点类似最小二乘法

赋范向量空间与内积空间

若向量空间有定义良好的范数,我们称之为赋范向量空间(normed vector space)

前置知识:内积空间
内积是实或复向量空间中的一种数值函数,内积满足以下性质:

  • Hermitian 对称性: ⟨ x , y ⟩ = ⟨ y , x ⟩ ‾ \left\langle\mathbf{x},\mathbf{y}\right\rangle=\overline{\left\langle\mathbf{y},\mathbf{x}\right\rangle} x,y=y,x(上横线为共轭)
  • 共轭双线性:
    ⟨ x , y + z ⟩ = ⟨ x , y ⟩ + ⟨ x , z ⟩ \left\langle\mathbf{x},\mathbf{y}+\mathbf{z}\right\rangle=\left\langle\mathbf{x},\mathbf{y}\right\rangle+\left\langle\mathbf{x},\mathbf{z}\right\rangle x,y+z=x,y+x,z
    ⟨ x , c y ⟩ = c ⟨ x , y ⟩ \left\langle\mathbf{x},c\mathbf{y}\right\rangle=c\left\langle\mathbf{x},\mathbf{y}\right\rangle x,cy=cx,y
  • 正定性: ⟨ x , x ⟩ ≥ 0 \left\langle\mathbf{x},\mathbf{x}\right\rangle\ge 0 x,x0 ⟨ x , x ⟩ = 0 \left\langle\mathbf{x},\mathbf{x}\right\rangle=0 x,x=0当且仅当 x = 0 \mathbf{x}=\mathbf{0} x=0

满足上述条件的向量空间称为内积空间 (inner product space)
详见:内积的定义

在内积空间中,广义矢量范数也可定义于内积运算上: ∥ x ∥ = ⟨ x , x ⟩ \displaystyle \Vert\mathbf{x}\Vert=\sqrt{\left\langle\mathbf{x},\mathbf{x}\right\rangle} x=x,x
这就是说,内积空间是一个赋范向量空间

重要不等式

  • Hölder 不等式: ∣ x H y ∣ ≤ ∥ x ∥ p ∥ y ∥ q \displaystyle \vert\mathbf{x}^H\mathbf{y}\vert\le\Vert\mathbf{x}\Vert_p\Vert\mathbf{y}\Vert_q xHyxpyq(其中 p , q > 1 p,q>1 p,q>1 1 / p + 1 / q = 1 1/p+1/q=1 1/p+1/q=1

p = q = 2 p=q=2 p=q=2,Hölder 不等式退化为 Cauchy-Schwarz 不等式

  • Cauchy-Schwarz 不等式: ∣ ⟨ x , y ⟩ ∣ = ∣ x H y ∣ ≤ ∥ x ∥ ∥ y ∥ |{\left\langle\mathbf{x},\mathbf{y}\right\rangle}|=\displaystyle \vert\mathbf{x}^H\mathbf{y}\vert\le\Vert\mathbf{x}\Vert \Vert\mathbf{y}\Vert x,y=xHyx∥∥y(内积绝对值<=长度的乘积)
    由Cauchy-Schwarz 不等式可以导出三角不等式: ∥ x + y ∥ ≤ ∥ x ∥ + ∥ y ∥ \displaystyle \Vert\mathbf{x}+\mathbf{y}\Vert\le\Vert\mathbf{x}\Vert+\Vert\mathbf{y}\Vert x+yx+y

Hölder 不等式还可以用于证明Minkowski 不等式(“p范数下的三角不等式”)

  • Minkowski 不等式: ∥ x + y ∥ p ≤ ∥ x ∥ p + ∥ y ∥ p \Vert \mathbf{x}+\mathbf{y}\Vert_p\le\Vert\mathbf{x}\Vert_p+\Vert\mathbf{y}\Vert_p x+ypxp+yp

reference:
MIT 18.065—机器学习中的矩阵方法08 向量和矩阵的范数
赋范向量空间
向量范数
矩阵范数

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

矩阵理论| 基础:向量范数、赋范向量空间与内积空间、重要不等式 的相关文章

  • 产品管理精华:第一,谁是优秀的产品经理?

    34 人因为梦想而伟大 34 英格丽 褒曼 每个人的心中都有一个梦想 xff0c 梦想是美好的 xff0c 但是实现梦想的道路是曲折的 xff0c 无数人在实现梦想的道路上遭遇了无数曲折 xff0c 尽管如此 xff0c 他们依旧大步向前
  • 产品管理精华:第三,需求调研,从用户出发

    因为需要 xff0c 让我更加完美 佚名 产品经理都会遇到 客户 用户 这两个概念念 xff0c 它们谁更重要也一直争论不休 用户 近乎苛刻的需求可以不断产品体验和质量 xff0c 同时产品投入市场之后都会遇到变现这个问题 xff0c 总需
  • IBM LinuxONE Community Cloud 免费试用申请教程

    在某乎上看到IBM上可以免费使用VPS的福利 xff0c 正好这一时间需要一台CC服务器 xff0c 所以记录一下 xff0c 分享给各位 因为oralce 亚马逊一年的白嫖都用过了 xff0c 阿里白嫖一个月也到期了 xff0c 所以只要
  • 使用IPV6+DDNS连接内网主机

    0 前言 IPV6已经普及多年 xff0c 但是作为互联网用户好像并没有在实用性上有更多感受 xff0c 或者说IPV6并没有让普通用户感觉到改变 我作为网络从业者其实也没有过多关注 在工作中普遍遇到的还是基于IPV4的网络 xff0c 比
  • HFish蜜罐的介绍和简单测试(二)

    目录 1 HFish使用说明 1 1 部署模型 1 2 添加 删除节点 默认节点 新增节点 删除节点 1 3 添加 删除蜜罐 直接修改蜜罐服务 创建模板 xff0c 应用到多节点 1 4 查看攻击 2 卸载 2 1 卸载Linux管理端 2
  • HFish蜜罐的介绍和简单测试(三)

    目录 0 HFish平台管理 0 1 报告管理 0 2 系统配置 1 蜜铒配置 1 1 什么是诱饵 1 2 蜜铒使用场景 1 3 蜜标使用场景 诱饵定制 分发接口 告警信息 在学习蜜罐时 xff0c HFish是个不错的选择 首先是免费使用
  • 网工神器:PNETLab模拟器踩坑过程

    目录 0 前言 1 PNETLab介绍 2 下载安装 2 1 下载 2 2 导入 2 3 启动 2 4 注册和登录 3 汉化 4 镜像 5 下载实验 6 控制台 5 1 HTML控制台 5 2 默认控制台 7 总结 0 前言 由于工作需要
  • 无线攻击笔记

    第11章 无线攻击 任务50 xff1a 无线渗透 exe 802 11只涵盖了下面黄字部分的2层 xff0c 802 2定义了LLC层 802 11 下面的协议组 xff0c F是正式标准 xff0c 大写 xff0c abcde小写是在
  • Jumpserver入门介绍

    大多数的安全设备都接触过 xff0c 只有堡垒机没有深入了解 xff0c 所以一直想了解一下堡垒机的安装和使用 市面上好多商业化的物理设备堡垒机 xff0c 目前没有接触 xff0c 幸好有有开源的堡垒机 Jumpserver 今天安装测试
  • Centos 7.6 源码编译安装 MariaDB 10.5.9

    文章目录 准备工作创建用户和组创建数据库相关目录删除数据库相关文件 安装相关包安装依赖库安装编译包 编译安装 96 MariaDB 96 配置 96 MariaDB 96 本文主要记录如何在 CentOS 7 6 中编译安装 MariaDB
  • 如何打开LK打印信息

    diff git a apps proc bootable bootloader lk include debug h b apps proc bootable bootloader lk include debug h index 59e
  • Activity的onConfigurationChanged函数调用时序

    Activity的onConfigurationChanged函数调用时序 时序图如下 xff1a 注1 xff1a 向当前系统中所有处于激活状态的进程发送 CONFIGURATION CHANGED 消息 当该消息被 Applicatio
  • Button点击事件的三种实现方式

    Button控件表示按钮 xff0c 它继承自TextView控件 xff0c 既可以显示文本 xff0c 又可以显示图片 xff0c 同时也允许用户通过点击来执行操作 xff0c 当Button控件被点击时 xff0c 被按下与弹起的背景
  • 【校招】面试_华为_通用软件工程师_二面

    1 面试信息 面试形式 xff1a 视频面试 面试时间 xff1a 2020 03 25 11 30 00 AM 面试时长 xff1a 40分钟 面试职位 xff1a 软件技术开发部 通用软件工程师 xff08 无线网络产品线 通用软件开发
  • 杂项(2)-Ubuntu故障修复(1)-记一次Ubuntu GNOME3图形界面与tty均崩溃的修复

    本节目录 问题描述系统环境问题复现操作过程恢复tty的正常使用 xff08 玄学操作部分 xff09 基本操作原则笔者实际操作 xff08 仅供参考 xff09 修复图形界面 总结 问题描述 网络上有很多关ubuntu于图形界面 xff08
  • Linux kernel development

    这几天一直在读经典的linux入门书 Linux kernel development 第三版即LKD xff0c 这是我第一次读英文版的技术书 xff0c 颇有些高兴 之所以读 xff0c 一是因为学过操作系统的理论知识 xff0c 想看
  • Windows + Ubuntu双系统开机选择界面美化

    美化开机界面 1 下载主题2 进行安装 1 下载主题 GRUB主题网址 xff1a https www opendesktop org s Gnome browse cat 61 109 amp ord 61 latest 点击左侧GRUB
  • 程序员的成长之路

    1 初识编程 清楚的记得2008年上大学 xff0c 当时学的第一门编程语言是汇编语言 xff0c 第一堂课上 xff0c 老师就说这个学科的挂科率是最高的 xff0c 大家做好心理准备 xff0c 后来证明 xff0c 这并不是下马威 x
  • 数组每隔X项就插入一个新的元素

    算法为 span class token number 1 span 43 x index var arr span class token operator 61 span span class token punctuation spa
  • git提交到本地仓库了,但是分支却推送不上去怎么回退到提交之前的状态

    span class token comment 他可以使你把本地仓库的代码回到带储存区 span git reset span class token operator span soft HEAD span class token op

随机推荐