PR&ML之路

2023-05-16

先写篇初稿吧

12年读研,我初次接触到机器学习模式识别(PR&ML)这个方向。当时PR&ML绝对不像今天这么火,甚至时至今日,大家也只是知道人工智能,不知道人工智能再次兴起与PR&ML有什么关系。无所谓,不研究这些确实不需要了解这些,但是如果你想入坑PR&ML,现在确实是好时机:打开网页,输入关键词“机器学习”、“模式识别”、“神经网络”、能得到太多相关文献、博客、书籍的介绍,这大大降低了学习难度,加速了学习进度。当时我花费几个月甚至几年时间都找不到的答案,现在到处都是,以至于不知道看哪些好。但是多总比少,甚至没有强。从我入坑到今天,积攒了一些学习经验、资料,拿来分享。多数资料都是我看过的,觉得不错的,各位在学习过程中如果产生了和我相似的疑问,可以对号入座,看一下相关资料,或许可以解决你一直以来的疑问。总结一句话,学这个方向,不能急,因为随便一个问题都不容易短时间理解透彻,需要长时间消化感悟。行文无条理,想到哪里写哪里,务怪。

(题外话:现在很多人在学习PR&ML,尤其是深度学习及其相关领域,工业界学术界也都疯似的入坑Deep Learning,好像只要和Deep挂上勾就很高大上。不过最近有人也在唱衰DL,于是有人开始问到底要不要入坑?其实,这些摇摆的人都是有投机心理的啦,真正喜欢这个领域的,甚至以此为自己的研究方向的人,不管PR&ML是否衰落,都会继续这一方向的研究,直至再次将它推向浪潮之巅)

1. 基本运算:向量、矩阵对标量求导,函数式对向量矩阵求导是个什么玩意?

对于初学者,你应该会有这样的疑问吧?课本上从来没出现过这些运算,你也不太可能从所学教材里找到相关介绍。甚至你会对满页的用向量矩阵表示的运算感到反感,因为你看惯了标量直接表示的加减乘除运算,突然换用矩阵向量来表示,极其不适应。为什么非得用向量矩阵表示这些运算?向量、矩阵到底是谁发明的,为什么它们有这么神奇的能力?

如果你有过上述疑虑,不能怪你,只能说在从基础教育转向研究型教育上,教材或引导有断层。向量、矩阵对标量甚至对矢量求导本质上都是按照一定的规则对标量的求导,只是这个规则没有严格的界定,只是约定俗成。例如y=\bold{w}^T\bold{x}y是标量,\boldsymbol{\mathbf{w}}=[w_1,w_2,...,w_n]^T,\boldsymbol{\mathbf{x}}=[x_1,x_2,...x_n]^T均为列向量,那么y\boldsymbol{\mathbf{w}}求导本质上是y分别对w_1,...,w_n求导,然后将求导结果按照一定的规则排列成向量,一般按照分母布局排列,即对谁求导就按其方式排列,这样得到的结果就是\bold{x}

这一部分的疑问请详细看资料:闲话矩阵求导

至于搞机器学习或其他研究都要用矩阵向量来表示相关问题,这其实就是方便问题的表述,运算。你或许会疑问,为什么感觉用矩阵向量表示后,感觉问题的表述并不只管,分析求解也没觉得方便,这只是一种错觉,习惯而已。用多了,熟悉了就能感觉到向量、矩阵运算的威力。推荐一个公众号马同学高等数学,或从网上搜索他的文章,写的很只管易懂,不仅仅是关于矩阵的介绍。

最后,规则很不容易记住,那平时遇到矩阵求导相关问题怎么办?有一本小册子,The Matrix Cookbook,pdf 可供参考。

2. PCA的原理是什么?SVD又是什么?

PCA与大学线性代数中矩阵的特征分解有关,PCA即主成分分析,可以从一堆数据中提取出能表示数据主要特征的成分,非常神奇,刚开始接触这一算法极其不理解为什么通过对数据的协方差矩阵进行特征分解提取top k特征值对应的特征向量就可以用他们作为基描述数据主要特征,非常困惑呀...直到看了文章pdf ,还有这篇。现在,你也可以看Andrew Ng的机器学习视频来理解PCA的推导。事实上,PCA还有很多不同的解释,应用,各位可以自己去搜索。SVD与PCA同样都属于“矩阵分解”范畴,SVD可以对非方阵进行分解,其分解同样具有很好的直观解释性,很重要,考试经常考...一个直观的例子解释,还有这篇。矩阵分解是PR&ML里的一个重要方向,大家可以搜索其他文献了解最新进展。

3. 运筹学、优化问题

除了需要掌握线性代数、概率统计的知识外,还需要懂一些凸优化、非线性优化,运筹学等知识。如果想成为PR&ML领域的大牛,优化是你绕不过去的槛。所有PR&ML的问题最终都得靠这部分知识求解,没办法,死磕吧。这部分内容就没办法一一介绍了,但是你碰到的问题,如线性优化方法单纯型、凸优化,牛顿迭代,拟牛顿迭代,对偶理论,KKT条件等等,在下面列举的材料里一般都能找到细致入微的讲解,而且是我遇到的介绍的比较细致的材料,强烈推荐。

1. A toturial on convex optimization

2. Convex Optimization Overview

3. Convex Optimization-Stephen Boyd

4. Optimization-Richard Weber

5. An Introduction to the Conjugate Gradient Method Without the Agonizing Pain(共轭梯度)

6. Introduction to numerical continuation methods-Allgower E.L., Georg K-Colorado-1990

7. Introduction to Operations Research-Frederick S Hillier 9th Edition

8. Linear and Nonlinear Optimization Second Edition

9. Numerical Optimization

10. KKT_Condition

11. 从对偶问题到KKT条件

4. 傅里叶变化小波分析

这部分对于非数学专业的人来说也是一大难点。关于傅里叶变化,看神文,关于二维傅里叶,如图像傅里叶变化更直观的物理解释一直没找到合适的资料,有知道的欢迎留言。

小波分析有本上课时老师推荐的书,难度不小

5. 概率图

这里的内容比较权威的书籍是Daphne Koller的《Probabilistic Graphical Models: Principles and Techniques》,此书已由王飞跃教授翻译为中文版。另外,网上也有授课,难度不小。这部分内容涉及马尔科夫链、网、最大熵、条件随机场、贝叶斯网等等经典的机器学习模型,值得每一位入坑的人了解。

6. 信息论基础

机器学习部分涉及到的信息学的知识主要是围绕“熵”展开的,如衡量两个分布差异的交叉熵等,相关内容从下文推荐的书里了解即可。

7. 图像视频目标检测分割分类等

这部分内容实在太庞大了,尤其是今天,相关内容更新非常快,建议直接阅读文献。搜索资源IEEE、Elsevier、ACM等。

一本通过马尔科夫进行图像分析的图书

8. 吉布斯采样

为什么把吉布斯采样单独拿出来,因为这篇文章是我看到的最易懂的,写的太好了,所以重点分享

9. 高斯分布

高斯分布的重要性不言而喻,分享一篇《正态分布的前世今生》同样是靳志辉同志写的

10. 谱分类

A Tutorial on Spectral Clustering

11.稀疏表示

1. A survey of sparse representation: algorithms and applications

12. 流行学习

待整理...欢迎推荐

13. 低秩

欢迎推荐...

14. 算法及应用

1. 拼写错误检测更改链接

2.曾经的王者:支持向量机SVM,深度学习之前,SVM是扛把子。而且学习、理解并尝试实现SVM对你入门机器学习帮助很大,是接触优化理论的一个很好的入门例子。

 

END:机器学习教材推荐

0. 吴军《数学之美》,全文几乎无公式,讲解深入浅出,非常适合机器学习入门

1. 周志华西瓜书《机器学习》,内容较新适合初学者

2. 李航蓝皮书《统计学习方法》,最可贵的,书中好多例子,学过就能上代码呀

3. BISHOP《Pattern Recognition and Machine Learning》,大神之作,至少大三再看吧

4. Bengio《Deep Leaning》(虽是讲深度学习,但涉及面很广泛)

 

先这样吧,得干活了...

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

PR&ML之路 的相关文章

  • AT&T语法

    在linux内核编写中 为了维持与gcc输出汇编程序的兼容性 as汇编器使用AT amp T系统的V的汇编语法 下面简称为AT amp T语法 这种语法与Intel汇编程序使用的语法 简称Intel语法 很不一样 他们之间的主要区别有以下几
  • ESP实验02-读取DS1307&eerom34c32

    1 模块介绍 本实验主要用到两个模块 esp32 tinyRTC 模块的图片如下所示 xff1a esp32模块型号为ESP32Devkitc v4 xff0c 是启明云端官方的开发板 与乐鑫官方的完全一致 xff0c 引脚顺序 xff0c
  • 虚拟化技术介绍 & hypervisor简介

    什么是虚拟化 xff1f 虚拟化 xff08 英语 xff1a Virtualization xff09 是一种资源管理技术 xff0c 是将计算机的各种实体资源 xff0c 如服务器 网络 内存及存储等 xff0c 予以抽象 转换后呈现出
  • AUTOSAR E2E & SecOC Comparison

    AUTOSAR E2E amp SecOC Comparison 前面已经介绍过了E2E 和 SecOC CMAC 了 xff0c 既然2者都可以进行数据完整性保护 xff0c 那么2者有什么区别呢 下面基于我的经验所总结 欢迎补充 xff
  • [Machine Learning & Algorithm] 随机森林(Random Forest)

    1 什么是随机森林 xff1f 作为新兴起的 高度灵活的一种机器学习算法 xff0c 随机森林 xff08 Random Forest xff0c 简称RF xff09 拥有广泛的应用前景 xff0c 从市场营销到医疗保健保险 xff0c
  • OpenGL进阶 | GLM数学库& Shader相关

    一 GLM数学库 OpenGL和DirextX不一样 xff0c 没有内置的数学库 xff0c 于是我们需要找一个第三方数学库来完成OpenGL相关的数学计算 GLM库是一个为OpenGL准备的数学库 xff0c 它提供了各种数学运算的函数
  • 时空行为检测数据集 JHMDB & UCF101_24 详解

    文章目录 0 前言1 JHMDB1 1 基本情况1 2 数据准备以及标签详解 2 UDF101 242 1 基本情况2 2 数据准备与标签详解 3 数据集可视化代码 0 前言 现在常用的时空行为检测数据集只有AVA JHMDB UCF101
  • 【浅墨著作】《逐梦旅程:Windows游戏编程之从零开始》勘误&配套源代码下载...

    I 39 m back 恩 xff0c 几个月不见 xff0c 大家还好吗 xff1f 这段时间真的好多童鞋在博客里留言说或者发邮件说浅墨你回来继续更新博客吧 woxiangnifrr童鞋说每天都在来浅墨的博客逛一下看有没有更新 xff0c
  • 2013&2014

    2013总结 2013 毕业了 xff0c 算是正式工作半年 xff0c 2013年7月开始 xff0c 算是我的生活 xff0c 工作之外的时间都是自己的 一 收获 1 压力测试 差不多算是一个月的时间 xff0c 疯狂的一个月 xff0
  • 传感模块:MATEKSYS Optical Flow & LIDAR 3901-L0X

    传感模块 xff1a MATEKSYS Optical Flow amp LIDAR 3901 L0X 1 模块介绍2 规格参数3 使用方法Step1 接线方式Step2 安装方式Step3 使用范围 4 存在问题 思考 4 1 MATEK
  • 【STM32】 利用paho MQTT&WIFI 连接阿里云

    ST联合阿里云推出了云接入的相关培训 xff08 基于STM32的端到端物联网全栈开发 xff09 xff0c 所采用的的板卡为NUCLEO L4R5ZI板 xff0c 实现的主要功能为采集温湿度传感器上传到阿里云物联网平台 xff0c 并
  • STM32调试方式JTAG&SWD的区别

    在学习STM32时 xff0c 我们经常会遇到JTAG和SWD的调试方法 xff0c 还涉及到Jlink Ulink Stlink等 xff0c JTAG和SWD是ARM板一种调试模式 后面三种都是实现这种模式的一种工具 xff0c 他们之
  • 【STM32学习】——USART串口数据包&HEX/文本数据包&收发流程&串口收发HEX/文本数据包实操

    文章目录 前言一 数据包格式 xff08 江科大规定 xff09 1 HEX数据包2 文本数据包3 两者对比 二 数据包收发流程1 HEX数据包接收 xff08 只演示固定包长 xff09 2 文本数据包接收 xff08 只演示可变包长 x
  • 无人机拉力测试台研制&测试过程中的9个关键技术点

    随着近年来无人机行业的飞速迭代发展 xff0c 越来越多的相关从业人员选择使用拉力测试台来测试并优化无人机的动力系统 xff0c 本文尝试从无人机拉力测试台的研制和使用角度来阐述无人机拉力测试中的9个关键技术点 1 电磁干扰方面的考虑 测试
  • ROS速成之发送&接收消息

    人真的老了 xff0c 扔了个周末 xff0c 完全不记得干了什么 论纪录的重要性啊 xff0c 当时觉得明白的很 xff0c 你扔两天试试 xff1f 扔一年试试 xff1f 扔几年试试 xff1f 最近参加的各种项目脑疼眼乏 xff0c
  • 最简单的 DRM 应用 & drm设备不工作

    https zhuanlan zhihu com p 341895843 https zhuanlan zhihu com p 75321245 编写最简单的 DRM 应用 主程序 xff1a int main int argc char
  • 超声波传感器(CH101&ch201) - Ⅱ

    文章目录 1 前言 2 目前官方发布的Horn有以下几种 3 超声波TOF传感器 VS 红外线传感器 4 开发评估套件 1 前言 上一篇简单的引入了CH101 CH201 这两种传感器 这种传感器使用的时候除了需要芯片外 还需要一个声学的
  • BMP085气压传感器驱动 &MS5611经验

    BMP085是新一代的小封装气压传感器 主要用于气压温度检测 在四轴飞行器上可以用作定高检测 该传感器属于IIC总线接口 依然沿用标准IIC驱动程序 使用该传感器需要注意的是我们不能直接读出转换好的二进制温度数据或者气压数据 必须先读出一整
  • ECCV 2022 | 清华&腾讯AI Lab提出REALY: 重新思考3D人脸重建的评估方法

    作者丨人脸人体重建 来源丨人脸人体重建 编辑丨极市平台 极市导读 本文围绕3D人脸重建的评估方式进行了重新的思考和探索 作者团队通过构建新数据集RELAY xff0c 囊括了更丰富以及更高质量的脸部区域信息 xff0c 并借助新的流程对先前
  • 数据库防火墙&数据库加密与脱敏&数据泄露防护

    写在最前 xff1a 安全产品系列目录 xff1a 目录 amp 总述 数据库防火墙 解决数据库应用侧和运维侧两方面的问题 xff0c 是一款基于数据库协议分析与控制技术的数据库安全防护系统 主动防御 xff0c 实现数据库的访问行为控制

随机推荐

  • js前端实现语言识别(asr)与录音

    js前端实现语言识别与录音 前言 实习的时候 xff0c 领导要求验证一下在web前端实现录音和语音识别 xff0c 查了一下发现网上有关语音识别也就是语音转文字几乎没有任何教程 其实有一种方案 xff0c 前端先录音然后把录音传到后端 x
  • [Nice_try]python基础学习笔记(六)

    六 函数 局部变量 全局变量 6 1 1函数的概念 将特定功能的代码集成到一个模块中 xff0c 在需要调用的时候进行调用 可以防止内容的重复编写 6 1 2函数的定义 span class token keyword def span 函
  • 论文写作感悟

    以下是学习论文写作课程之后的一些感悟以及收获 xff0c 总结如下 xff1a 关于格式 xff1a 1 在写论文的过程中 xff0c 使用LaTeX排版系统能够让论文显得更加专业 xff0c 而且对公式 排版的处理会更加美观 2 在论文中
  • 软件工程概论第一次作业

    习题 一 单项选择 1 软件是计算机系统中与硬件相互依存的另一部分 xff0c 它是包括 1 B 2 A 及 3 D 的完整集合 其中 xff0c 1 B 是按事先设计的功能和性能要求执行的指令序列 2 A 是使程序能够正确操纵信息的数据结
  • Java递归发实现Fibonacci数列,尾递归实现Fibonacci数列,并获取计算所需时间

    递归法计算Fibonacci数列 xff1a 它可以递归地定义为 xff1a 第n个Fibonacci数列可递归地计算如下 xff1a int fibonacci int n if n lt 61 1 return 1 return fib
  • apache-options配置之Indexes

    配置 Options Indexes FollowSymLinks Indexs的配置的作用是如果不存在Index html文件的时候 xff0c 将该目录下的文件树列出来 一般在线上使用
  • gcr.io和quay.io拉取镜像失败

    k8s在使用编排 xff08 manifest xff09 工具进行yaml文件启动pod时 xff0c 会遇到官方所给例子中spec containers image包含 xff1a quay io coreos example gcr
  • yacs直接读取yaml文档(python)

    yacs在我理解是一种读写配置文件的python包 在机器学习领域 xff0c 很多模型需要设置超参数 xff0c 当超参数过多时 xff0c 不方便管理 xff0c 于是出现了很多类似yaml xff0c yacs的包 关于yacs的使用
  • 基于Gensim的Word2Vec增量式训练方法

    Word2Vec训练好以后 xff0c 随着时间的积累 xff0c 出现一些新词 xff0c 此时可能需要在已有的模型基础上重新训练 xff0c 以补充这些新词汇 xff0c 亦即增量式训练 本文分析了基于Gensim的Word2Vec的增
  • Numpy/Pytorch中函数参数dim/axis到底怎么用?

    numpy或pytorch中很多函数可指定参数dim或axis 例如sum函数 xff0c dim 61 0或dim 61 1是对矩阵列 行进行求和 xff0c 时间久了 xff0c 就搞混了 xff0c 如果是高维array tensor
  • Tensorflow中截断高斯分布(truncated norm)采样的python实现

    Tensorflow中可调用函数tf truncated normal来进行截断高斯分布的采样 什么是截断高斯分布 xff0c 看下图 xff0c 分布在 0 1和0 1处被截断了 xff0c 具体如下 import tensorflow
  • tf.contrib.image.transform与opencv中PerspectiveTransform

    tensorflow中tf contrib image transform函数可对图像做透视变换 xff0c 用法如下 读取图像 img 61 cv2 imread 39 home xp1 Pictures 004545 jpg 39 in
  • 转:模式识别 机器学习 计算机视觉 相关资料 论坛 网站 牛人...

    转自 http www cnblogs com kshenf archive 2012 02 07 2342034 html 常用牛人主页链接 xff08 计算机视觉 模式识别 机器学习相关方向 陆续更新 xff09 牛人主页 xff08
  • 李航统计学习方法EM算法三枚硬币例子Q函数推导

    具体推导如下 xff1a 上面推导省略了第i次迭代的i的标记 当得到上式以后 xff0c 可以参考 http www cnblogs com Determined22 p 5776791 html 来继续一下推导 当然 xff0c 参考博客
  • 李航博士-统计学习方法-SVM-python实现

    下面的代码是根据李航博士 统计学习方法 一书写的SVM的实现 还有些问题 xff0c 贴出来大家给些建议 usr bin env python2 coding utf 8 34 34 34 Created on Thu Oct 19 16
  • web客户编程,开发一个注册页面

    用html开发一个注册页面 xff0c 检验注册格式是否正确 Register html lt html gt lt head gt lt style type 61 34 text css 34 gt 64 import url Css
  • windows下GDAL及python接口编译过程注意事项

    Window下编译GDAL的方法在网上已经能搜到很多了 xff0c 例如http blog csdn net zhoubl668 article details 6641027 但是在实际操作中还是碰到些问题 xff0c 现在把注意事项写下
  • Matrix67:什么是P问题、NP问题和NPC问题

    前记 本想写一篇介绍P xff0c NP xff0c NPC xff0c NP hard问题的文章 xff0c 搜索了一下 xff0c 看到了Matrix67写的这篇 xff1a 什么是P问题 NP问题和NPC问题 文章写的非常清晰易懂 x
  • (转)从CNN到GCN的联系与区别——GCN从入门到精(fang)通(qi)

    转载于 xff1a 博客 1 什么是离散卷积 xff1f CNN中卷积发挥什么作用 xff1f 了解GCN之前必须对离散卷积 xff08 或者说CNN中的卷积 xff09 有一个明确的认识 xff1a 如何通俗易懂地解释卷积 xff1f 这
  • PR&ML之路

    先写篇初稿吧 12年读研 xff0c 我初次接触到机器学习模式识别 xff08 PR amp ML xff09 这个方向 当时PR amp ML绝对不像今天这么火 xff0c 甚至时至今日 xff0c 大家也只是知道人工智能 xff0c 不