纯新手入门机器/深度学习自学指南(附一个月速成方案)

2023-11-18

原作:Masum Hasan
问耕 编译整理
量子位 出品 | 公众号 QbitAI

怎么入门机器/深度学习?

回答这个问题,最先要考虑的问题是:你有多少时间?

准备用三个月入门,和想要一个月速成,肯定是截然不同的路径。当然我建议大家稳扎稳打,至少可以拿出五个月的时间来学好机器学习的基础知识。

基础很重要,知其所以然很重要。毕竟工具总在进步,每个月都会出现更好的深度学习技术,但基础知识是不变的。

如何用五个月时间入门?下面分三个部分,详细指南。(以及,如果你确实时间有限,最后还有一个速成指南)

五个月入门

Part 1:从机器学习开始(两个月)

最好的入门教程,就是吴恩达讲授的机器学习。吴恩达这套课程发布很久了,虽然有些地方稍微过时,但相信我,现在没有任何公开的课程,能比吴恩达讲得更好。真的,课程结束时我几乎哭了出来。

这个课程可以说适合任何水平的学生,当然,你最好还是得知道两个矩阵如何相乘,以及对编程有一些基本的了解。

这套课程可以前往Coursera学习,传送门:

https://www.coursera.org/learn/machine-learning

也可以上网易公开课收看,传送门:

http://open.163.com/special/opencourse/machinelearning.html

如果你有时间,一定要听完全部的课程。如果时间紧张,至少要听完前五节课程,后面的可以暂时跳过。

吴恩达的机器学习课程深入讲解了经典的机器学习模型,如线性回归、逻辑回归、神经网络、支持向量机、PCA、无监督学习等等。大部分重要概念,都以简单易懂的方式进行了介绍。

课程延伸

当你学习到第五节课,也就是开始讲述神经网络时,建议开始查看与课程平行的外部资料。比方3bule1brown推出的神经网络讲解视频。推荐必看。

YouTube传送门:

https://youtu.be/aircAruvnKk?list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi

或者可以前往B站查看:

http://space.bilibili.com/88461692/#/

这里给个示例:

以及,我觉得吴恩达在讲神经网络时有点快,所以建议补充阅读一些资料。比如有关神经网络和深度学习的在线书籍,免费的就很好了。

传送门:

http://neuralnetworksanddeeplearning.com/

作者Michael A. Nielsen以一种简单直观的方式,深入探究了神经网络的每个细节。建议阅读这本书的前两章,与吴恩达的课程并行。当你熟悉更多概念后,开始搞深度学习时,可以再看书中的其余部分。

如果你英文不好,这本《神经网络与深度学习》也有中文翻译版本,可以免费在线查看。

感谢译者,传送门在此:

https://tigerneil.gitbooks.io/neural-networks-and-deep-learning-zh/content/

这个部分的学习结束之后,你就能明白机器/深度学习的许多概念。最后推荐阅读Christopher Olah的博客,很有意思。

传送门:http://colah.github.io/

Part 2:涉足深度学习(1个月)

开始研究深度学习之前,最好重温一下大学数学。Ian Goodfellow传奇般的“花书”《深度学习》,简明扼要的概括了大部分重要主题。

建议大家尽可能深入地阅读线性代数、概率、信息理论的章节。每当读论文遇到深度学习概念时,都可以在书中找到参考。

以及,这本书有在线的版本。

例如英文版在此:

https://github.com/janishar/mit-deep-learning-book-pdf/blob/master/complete-book-bookmarked-pdf/deeplearningbook.pdf 。

而中文翻译版本在此:

https://github.com/exacity/deeplearningbook-chinese

关于深度学习的在线资料有很多,你可能会挑花了眼。

再一次,我觉得最好的选择,还是听吴恩达的《深度学习专项系列课程(Deep Learning Specialization)》。

Coursera传送门:

https://www.coursera.org/specializations/deep-learning

网易云课堂的传送门:

https://mooc.study.163.com/smartSpec/detail/1001319001.htm/

这门课程包括五大章节。其实不是免费的,你可以按照50美元/月购买。当然,如果你负担不起,还能申请“助学金”。申请时请详细阐明理由,处理的时间大概需要15天左右。

当然不付费,大部分内容都是可以看的。以及视频的部分,在很多地方也能免费收看。

这五门课程主要讲的是:

1、神经网络和深度学习(4周)

2、改善深度神经网络(3周)

3、结构化机器学习项目(2周)

4、卷积神经网络(4周)

5、序列模型(3周)

前三门课程涉及一般的神经网络和深度学习,第四、第五门课程涉及特定主题。如果你打算搞视觉,第四课必听;如果你搞NLP、音频等,第五课必听。但如果你需要听第五课,那么建议也把第四课好好听一下。

这里鼓励大家一下,课程里每周的内容,实际上一两天就能学完,所以不要被课程表吓倒。劳逸集合、提升效率。

学到这个地步,其实就可以再去http://neuralnetworksanddeeplearning.com/ ,查看第三到第六章的内容,来强化你的概念。如果你有什么还没搞懂的,请前往Olah的博客。

以及,这时候你要开始看深度学习的论文了,从中学习知识。深度学习有个强烈的特点,那就是内容都非常新,阅读论文是跟上时代唯一的方法。不想被抛下,那么还是养成阅读论文的好习惯吧。

Part 3:深度学习上手练(两个月)

学到这里,你应该对机器学习和深度学习中的大多数概念有了正确的理解,现在是时候投入沸腾的实际生活中了。

练手深度学习,最好的资源在fast.ai。

传送门在此:http://course.fast.ai/

他们在流行的深度学习工具PyTorch上构建了一个库,只需要几行代码,就能实现世界级的性能。

fast.ai的理念有点不同。吴恩达等老师的教授方法是自上而下,先讲再做。而fast.ai倡导自下而上,先做再讲。

所以在他们的课程中,第一节就带你建立一个强大的图像分类器。自己训练模型的快感,刺激着你去完成其余的课程。

除此以外,还要推荐两门课。

斯坦福大学的CS231n和CS224n。CS231n专注于计算机视觉的深度学习,而CS224n专注于序列建模。

CS231n,李飞飞等主讲。

官网传送门:http://cs231n.stanford.edu/

CS224n,目前是Richard Socher主讲。

官网传送门:http://web.stanford.edu/class/cs224n/

此前的课程,网上也有中文字幕版本,大家可自行搜索。

到这里,为期五个月的机器/深度学习入门就结束了。

希望大家都能稳扎稳打,夯实基础。

以及最后,兑现一个开头的承诺。如果你确实时间很紧张,必须尽快入门机器/深度学习,那么请看——

速成指南

我最多只有俩月

1、完成吴恩达机器学习课程的前五周,要做编程练习。

2、看完3Blue1Brown的视频。

3、完成吴恩达的深度学习专项系列课程,做练习。

4、如果你想搞图像,看专项课程第四讲,搞NLP或序列数据,看第五讲。

5、搜索你感兴趣的开源实现。如果你还没想好用什么语言,推荐Keras。然后根据需要,再迁到TensorFlow或者PyTorch框架。

我,只有一个月

想要在30天完成入门超级困难。除非,你只是想了解机器学习的工作原理,然后应用到自己的项目中。

如果是这样的话,速成建议如下:

1、略读吴恩达机器学习课程第1-5周的课程,只看视频,掌握概念即可。第三周可以跳过MATLAB/Octave课程。

2、看完3Blue1Brow的视频。

3、略读吴恩达深度学习专项系列课程的第一课,也就是神经网络和深度学习。

4、如果你想做图像处理项目,看一下Nielsen书中的第六章:http://neuralnetworksanddeeplearning.com/chap6.html

如果你需要序列建模的一些想法,可以看看Olah的博客:http://colah.github.io/posts/2015-08-Understanding-LSTMs/

5、Siraj Raval拍了很多有趣的视频,涉及大多数机器/深度学习的主题。传送门在此:https://www.youtube.com/channel/UCWN3xxRkmTPmbKwht9FuE5A

6、搜索跟你感兴趣的开源实现,随时调整以满足你的需求。如前所述,我推荐你先用带有TensorFlow后端的Keras语言。

其他资源

YouTube上有一个两分钟读论文的系列视频,可以帮你快速了解全球深度学习的最热门进展。

如果你关注进机器学习领域的进展,Twitter是个绝佳的工具。

遇到困境的时候,记得reddit和Facebook上有很多志同道合的人,不要犹豫,在社区里寻求帮助,大家会伸出援手。

结论

机器学习和深度学习是当今世界最具魅力的技术之一。而且这个领域的深度学习专家总是处于稀缺的状态。从职业前景来看,深度学习非常吸引人。

需要提醒的是,与计算机学科的其他领域不同,深度学习的资源还不够丰富。很多时候你会遇到失败挫折,千万不要灰心丧气,你可以向更多人寻求帮助,很多人都愿意伸出援手,大家都在学习。

关于机器/深度学习,有一个误解是需要计算机科学的背景才能学习。这不是真的,你确实需要一些编程的思维才好入手,但也仅限于此。现在机器学习领域的很多专家,都来自其他研究领域。

如果你有计算机科学的背景,这是一个非常好的开始。但如果你出身其他学科,想要迎头赶上并不难。

感谢看到这里。

如果你有任何问题或者建议,欢迎留言。如果你想直接跟本文热情的原作者联系,这里是传送门:

https://medium.com/@youngladesh/absolute-beginners-guide-to-machine-learning-and-deep-learning-7fa032944047

活动报名

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

纯新手入门机器/深度学习自学指南(附一个月速成方案) 的相关文章

  • C语言 在数组中找到和值为目标值的两个元素

    输入你的目标值target 就能找到相加为target的两个数了 自己输入一个数组 并且设定一个目标值 target 就能在数组中找到两个相加等于target的元素了 include
  • 基于linux的调试技术

    虽然使用printk函数可以很方便的将消息写入日志文件或者控制台 但是大量使用printk函数频繁的操作日志文件或者控制台文件会严重影响到linux驱动的开发性能 因此 这就需要linux驱动在开发阶段使用printk函数输出消息 在正式发
  • 解决“Pick up system reserved threshold 500ms because of config missing”

    skywalking启动日志一直刷 Pick up system reserved threshold 500ms because of config missing 如下图 原因缺少动态的配置项 skywalking支持动态配置的配置项如
  • 【总结】为什么对累积奖励减去baseline项能起到减小方差的作用?

    深度强化学习实验室 论坛 http deeprlhub com 来源 https zhuanlan zhihu com p 98506549 作者 风清云 很多论文的工作都专注于减少policy gradient的方差 以得到更加优质且稳定
  • TT100K数据集

    http cg cs tsinghua edu cn traffic sign data model code data zip
  • 字符转ASCLL码输出

    今天做EDA课程设计时 同学的串口通信程序涉及到字符和ASCLL码的转化 我看着他一个字符的对着ASCLL表 然后再敲进程序 真心急 想想都大三了 C语言都大一学的了 而现在经常遇到的问题 很多大学生都直接用非常笨的方法去弄 却不知道使用自
  • USB转串口那些事儿—USB转串口工作原理及应用

    一 简介 USB转串口即实现计算机USB接口到物理串口之间的转换 可以为没有串口的计算机或其他USB主机增加串口 使用USB转串口设备等于将传统的串口设备变成了即插即用的USB设备 USB虚拟串口应用特点 USB应用广泛 支持热插拔 传输速
  • Postman接口测试——我看过最详细+全面的文章教程了【转载】

    Postman简介 一般简单的接口测试我们可以直接在浏览器里面进行调试 但是涉及到一些权限设置的就无法操作了 因此我们需要接口测试的相关工具 Postman 是一个接口测试和 http 请求的工具 官网地址 https www getpos
  • Mac电脑花屏

    原因 GPU 加速导致 和电脑的独显有关 解决办法 打开谷歌浏览器 点击上图的三个点 选择设置 在高级设置中选择系统 关掉硬件加速模式
  • 十大优秀编程项目,让你的简历金光闪闪

    全文共3241字 预计学习时长6分钟 被问到如何学习编程时 最常听到的问题就是 有没有什么新项目的好点子 一些老套的答案有 做一个象棋游戏 或者 命令行界面 这些答案没有错 但这些例子不符合现代编程的需要 现代软件编写需要经常使用软件服务化
  • 【华为OD机试真题2023B卷 JAVA&JS】阿里巴巴找黄金宝箱(V)

    华为OD2023 B卷 机试题库全覆盖 刷题指南点这里 阿里巴巴找黄金宝箱 V 知识点数组哈希表滑窗 时间限制 1s 空间限制 256MB 限定语言 不限 题目描述 一贫如洗的樵夫阿里巴巴在去砍柴的路上 无意中发现了强盗集团的藏宝地 藏宝地
  • 尤克里里整理

    尤克里里 如何按弦 如何弹奏 带数字的四线谱 如何按弦 如何弹奏 带数字的四线谱 数字代表品格数 1就是1品 2就是2品 数字标记在几弦上面 就按住几弦的几品
  • 计算机毕设项目 大数据个性化音乐推荐算法分析

    文章目录 0 前言 1 研究目的 2 研究方法 2 1 传统推荐算法 2 2 基于LightGBM决策树模型的推荐算法 3 研究结论 0 前言 基于大数据个性化音乐推荐算法分析 提示 适合用于课程设计或毕业设计 工作量达标 源码开放 项目分
  • 告别卡顿,教你正确清理手机APP缓存垃圾,释放空间

    智能手机已经成为我们生活中不可或缺的重要工具 让我们随时随地保持联系 获取信息和娱乐 但是 使用过多的应用程序可能会导致手机变得缓慢并占用存储空间 这些应用程序产生大量的缓存和垃圾文件 如果不及时清理 将会影响手机的性能和速度 今天 我们将
  • 集团如何实现数字化转型?永洪BI助力由由集团

    随着 互联网 的边界不断拓宽 生活性服务业正驶入数字化转型快车道 中国信息通信研究院发布的 中国数字经济发展报告 2022 显示 2021年 我国数字经济发展取得新突破 数字经济规模达到45 5万亿元 占 GDP 比重达到39 8 三大产业
  • Chrome中安装扩展的三种方式

    chrome浏览器安装扩展有多种方式 请看以下介绍 1 从chrome网上应用商店安装 优雅法 在google chrome中打开chrome网上应用商店 https chrome google com webstore 搜索需要的扩展 在
  • 详解list.toArray(new String[0])

    List
  • 使用树莓派(raspberry pi)搭建网站(nginx+php+mysql+ddclient)

    标签 树莓派 raspberrypi php 网站 mysql 分类 Linux技术 最近在研究学习PHP 有时候想随时就学习 所以就决定搭建一个网站 随时可以进行学习 因为要24小时在线 要低功耗和安静 所以选择了树莓派 我们开始吧 ng
  • 四元素与旋转矩阵

    如何描述三维空间中刚体的旋转 是个有趣的问题 具体地说 就是刚体上的任意一个点P x y z 围绕过原点的轴 i j k 旋转 求旋转后的点P x y z 旋转矩阵 旋转矩阵乘以点P的齐次坐标 得到旋转后的点P 因此旋转矩阵可以描述旋转 x
  • 数据治理-数据质量-数据质量管理方法和工具

    常用质量管理工具 目前 在质量管理领域 有一系列常用的数据质量管理工具 主要分为传统的质量管理工具 新的质量管理工具和其他质量管理工具 传统的质量管理七大工具 传统的七种工具包含分层法 检查表 帕累托图 因果分析图 直方图 散布图 控制图

随机推荐

  • 2017最新整理深度学习神经网络算法全套

    https pan baidu com s 1cHGAv0 from groupmessage adapt pc fr ftw list path 2F
  • 基于node.js 实现百度ai人脸检测功能(api)

    基于node js 实现百度ai人脸检测功能 api 很有幸和老师同学们一起尝试学习百度ai的相关技术文档 自己做了一个很ez的人脸检测的小网页 和大家分享一下 百度ai技术文档 百度ai人脸检测技术文档 1 首先根据技术文档中的要求我们要
  • Object SLAM: An Object SLAM Framework for Association, Mapping, and High-Level Tasks 论文解读

    是一篇来自机器人顶刊T RO的文章 发表于2023 5 An Object SLAM Framework for Association Mapping and High Level Tasks 论文 An Object SLAM Fram
  • 问题十:关于application.loadlevel和SceneManager.LoadScene调用后新场景会变暗的问题

    根据百度贴吧的帖子 来到http answers unity3d com questions 919940 applicationloadlevel changes lighting for some rea html 这篇文章说他重新lo
  • Linux与Windows的常见差异

    Linux与Windows的常见差异 一 在Linux上顺理成章 换到Windows上就可能令人费解的事 二 一些Linux的使用技巧 三 一些Windows的使用技巧 一 在Linux上顺理成章 换到Windows上就可能令人费解的事 命
  • chatglm2外挂知识库问答的简单实现

    一 背景 大语言模型应用未来一定是开发热点 现在一个比较成功的应用是外挂知识库 相比chatgpt这个知识库比较庞大 效果比较好的接口 外挂知识库 大模型的方式可以在不损失太多效果的条件下获得数据安全 二 原理 现在比较流行的一个方案是la
  • 带宽和网速的关系是什么

    带宽和网速的关系是什么 带宽和网速的关系是 1Mbps 1024Kbps 1024 8KBps 128KB s 首先 运营商所说的200M宽带光纤 完整单位是200Mbps 而我们电脑中所说的下载速度单位是 MB 因此200M宽带下载速度并
  • ElasticSearch 的配置

    ElasticSearch 的配置 Elasticsearch 的配置同样遵循着 约定大于配置 的设计原则 用户可以选择使用群集更新设置API在正在运行的群集上更改大多数配置 也可以选择通过配置文件对Elasticsearch 进行配置 一
  • WinDbg内核调试命令

    1 查看寄存器 r r eax r gdtr 2 查看pcr pcr 3 查看idt表 idt 转载于 https www cnblogs com fanzi2009 archive 2009 05 27 1491144 html
  • 解决git clone后无法找到文件的问题(通过指定地址)

    今天从github上clone了代码 最后出来形如 但是话说我的东西下载到哪里去了呢 摸不着头脑 然后百度之 发现一般会放在命令行对应的路径下 也就是 win R gt cmd 查看命令行地址 然后去此路径下寻找之 果然在这里 那么 如何才
  • C++知识分享: Socket 编程详解,万字长文

    介绍 Socket编程让你沮丧吗 从man pages中很难得到有用的信息吗 你想跟上时代去编Internet相关的程序 但是为你在调用 connect 前的bind 的结构而不知所措 等等 好在我已经将这些事完成了 我将和所有人共享我的知
  • 解决Echarts默认值为NaN问题

    只需要将echarts的下面属性进行修改就可以了 我们可以在下面代码逻辑中添加自己的逻辑 tooltip trigger item formatter function params if params value return param
  • CSS样式中background-position:后的两个值代表什么?

    如果提供了两个值 第一个会决定距离左边缘的偏移 即水平位置 第二个值会决定图片从上边缘向下的偏移 即竖直的位置 例如 background position 5px 10px 则代表 背景图片向左偏移5px 向下偏移 10px
  • [创业-37]:公司的组织架构--所有者与决策机构(股东)

    目录 第1章公司的组织架构 1 1 什么是公司的组织架构 1 2 公司组织架构的类型 第2章 典型的上司公司组织架构 2 1 股东大会 2 2 董事会 2 3 监事会 2 4 总经理 补充 创始人 董事长 CEO 总裁 总经理的区别 第1章
  • PAT2-回形取数

    回形取数 qdulq 40 分 回形取数就是沿矩阵的边取数 若当前方向上无数可取或已经取过 则左转90度 一开始位于矩阵左上角 方向向下 输入格式 输入第一行是两个不超过200的正整数m n 表示矩阵的行和列 接下来m行每行n个整数 表示这
  • CSS 层叠上下文(Stacking Context)

    在网页制作的过程中 元素与元素之间的位置关系 在坐标轴上一般可体现为 X 轴 Y 轴和 Z 轴 对于 X 轴和 Y 轴的定位大多数开发都能比较直观的搞清楚 而 Z 轴 则相对较为模糊 或者说不能全面的理解Z轴的显示逻辑 大多数人都知道可以使
  • springboot 配置文件中属性变量引用方式@@解析

    这种属性应用方式是field name field value 两个 符号是springboot为替代 属性占位符产生 原因是 会被maven处理 所以应该是起不到引用变量的作用 方式可以引用springboot非默认配置文件 即其他配置文
  • 【01】OpenCV模块架构介绍+示例程序演示

    本系列文章是基于Windows下 结合Visual Studio2017和OpenCV4 7进行编写 使用C 代码进行演示 目录 1 OpenCV模块架构 2 示例程序效果展示 2 0创建工程 2 1边缘检测示例edge cpp 2 2K聚
  • 求学在卡梅

    卡内基梅隆大学坐落在美国宾夕法尼亚州匹兹堡市 对于卡梅 我同样慕名已久 清华大学的计算机学科在国内名列前茅 而卡内基梅隆大学计算机学院下属计算机 机器人和语言工程等几个系 和麻省理工 斯坦福 伯克利一起在计算机领域排名第一 1999年8月
  • 纯新手入门机器/深度学习自学指南(附一个月速成方案)

    原作 Masum Hasan问耕 编译整理量子位 出品 公众号 QbitAI 怎么入门机器 深度学习 回答这个问题 最先要考虑的问题是 你有多少时间 准备用三个月入门 和想要一个月速成 肯定是截然不同的路径 当然我建议大家稳扎稳打 至少可以