跳转至

机器学习进阶

此路线图适用于已经学过了基础机器学习 (ML, NLP, CV, RL) 的同学 (高年级本科生或低年级研究生),已经发表过至少一篇顶会论文 (NeurIPS, ICML, ICLR, ACL, EMNLP, NAACL, CVPR, ICCV) 想要走机器学习科研路线的选手。

此路线的目标是为读懂与发表机器学习顶会论文打下理论基础,特别是 Probabilistic Methods 这个 track 下的文章。

机器学习进阶可能存在多种不同的学习路线,此路线只能代表作者 Yao Fu 所理解的最佳路径,侧重于贝叶斯学派下的概率建模方法,也会涉及到各项相关学科的交叉知识。

必读教材

  • PRML: Pattern Recognition and Machine Learning. Christopher Bishop
  • AoS: All of Statistics. Larry Wasserman

这两本书分别是经典贝叶斯学派和经典频率学派的教材,刚好相辅相成。

字典

  • MLAPP: Machine Learning: A Probabilistic Perspective. Kevin Murphy
  • Convex Optimization. Stephen Boyd and Lieven Vandenberghe

进阶书籍

  • W&J: Graphical Models, Exponential Families, and Variational Inference. Martin Wainwright and Michael Jordan
  • Theory of Point Estimation. E. L. Lehmann and George Casella

如何阅读

Guidelines

  • 必读教材就是一定要读的教材
  • 字典的意思是,一般情况下不管它,但当遇到了不懂的概念的时候,就去字典里面查(而不是维基百科)
  • 进阶书籍先不读,先读完必读书籍。必读书籍一般都是要前前后后反复看过 N 遍才算读完
  • 读的过程中,最重要的读法就是对比阅读 (contrastive-comparative reading):同时打开两本书讲同一主题的章节,然后对比相同点和不同点和联系
  • 读的过程中,尽量去回想之前读过的论文,比较论文和教材的相同点与不同点

基础路径

  • 先读 AoS 第六章: Models, Statistical Inference and Learning,这一部分是最基础的科普
  • 然后读 PRML 第 10, 11 章
  • 第 10 章的内容是 Variational Inference, 第 11 章的内容是 MCMC, 这两种方法是贝叶斯推断的两条最主要路线
  • 如果在读 PRML 的过程中发现有任何不懂的名词,就去翻前面的章节。很大概率能够在第 3,4 章找到相对应的定义;如果找不到或者不够详细,就去查 MLAPP
  • AoS 第 8 章 (Parametric Inference) 和第 11 章 (Bayesian Inference) 也可以作为参考。最好的方法是多本书对比阅读,流程如下
    • 假设我在读 PRML 第 10 章的时候发现了一个不懂的词:posterior inference
    • 于是我往前翻,翻到了第 3 章 (Linear Model for Regression),看到了最简单的 posterior
    • 然后我接着翻 AoS,翻到了第 11 章,也有对 posterior 的描述
    • 然后我对比 PRML 第 10 章,第 3 章,AoS 第 11 章,三处不同地方对 posterior 的解读,比较其相同点和不同点和联系
  • 读完 PRML 第 10 和 11 章之后,接着读 AoS 第 24 章 (Simulation Methods),然后把它和 PRML 第 11 章对比阅读 -- 这俩都是讲 MCMC
  • 如果到此处发现还有基础概念读不懂,就回到 PRML 第 3 章,把它和 AoS 第 11 章对比阅读
  • Again,对比阅读非常重要,一定要把不同本书的类似内容同时摆在面前相互对比,这样可以显著增强记忆
  • 然后读 PRML 第 13 章(跳过第 12 章),这一章可以和 MLAPP 的第 17, 18 章对比阅读
  • MLAPP 第 17 章是 PRML 第 13.2 章的详细版,主要讲 HMM
  • MLAPP 第 18 章是 PRML 第 13.3 章的详细版,主要讲 LDS
  • 读完 PRML 第 13 章之后,再去读 PRML 第 8 章 (Graphical Models) -- 此时这部分应该会读得很轻松
  • 以上的内容可以进一步对照 CMU 10-708 PGM 课程材料

到目前为止,应该能够掌握

  • 概率模型的基础定义
  • 精准推断 - Sum-Product
  • 近似推断 - MCMC
  • 近似推断 - VI

然后就可以去做更进阶的内容