深度学习（DL/ML）学习路径

前言

最近几年，尤其是自从2016年Alpha Go打败李世石事件后，人工智能技术受到了各行业极大关注。其中以机器学习技术中深度学习最受瞩目。主要原因是这些技术在科研领域和工业界的应用效果非常好，大幅提升了算法效率、降低了成本。因而市场对相关技术有了如此大的需求。

我在思考传统行业与这些新兴技术结合并转型的过程中，亦系统的回顾了深度学习及其相关技术。本文正是我在学习过程中所作的总结。我将按照我所理解的学习路径来呈现各部分内容，希望对你亦有帮助。欢迎一起交流。

主要分为如下几个部分：

数学基础：包括微积分、线性代数、概率论等对理解机器学习算法有帮助的基本数学。
Python：Python提供了非常丰富的工具包，非常适合学习者实现算法，也可以作为工业环境完成项目。主流的深度学习框架，例如当前最流行的两个AI框架TensorFlow、PyTorch都以Python作为首选语言。此外，主流的在线课程（比如Andrew Ng在Coursera的深度学习系列课程）用Python作为练习项目的语言。在这部分，我将介绍包括Python语言基础和机器学习常用的几个Library，包括Numpy、Pandas、matplotlib、Scikit-Learn等。
机器学习：介绍主流的机器学习算法，比如线性回归、逻辑回归、神经网络、SVM、PCA、聚类算法等等。
深度学习：介绍原理和常见的模型（比如CNN、RNN、LSTM、GAN等）和深度学习的框架（TensorFlow、Keras、PyTorch）。
强化学习：介绍强化学习的简单原理和实例。
实践项目：这里将结合几个实际的项目来做比较完整的讲解。此外结合Kaggle、阿里云天池比赛来做讲解。
阅读论文：如果你追求更高和更深入的研究时，看深度学习各细分领域的论文是非常必要的。

绪论

机器学习绪论一文中总结了机器学习领域和其解决的问题介绍，建议先读此文，以便有一个系统认知。

数学基础

微积分和线性代数的基础是必须要掌握的，不然对于理解学习算法的原理会有困难。如果已经有一定的数学基础，可以先跳过这一部分，需要的时候再回来补。这里的Notes是基于Coursera中Mathematics for Machine Learning专题做的总结。

Python

如果有比较好的Python和机器学习相关Library的知识，对于学习算法过程中的代码可以快速理解和调试，一方面节省时间，另一方面也可以更聚焦在算法和模型本身上。

机器学习算法

主要基于Machine Learning (Coursera, Andrew Ng) 的课程内容。

机器学习算法系列
- 内容参考包括：吴恩达Coursera系列、周志华《机器学习》、密西根大学Applied Machine Learning in Python
- 每章节配套的[Jupyter Notebook练习](https://github.com/loveunk/ml-ipynb) 参考网络内容修订
目录结构：

深度学习

Deep Learning 专题课程

主要基于Deep Learning (Coursera, Andrew Ng) 的专题课程，介绍深度学习的各种模型的原理。

深度学习
1. 深度学习基础
  - 深度学习基础
2. 深度神经网络调参和优化
3. 深度学习的工程实践
  - 机器学习策略（1）
  - 机器学习策略（2）
4. 卷积神经网络（CNN）
5. 序列模型（RNN、LSTM）
6. 更多讨论（待补充）

深度学习框架：PyTorch

修订这段文字的时候已经是2023年，PyTorch无论是在工业界还是学术界，都已经碾压了其他的框架，例如TensorFlow、Keras。如果是入坑不久的朋友，我建议你直接学PyTorch就好了。其他框架基本上可以仅follow up即可。

[ PyTorch视频集合（32集）](https://www.bilibili.com/video/BV197411Z7CE/)
[ PyTorch的安装与Tutorial](https://zhuanlan.zhihu.com/p/60526007)
[ PyTorch 中文手册](https://github.com/zergtant/pytorch-handbook)
PyTorch 官网的Tutorial

分布式训练

[《分布式训练》](https://zhuanlan.zhihu.com/p/129912419)

大模型

综述：[ 2022 年中回顾｜大模型技术最新进展](https://zhuanlan.zhihu.com/p/545709881?theme=dark)

LLM 语言大模型

语言大模型（LLM）可以通过学习大量的语料来模拟人类语言处理的能力，如文本生成、翻译、问答等。相比普通的模型，LLM具有更高的准确性和更强的适用性。在最近几年，LLM取得了长足的发展，并在各种应用中取得了显著成果。LLM的发展有许多关键节点，下面列举几个重要的节点:

2014年，Google提出了Word2Vec模型，它能够将单词映射到一个低维向量空间中，并且能够在这个空间中表示单词之间的语义关系。这个模型为深度学习语言模型的发展奠定了基础。
2015年，Microsoft提出了LSTM(长短时记忆网络)，这个模型具有记忆能力，能够处理长文本序列。
2016年，OpenAI提出了GPT(Generative Pre-training Transformer)模型，这是一个预训练的语言模型，能够在大量语料上进行预训练，并且能够很好地解决各种语言任务。[](https://github.com/loveunk/machine-learning-deep-learning-notes/blob/master/img/bilibili32.png) GPT，GPT-2，GPT-3 论文精读
2018年，Google提出了BERT(Bidirectional Encoder Representations from Transformer)模型，这个模型能够同时利用上下文来理解词语，这个模型在NLP任务上取得了很好的效果。[](https://github.com/loveunk/machine-learning-deep-learning-notes/blob/master/img/bilibili32.png) BERT论文精读
2020年, GPT-3 (Generative Pre-training Transformer 3)模型发布, 它是一个预训练语言模型，具有175B参数, 能够完成各种复杂的语言任务。[](https://github.com/loveunk/machine-learning-deep-learning-notes/blob/master/img/bilibili32.png) GPT，GPT-2，GPT-3 论文精读
2022年，3月，推出了InstructGPT，是基于人工的对话样本对GPT-3做了微调后的模型。同时引入了reward模型，能给生成回复打分，利用强化学习对模型进一步微调，得到了一个13亿参数的模型，同时比GPT-3的性能更优秀。[](https://github.com/loveunk/machine-learning-deep-learning-notes/blob/master/img/bilibili32.png) InstructGPT论文精读
2022年，11月，OpenAI推出ChatGPT，直接出圈引爆了行业内外对大模型的关注。ChatGPT是基于GPT3.5，目前还没发布论文，据称其核心技术是和InstructGPT类似。
[语言大模型介绍 ](https://www.bilibili.com/video/BV1Hj41177fb), by Andrej Karpathy

LVM 视觉大模型

DINO-v2
SAM (Segment-Anything)

多模态 (MLLM/VLM)

随着语言大模型的发展，图文多模态领域从23年开始也获得了巨大的突破。其中BLIP-2架构巧妙的利用冻结的LLM和ViT，仅训练Adapter层的架构，成为后来图文多模态领域的主流。

[ BLIP-2](https://github.com/salesforce/LAVIS/tree/main/projects/blip2) （2023年1月发布）
[ InstructBLIP](https://github.com/salesforce/LAVIS/tree/main/projects/instructblip)（2023年5月发布）
[ Next-GPT](https://github.com/NExT-GPT/NExT-GPT) （2023年9月发布）
[ CogVLM](https://github.com/THUDM/CogVLM) （2023年10月发布）
[ LLaVA-1.5](https://github.com/haotian-liu/LLaVA/) （2023年10月发布）
[ Unified-IO 2](https://github.com/allenai/unified-io-2/)（2023年12月发布）

大模型微调

[ 微调 Mixtral-8x7b, QLoRA, 数据集ultrachat](https://colab.research.google.com/drive/1VDa0lIfqiwm16hBlIlEaabGVTNB3dN1A)
[ 微调LLaMA-2, LoRA, 数据集guanaco-llama2-1k](https://colab.research.google.com/drive/1PEQyJO1-f6j0S_XJ8DV50NkpzasXkrzd)

其他主题

视频理解

强化学习

Reinforcement learning (RL) is a type of machine learning, in which an agent explores an environment to learn how to perform desired tasks by taking actions with good outcomes and avoiding actions with bad outcomes. A reinforcement learning model will learn from its experience and over time will be able to identify which actions lead to the best rewards.

工欲善其事，必先利其器

一些相关工具

Jupyter环境：Google Colab：可参考[一篇介绍Google Colab的总结](https://zhuanlan.zhihu.com/p/57759598)
科学上网：《科学上网》

项目和竞赛

竞赛

Kaggle（全球赛、推荐的平台）
天池 - 阿里云（中国）

写在最后

一点建议

对于此前不是机器学习/深度学习这个领域的朋友，不管此前在其他领域有多深的积累，还请以一个敬畏之心来对待。

持续的投入：三天打鱼两天晒网的故事，我们从小便知，不多说了；
系统的学习：一个学科，知识是一个体系，系统的学习才可以避免死角，或者黑洞；
大量的练习：毕竟机器学习/深度学习属于Engineering & Science的范畴，是用来解决实际的问题的。单纯的理论研究，如果没有实际的项目（包括研究项目）经验做支撑，理论可能不会有很大突破

深度学习（DLML）学习路径