一、什么是机器学习
Machine Learning = Looking for Function 寻找函数!
二、深度学习Deep Learning
类神经网络的函数。
函数输入有向量、矩阵、序列等;函数出有连续值、类别、文本、图片等。
三、学习分类
1. 监督学习 Supervised Learning
训练数据+标记。
常见的有回归Regression、分类Classification、结构化学习Structure Learning。
2. 无监督学习
3. 强化学习Reinforcement Learning
用于不知道如何标注资料的时候。
例如下围棋、象棋、飞行器等。
4. 自监督学习 Self-Supervised Learning
从没有标注的数据上先进行预训练Pre-train。
基础模型Foundation Model,常用的有BERT。
适用于下游任务。
5. 生成对抗网络Generative Adversarial Network
只需要收集到数据和标签,不必关心关联,而由网络自动关联。
例如读大量的语言和文本而不必有关联,从而实现语言识别。
6. 异常检测Anomaly Detection
机器能够回答我不知道。
面对自己不知道的东西进行异常的标注。
7. 可解释性AI Explainable AI
DL具有不可解释性。
8. 模型攻击Model Attack
适用加噪的数据进行模型的测试从而使得模型判断错误。
9. 迁移学习-领域自适应Domain Adaptation
当我们的测试数据不同于我们的训练数据。
如何调整我们的模型。
10. 网络压缩Network Compression
11. 终生学习Life-Long Learning
12. 元学习Meta Learning
让机器学会如何学习。
不再是人类设计算法,而是机器自己学习算法。
Few-shot Learning小样本学习是一种元学习的例子。
四、一般过程
1.构建含有未知参数的模型(函数)
权重、偏置等。
2.定义损失函数
损失评估的当前参数数值的好坏。
损失函数有均方误差、绝对值误差等。
3.最优化问题
让损失函数最小。
方法:梯度下降。
由于局部最小值和全局最小值的问题,在GD下又有许多优化的优化算法。
常用的有Adam。
还可以调节学习率、正则化项等超参数。
结束条件:设定更新epochs、更新量小于某一个阈值。
4.模型评估
包括模型在训练集上的评估、测试集上的评估。
五、神经网络的本质
神经网络就是无限逼近一个能够解决问题的函数。

将上边的过程使用矩阵写出来,式子就变成了:


接着进行梯度下降,即使用反向传播:

其中的sigmoid、ReLu等被称为激活函数。
深度学习:

当层数过多的话又会出现过拟合的问题。
六、深度学习的历史
感知机(1958)→ 多层感知机(1980s) → 反向传播(1989) → GPU(2009)…
七、网络架构
1.全连接前馈神经网络
输入层、隐藏层、输出层。