Skip to content

Latest commit

 

History

History
65 lines (45 loc) · 3.14 KB

README.md

File metadata and controls

65 lines (45 loc) · 3.14 KB

DL-notes

人工智能

人工智能三驾马车:

  1. 算法:机器学习(本文探讨点)
  2. 算力:芯片
  3. 大数据

机器学习

机器学习是实现人工智能的重要算法,深度学习是以深度神经网络解决问题的机器学习方法

分类

  1. 设定范围
    • 传统机器学习:线性回归、逻辑回归、决策树...
    • 深度神经网络:CNN(resnet、mobilenet)、RNN、transformer...

notes:也就是常说的模型。这里的分类依据是设定范围,也是最常被人们提到的机器学习方法分类。注意更规范的写法应该是深度神经网络与线性回归等同级,由于其内容过于庞大,所以将其他的方法统一归类到传统机器学习中了。其次,传统机器学习基本只能处理分类和回归问题,而深度学习能处理更复杂的问题。

  1. 设定标准
    • 监督学习
    • 半监督学习
    • 无监督学习(自监督学习)
    • 强化学习:只给好或差的评价

notes:也就是常说的损失loss。考虑的问题是怎么衡量模型输出与预期的差异。

  1. 达成目标
    • 传统优化算法:遗传算法等
    • 深度学习优化:梯度下降+反向传播

notes:也就是常说的优化器。

  1. 输出内容
    • 判别式模型:随机森林、SVM、经典DNN(CNN、RNN、transformer)...
    • 生成式模型:朴素贝叶斯、隐马尔可夫、GAN、VAE...

notes:生成式模型旨在学习数据的联合概率分布,即同时模拟观测数据和标签的分布。判别式模型专注于学习从输入数据到输出标签的条件概率分布。个人感觉生成式模型例如GAN与VAE不一定就和DNN完全没有关系,GAN和VAE的backbone其实也是DNN,特殊点在于训练的思想。而判别式模型主要的任务就是回归和分类,也就是用作回归和分类的DNN。

  1. 应用领域
    • 计算机视觉(CV)
    • 自然语言处理(NLP)
    • 生成式人工智能(AIGC)
    • 多模态

这里用一个表格来梳理一下

CV NLP AIGC
高级视觉任务 分类 分类 文生文llm gpt llama
检测 翻译 文生图 sd midjourney delle
分割 对话 文生音 tts
低级视觉任务 超分 文生视频 sora imagen video runway
去噪
增强

notes:这里的AIGC也不能完全与CV以及NLP解耦。实际上,AIGC是利用大模型的能力,将一部分以前实现的效果不好的,或者以前不能实现的CV以及NLP任务进行了提升,但是由于其很火热,所以单独作为一个类别。其次,AIGC往往需要多模态的能力。

  1. 其他

这里不太容易将某种思想归类至某一个下面,例如残差学习、BN、cross entropy loss等,但是却是跨很多领域都能用到的东西。