2020-10-22-MAML论文

Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

ICML 2017

authors ： Chelsea Finn，Pieter Abbeel， Sergey Levine （University of California ,Berkeley； Open AI）

code url (official tf) : https://github.com/cbfinn/maml

code url (unofficial torch): https://github.com/dragen1860/MAML-Pytorch

被引用次数：2427

背景

解决小样本学习问题很有挑战 - > 利用元学习的方法框架

元学习学习到一个模型，这个模型可以在少量新数据中快速学习。

问题

前人通过学习update function或learning rule的训练方法，需要通过扩充模型的参数量或是限制模型结构（如限定RNN网络）等手段来提高准确率。

解决

model-agnostic：模型无关。

MAML可以认为是一个框架，提供一个meta-learner用于训练base-learner。这里的meta-learner即MAML的精髓所在，用于 learning to learn；而base-learner则是在目标数据集上被训练，并实际用于预测任务的真正的数学模型。

绝大多数深度学习模型都可以作为base-learner无缝嵌入MAML中，而MAML甚至可以用于强化学习中，这就是MAML中model-agnostic的含义

本文的想法是训练一组初始化参数，通过在初始参数的基础上进行一或多步的梯度调整，来达到仅用少量数据并且一次或几次的梯度更新就能快速适应新task的目的（能够有好的表现，小loss）。

为了达到这一目的，训练模型需要最大化新task的loss function的参数敏感度（maximizing the sensitivity of the loss functions of new tasks with respect to the parameters），当敏感度提高时，极小的参数（参数量）变化也可以对模型带来较大的改进。