RelationNetwork论文笔记

RelationNetwork论文笔记

Abstract

作者提出了一个概念上比较简单,可行的,并且通用的few-shot learning的框架, 这个框架中分类器能够从新的的类别的很少的样本中认出新的类别。并且还可以应用到Zero-Shot learning上面去.

Introduction

Deep learning的办法在很多的识别任务中表现的比较好,但是这些任务都是有很多的标注好的数据训练的,而且模型参数也是比较多的,但是也是有缺点的,比如模型过大不容易在像手机这种小型的装置上部署,而且如果出现新的类别的话,而且可能在新的类别上面可能不是太好,比如稀有动物。但是人类却是可以在很少的样本的情况下将类似的任务做的很好的.于是就催生了few-shot (one-shot, zero-shot)learning的研究.

few-shot learning要解决的问题就是如何在样本很少的情况下能够识别好这些样本很少的类别.在人脸识别里面,我记得有个weight-normalization的技术就是为了解决在训练集中每个id的人的样本数目可能不均造成的影响.

相比于之前的基于RNN或者fine-tuning的技术的方法,作者的方法主要是基于一个有效的度量, 网络的结构图如下

avator

如图所示,这是一个5-way,1-shot,one-query example, 其中one-query中的这个图一定是和左边5个类中的其中一个是同类,但是并不是同一张图片. 这6张图片一起送入一个embedding module进行提feature, 然后将提到的feature都与query 提到的feature 按深度方向进行concat起来,之后送入一个relation module 这个module其实就是metric. 个人觉得最重要的就是这个 relation module的模块.

thoughts

从结构图中可以看出来,前面是提feature, 后面的是一个metric-module, 学到的就是一个有区分度的度量.

  • 和通常的分类的区别在哪里

比如通常的分类中,有10个类别, 每个类别有大量的图片去训练,这样训练好了之后的模型估计就是对这10个类别的一个好的分类器。但是设想一种场景,每个类别的数目都很少, 都是只有5张图,然后也是1000类,这样除了augment和正则化的办法防止过拟合之外的办法用这种relation-network的话就比较合理了.

  • 知乎上有一个详细地介绍

https://zhuanlan.zhihu.com/p/35379027

打赏,谢谢~~

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,多谢支持~

打开微信扫一扫,即可进行扫码打赏哦