Siamese Neural Networks for One-shot Image Recognition

Siamese Neural Networks for One-shot Image Recognition

paper 理解

  • motivation

学习好的feature,即特征的表示能力是各种应用中都非常看重的,当数据量足够的时候可以通过巨大的数据量来训练模型,而当数据量很小时,任务就变得困难,因此探究在少数据量的情况下也能学到不错的feature 表示能力就显得非常重要了。

  • oneshot learning 每个类别仅仅有一张样本

  • zero shot learning 模型可能从来没见过该类别的样本

  • 网络结构

非常容易懂,感觉是可以复现的,从作者的paper里面介绍,整个都是用FC来实现的,basic的layer就是FC+relu, 然后把这样的basic的不断地给串起来.然后得到feature vector,之后将feature vector取了一个加权的L1,权重参数也是需要学习的(这可以通过将L1差过一个nobias的fc实现), 之后将这个L1的值通过了一个sigmoid转化到[0,1]之间得到一个相似度p, 之后用p去做了一个cross-entropy.

  • 任务理解

这个paper专注的是class-level的pair, 即一对pair,如果是同一类,那label就是1, 如果任务更难一些,比如利用这种方式训人脸的话,能不能可能用,不可用的话需要做哪方面的改进,比如siamese+metric是否可行呢. 作者在这个paper里面强调了并没有专注于metric的学习,而是专注于feature learning. feature learning的通用做法就是用siamese 网络来提feature, 然后送入一个metric的last-layer. 模型训完了之后就不再需要训练,而是直接提feature进行比较. 而且比较算距离或者是相似度的时候应该和监督的metric一致.

打赏,谢谢~~

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,多谢支持~

打开微信扫一扫,即可进行扫码打赏哦