DeepLab V2 论文笔记

DeepLab V2 论文笔记

主要的内容

DeeplabV1之后不久,他们就提出了DeeplabV2, 主要是对之前的DeeplabV1作了一些改进。

  • 之前已经提到,分割的任务中希望有比较大的receptive field, 而且Multi-scale的feature map对于性能也有很大的提升,那么在同一个feature map上面有多个receptive field的时候,也可以看成是一种Multi-scale,这种想法是来源于SPP-net,因为在SPP-net中,为了解决输入的shape不一致的问题,就将图像进行了n-n分,并且分了好几次,最后得到一个长度一样的向量,作为特征。这里也是有这种想法,在同一个feature map上用不同的filter去做卷积,这里说的不同的filter在这里指的是不同的rate,也可以理解成dialited的中间的洞的个数不一样,比如有rate=6, rate =12的等等,见下图

avator

上述的这个结构作者叫作”ASPP(atrous spatial pyramid pooling)”.即基于洞的空间金字塔。

  • 在atrous convolution的实现上面,当然可以把filter变大,即把空洞的地方补成0,然后就变成了通常的卷积了,但添加0之后会增加计算量,所以在caffe里面是用im2col来处理的。

打赏,谢谢~~

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,多谢支持~

打开微信扫一扫,即可进行扫码打赏哦