mask-rcnn论文笔记

mask-rcnn论文笔记

感觉从rcnn系列中学到很多东西,感觉rcnn系列的paper需要经常看,反复看,不然还是常忘,其它的rcnn后面再复习,先把maskrcnn复习一下。

maskrcnn中提出的新的东西主要有:

roialign

roialign 的主要作用就是align,之前在fastercnn中由于取整操作带来的影响,导致精度有所下降,而现在可以用双线性插值可以使效果变得好一些,具体的想法是 如果要从roi中取k*k个像素点的话,那就可以把feature分成k*k个小区域,然后再每个小区域上再均分成4个小方格,把每个小方格的正中心作为采样点,这样在每个小区域中就有4个采样点,这4个采点的值可以用其附近的像素点进行双线性插值得到,而这个小区域上的像素值可以对这4个采样点进行取最大值操作或者取平均操作都可以。

新的mask分支

maskrcnn相比于之前的rcnn系列多了一个关于mask的分支,即一个小的FCN网络,那么输入中就也有了gt_mask,假设一张图上有N个实例对象,也有N个bbox,那么mask是从每个bbox中对应的部分得到的,为了减少显存,可以把mask Resize到同一个shape,长宽的scale不一样也没有关系,因为可以再resize回来,那么对于一张图的输入,gt_mask的shape就是有N个深度的,每个深度代表一个实例对象。在最终的loss中也多了关于mask的loss.其中loss是用BCE来做的。

maskrcnn可用于许多的任务上面

分割,关键点检测,姿态估计等等。

打赏,谢谢~~

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,多谢支持~

打开微信扫一扫,即可进行扫码打赏哦