Grid-RCNN论文笔记

Grid-RCNN论文笔记

notes

参考了”AI之路”的blog https://blog.csdn.net/u014380165/article/details/95238679 的介绍,我把我觉得有意思的和理解到的整理了一下.

  • 这个paper是在CornerNet之后出来的,所以确实有CornerNet中的影子在里面,不过这里面预测关键点和我刚开始的理解不太一样,本来我以为这里面的gt是用Gauss来产生的呢,结果发现并不是的,而是用mask的形式,比如要预测一个物体的9个点,会输出9个heatmap.每个heatmap负责其中的一个点.

  • 之所以叫”Grid-RCNN”是因为和”RCNN”的确很像,只不过这里的得到了rois之后用的不是roipooling了而是用的maskrcnn里面出现的roi-align, 然后Faster-rcnn中得到rois之后会去回归bbox, 而这里不再是回归bbox了而是去做关键点检测,预测9个点,cornerNet是预测两个点,这里每个边上预测三个点,所以是9个点. 9个点肯定能比2个点更能够确定一个物体。此外这里和corner里面有一个不一样的地方是, cornernet里面再预测完了关键点之后还需要去给关键点做一个匹配的任务,即这个关键点应该是哪个人的.而这里并不需要,因为这里得到roi之后,就认为预测的东西就是这个roi的了.

  • 有一个问题估计在读的时候都会想到,也就是得到的roi未必一定把整个物体的9个点给框住啊,甚至只是可能框住其中的一条边上的一两个点,这样的话就不好弄了,因为roi里面没有其它关键点的feature, 作者采取了一个办法,即将roi的w,h各放大为2倍然后再进行一个采样,这样做感觉有些暴力, 能否有一个更加合知的办法呢?比如在知道其中的一部分关键点时,如何算一下其他的点的位置.

总结

利用关键点检测来替代bbox回归的已经有好几个paper了,比如cornerNet, superNet, centerNet, Grid-RCNN 等等. 另外Grid-RCNN还是利用了anchor的.

打赏,谢谢~~

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,多谢支持~

打开微信扫一扫,即可进行扫码打赏哦