Deformable CNN论文笔记

Deformable CNN论文笔记

初步印象

感觉这个paper里面的思想与SENet,STN,以及关键点里面的feature-embedding等都有相似之处,即这些paper都是从不同的角度注意到了cnn的缺点,就在一个固定的区域内进行采样,这样的话,网络似乎就没有多少自己的‘思考’在里面,经过这些模块改进了之后,网络似乎又具备了一种新的能力,可以理解成是更加专注于目标的能力,比如普通的CNN在做卷积的时候就是针对那一小块domain,而Deformable可以让其自主决定在哪个地方进行采样,并不一定是在这个小的domain,相当于给生个采样点指明了一个方向,这一点与open-pose里提出的vector field或者后面的assocative embedding非常地像。而SENet相当于是给各个channel学习到一个权值,让网络自己去决定哪些channel应该占更多的比重,即也是让其有针对性。

贡献

主要的贡献是这篇Paper提出了这种思想,让网络的capacity更加地大,不仅提出了Deformable-CNN也还提出了对应的ROI-pooling,PS-ROI-pooling等,在一些经典的网络中几乎都能做这两个改变,性能自然会有一些提升。

motivation

自然世界太复杂了,有各种各样的场景,如何让机器懂得这个世界,特别是让机器看得懂这个世界,如何适应物体的几何的变化,比如scale, pose, viewpoint,还有一些形状的改变,这些都是非常有挑战性的。最初的解决办法是做数据增强,造更多的数据,这样的话,有两个明显的drawbacks,一是数据量大,会加大计算量,第二数据量再大也无法描述真实的自然环境,所以从数据的角度来说有些牵强,就像为了考试考个好成绩想把所有的题目都刷一遍一样。那么根本的解决办法还是在算法上面,即如何构造一个新的网络让网络有自主具有这方面的能力,虽然CNN的性能在各方面能取得了比较好的效果,但是也仍然是有很多的研究需要去做。现在的网络结构,CNN可以说是最基本的unit了,它也决定了网络的capacity和计算量,比如如果卷积不是每个小window去做卷积的话,那就会减少很多的计算量。所以从根本上解决的话,还是要对CNN重新思考。

打赏,谢谢~~

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,多谢支持~

打开微信扫一扫,即可进行扫码打赏哦