OverFeat是Yann LeCun领导的研究团队在2013年发表的一个用于一般物体检测,识别和定位的方法。OverFeat和Krizhevsky 2012年著名论文ImageInet Classification with Deep Convolutional Neural Networks一样也是使用深度网络作为特征提取和识别的方法。该论文的贡献是针对不同尺度和偏移的检测目标有更好的识别能力,并且可以给出更精确的定位。作者发明了下列方法:
- 集合多个尺度上的物体检测结果
- 集合不同偏移的max pooling输出,保证获得与目标位置对齐的max pooling输出,提高定位的精度
OverFeat的网络拓扑也很有意思。物体识别和定位模块共享前半部的特征提取部分,特征提取使用深度卷积网络,网络后半部分分成物体识别和定位回归两个子网络。这个网络结构在Fast-RCNN中也看到了类似的结构。