Fast R-CNN
Faster R-CNN
YOLO
SSD
总结
参考文献
推荐链接
相关背景14年以来的目标检测方法(以R-CNN框架为基础或对其改进)
各方法性能对比
分类,定位,检测三种视觉任务的简单对比
一般的目标检测方法
从传统方法到R-CNNR-CNN的三大步骤:得到候选区域,用cnn提取特征,训练分类器(后两步放在一个网络中,用softmax做分类器也可以)
从R-CNN到SPPR-CNN必须限制输入图像大小(全连接层要求)
SPP的两大优势:可变输入大小 + 各patch块之间卷积计算是共享的
SPP的缺陷:multi-stage,训练和测试都比较慢
Fast R-CNNFast R-CNN通过ROI pooling(一层的SPP),multi-task等改进大大提高速度
Fast R-CNN的优势与弱势
Faster R-CNNFaster R-CNN对于Fast R-CNN的改进在于把region proposal的步骤换成一个CNN网络(RPN)
Faster R-CNN的两个base model: ZF,VGG16 (base model的中间conv输出即为要输入到RPN的那个feature map)
Faster R-CNN的锚点anchor box
Faster R-CNN的损失函数
Faster R-CNN的四步训练
YOLO从Faster R-CNN到YOLO
YOLO的pipeline
YOLO的网络结构
YOLO的模型(最右图为网络输出的tensor)
YOLO的损失函数
YOLO的优势和劣势