机器学习进阶笔记之五 | 深入理解VGG\Residual Network-赢咖4注册

aihot 2017-12-09 23:01:43 机器学习 | 查看评论

Deep Residual Network

Deep Residual Network解读

一般来说越深的网络，越难被训练，Deep Residual Learning for Image Recognition中提出一种residual learning的框架，能够大大简化模型网络的训练时间，使得在可接受时间内，模型能够更深(152甚至尝试了1000)，该方法在ILSVRC2015上取得最好的成绩。

随着模型深度的增加，会产生以下问题：

vanishing/exploding gradient，导致了训练十分难收敛，这类问题能够通过norimalized initialization 和intermediate normalization layers解决；
对合适的额深度模型再次增加层数，模型准确率会迅速下滑（不是overfit造成），training error和test error都会很高，相应的现象在CIFAR-10和ImageNet都有提及

为了解决因深度增加而产生的性能下降问题，作者提出下面一种结构来做residual learning：

residual learning