Rethinking the Inception Architecture for Computer Vision Christian Szegedy Google Inc. Vincent VanhouckeSergey IoffeJonathon Shlens vanhoucke@google.com sioffe@google.com shlens@google.com arXiv:1512.00567v3 [cs.CV] 11 Dec 2015 szegedy@google.com Zbigniew Wojna University College London zbigniewwojna@gmail.com 核心 ![]() ![]() 局部连接,参数共享,一个位置的核的计算结果对应一个点/数值,反之逆向也有一个对应关系 ![]() ![]() 现代的设计理念为 多层小核,其效果与少层大核的一样 但流量不一样, 大核每次计算的参数很大,层数虽然少了,但每次计算的参数量大 大核的感受视野大,小核的感受视野小,将不同视野的向量并起来, 这就是多尺度的概念 ![]() 多尺度的思想是有价值的,是重要的,但不需要设计的如此复杂, 意思就是同样使用多尺度的思想,用更简单的设计也能达到同样的效果 |
从不同的维度提取特征,然后 整合/融合,就是多尺度的思想 这个整合/融合,通常是拼接,相加 resnet使用的是相加,也叫短接, 这一加,就解决了DL因为层数多导致的梯度消失问题 |
|
|