, 同层的其他参数不再赘述
到这歇一下,我们已经顺利求出第二层的所有参数的导数了,具体的求导过程在这就不说了。下面是第一层
, 同层的其他参数不再赘述
,同层的其他参数不再赘述
,同层的其他参数不再赘述
,同层的其他参数不再赘述
到这里,我们实际上已经完成了基本运算,后面的事情就是把这些小的部分组合起来,比方说:
看着十分复杂是吧?可是实际上其中每一个部分都已经被我们计算了,我们只需要把数据全部代入就可以了。当然,实际上如果严格按照公式进行计算,梯度的公式会比这个更复杂,但是其中一部分梯度实际上等于0,所以在此略去。
而且,随着我们从高层网络向低层计算的过程中,很多中间结果可以用于计算高层参数的梯度了。所以经过整理,全部的计算过程可以如下表示:
- , 同层的其他参数不再赘述
- , 同层的其他参数不再赘述
- ,同层的其他参数不再赘述
- , 同层的其他参数不再赘述