对oj取全微分,可以得到该导数的一个递归表达式:
oj
也即,只要知道所有下一层(指离输出层更近的一层)的输出ol的导数,即可计算oj的导数,把它们放在一起:
ol
其中:
所以得到BP算法的权重迭代公式(与普通梯度下降法参数迭代公式形式类似):
以上即为BP算法推导的全过程。
BP算法说到底是种梯度下降算法,前面也提到过,梯度下降法能得到局部最优,但并不能保证一定会得到全局最优。我们通常采用RBM pre-train的方法来避免其收敛到局部最小值。
除特别注明外,本站所有文章均为 赢咖4注册 原创,转载请注明出处来自浅谈深度学习基础(上)
中国科技和IT行业几大趋势,未来会
iPhone13加量还减价,官网直接被买崩
真香预警 小米系骁龙870新机曝光 5
对标华为mate,与小米MIX4竞争,荣耀Ma
微软全新发布Windows 11 支持运行A
体验完用上鸿蒙的华为全家桶,我发现
超7成受访者不愿新iPhone命名13,可
三款华为P50价格全曝光,128GB标准版
NASA火星直升机“机智号”完成第二
智能时代的手工劳动者:调教AI、月薪
魅族18系列全线标配2K微曲面屏:机身