深度学习算法之CNN、RNN、LSTM公式推导 - Go语言中文社区

深度学习算法之CNN、RNN、LSTM公式推导 - Go语言中文社区

深度学习算法之CNN、RNN、LSTM公式推导

整个推导过程首先一定对网络的结构有清醒的认知，所有变量的下角标都能一一对应到网络结构上；然后就是链式求导了。

一、CNN公式推导

1、前向传播

假设CNN共三层，第一层为输入层，第二层为隐藏层，第三层为输出层。

定义：第一层与第二层之间的参数为

t时刻的某一个神经元的输入为

那么隐藏层输入为：

则隐藏层的真实输入为：

经过激活函数后：

再传入输出层：

如果最后的损失函数使用softmax的负log函数：

2、反向梯度计算

先求最后的输出层的梯度：

求解参数

发表于 2020-03-01 21:38:04
阅读 ( 1269 )
分类：算法