社区微信群开通啦,扫一扫抢先加入社区官方微信群
社区微信群
一种简单的感知机结构如下图所示,由三个输入节点和一个输出节点构成,三个输入节点x1,x2,x3分别代表一个输入样本x的三个特征值;w1,w2,w3分别代表三个特征值对应的权重;b为偏置项;输出节点中的z和o分别代表线性变换后的输出值和非线性变换后的输出值。
{z=x1∗w1+x2∗w3+x3∗w3+bo=f(z)(1)
其中映射函数f为激活函数,下面列几个常见的激活函数:
函数名 | 函数表达式 | 导数 |
---|---|---|
sigmoid | f(z)=1+e−z1 | f(z)[1−f(z)] |
tanh | f(z)=ez+e−zez−e−z | 1−f(z)2 |
softmax | f(z)=∑j=0nezjezi | 经常用其构成的 损失函数的导数: f(zi)−t(i) 1 |
神经网络与感知机类似,但是它的节点更加复杂,下图是一个含有1层隐藏层的神经网络,也是一种最简单的神经网络,我们可以看到这个神经网络的输入层有2个节点,隐藏层有3个节点,输出层有1个节点。我们可以认为神经网络由多个感知机构成。我们以下图所示结构为例,实现一个可以进行数据分类的神经网络。
假设我们有N个样本,对于每一个样本来说,都有两个特征值,对于这样的每一个样本x(x1,x2)都满足公式2,公式中带小括号的上标代表神经网络的层数,wij为相邻两层两个节点之间的权重系数,其中的i代表前一层的第i个节点,j代表后一层的第j个节点。
⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧z1(1)=x1∗w11(1)+x2∗w21(1)+b1(1), h1=f(z1(1))z2(1)=x1∗w22(1)+x2∗w22(1)+b2(1), h2=f(z2(1))z3(1)=x1∗w13(1)+x2∗w23(1)+b3(1), h3=f(z31)z(2)=h1∗w1(2)+h2∗w2(2)+
原文链接:https://blog.csdn.net/l_changyun/article/details/96759758
站方申明:本站部分内容来自社区用户分享,若涉及侵权,请联系站方删除。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!