神经网络-全连接层（1）-赢咖4注册

aihot 2017-12-10 13:17:33 机器学习 | 查看评论

神经网络的模样

实际上对于只有一层且只有一个输出的神经网络，如果它的非线性部分还使用sigmoid函数，那么它的形式和逻辑斯特回归（logistic regression）是一样的。所以可以想象神经网络模型从概念上来看比逻辑斯特回归要复杂。那么它的复杂的样子是什么样呢？下面给出一段全连接层的代码，开始做实验：

从代码上看东西并不多嘛，注意到我们会对参数中的w进行随机初始化，有时我们会让老天随机一个神经网络给我们，我们也可以看看随机大帝的旨意。

为了方便可视化，这里只做输入为2，输出为1的数据。好了，先来看1号选手：

定睛一看这其实就是一个标准的Logistic Regression。他的图像如下所示：

经过多次随机测试，基本上它都是这个形状，只不过随着权重随机的数值变化，这个“台阶”对旋转到不同的方向，但归根结底还是一个台阶。

这也说明1层神经网络是没有出路的，它本质上还是个线性分类器的实力，那么小伙伴还给它加一层吧：

fc = FC(2, 3)
fc.w = np.array([[0.4, 0.6],[0.3,0.7],[0.2,0.8]])
fc.b = np.array([0.5,0.5,0.5])
fc2 = FC(3, 1)
fc2.w = np.array([0.3, 0.2, 0.1])
fc2.b = np.array([0.5])
Z1 = np.array([fc.forward(d) for d in data])
Z2 = np.array([fc2.forward(d) for d in Z1])
Z2 = Z2.reshape((100,100))
draw3D(X, Y, Z2)

这次我们暂时不用随机权重，而是自己设置了几个数值，可以看出，参数设置得很用心。两层全都是正数……，那么图像呢？

线性分类器

看上去比之前的台阶“柔软”了一些，但归根结底还是很像一个台阶……好吧，那我们加点负权重，让我们从两个方面分析输入数据：

fc = FC(2, 3)
fc.w = np.array([[-0.4, 1.6],[-0.3,0.7],[0.2,-0.8]])
fc.b = np.array([-0.5,0.5,0.5])
fc2 = FC(3, 1)
fc2.w = np.array([-3, 2, -1])
fc2.b = np.array([0.5])
Z1 = np.array([fc.forward(d) for d in data])
Z2 = np.array([fc2.forward(d) for d in Z1])
Z2 = Z2.reshape((100,100))
draw3D(X, Y, Z2)