面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。

多层感知器

多层感知器(MLP)是一类前馈人工神经网络。感知器这个术语具体是指单个神经元模型，它是大型神经网络的前体。

MLP包括节点的三个主要层：输入层、隐藏层和输出层。在隐藏层和输出层中，每个节点都被视为使用非线性激活函数的神经元。MLP使用一种称为反向传播的监督式学习技术进行训练。初始化神经网络时，为每个神经元设置权重。反向传播有助于调整神经元权重，以获得更接近预期的输出。

对于涉及表格数据集、分类预测问题和回归预测问题的项目，MLP最理想。

卷积神经网络

卷积神经网络(CNN)模型处理具有网格图案(比如图像)的数据。它旨在自动学习特征的空间层次结构。CNN通常包括三种类型的层：卷积层、池化层和完全连接的层。

卷积层和池化层执行特征提取任务，这些提取的特征由完全连接的层映射到最终输出中。 CNN最适合图像处理。

图像识别、图像分类、对象检测和人脸识别是CNN的一些应用场景。

递归神经网络

在递归神经网络(RNN)中，前一步的输出将作为输入被反馈回到当前步骤。RNN中的隐藏层实现这种反馈系统。该隐藏状态可以存储有关序列中之前步骤的一些信息。

RNN中的“内存”可帮助模型记住已计算的所有信息。反过来，它使用这些同样的参数，以便每个输入生成输出，因而降低了参数的复杂性。

RNN是使用最广泛的神经网络类型之一，主要是由于RNN具有更强的学习能力，而且能够执行诸如学习手写或语言识别之类的复杂任务。RNN适用的其他一些领域包括预测问题、机器翻译、视频标记、文本摘要，甚至音乐创作。

深度信念网络

深度信念网络(DBN)使用概率和无监督学习来生成输出。DBN由二进制潜在变量、无向层和有向层组成。DBN有别于其他模型，原因是每一层都按顺序进行调节，每一层都学习整个输入。

在DBN中，每个子网的隐藏层都是下一个的可见层。这种组合可以实现快速的逐层无监督训练过程：对比差异应用于每个子网，从最低可见层开始。贪婪的学习算法用于训练DBN。学习系统每次取一层。因此，每一层收到不同版本的数据，每一层都使用前一层的输出作为其输入。

DBN主要应用于图像识别、视频识别和运动捕获数据。

受限玻尔兹曼机

玻尔兹曼机(RBM)是一种生成式非确定性(随机)神经网络，可学习其输入集的概率分布。RBM是组成深度信念网络构建模块的浅度两层神经网络。RBM中的第一层名为可见层或输入层，第二层名为隐藏层。它由名为节点的类似神经元的单元组成;节点跨层相互连接，但不在同一层内。

相关推荐