深度神经网络 DNN

georgesale 2020-06-09

深度神经网络（Deep Neural Networks，以下简称DNN）是深度学习的基础，而要理解DNN，首先我们要理解DNN模型，下面我们就对DNN的模型与前向传播算法做一个总结。

https://zhuanlan.zhihu.com/p/29815081

??

1 从感知机到神经网络

??

感知机的模型，它是一个有若干输入和一个输出的模型，如下图:

深度神经网络 DNN

输出和输入之间学习到一个线性关系，得到中间输出结果：

深度神经网络 DNN

接着是一个神经元激活函数：

深度神经网络 DNN

从而得到想要的结果1或者-1.

??

这个模型只能用于二元分类，且无法学习比较复杂的非线性模型，因此在工业界无法使用。而神经网络则在感知机的模型上做了扩展，总结下主要有三点：

??

（1）加入了隐藏层，隐藏层可以有多层，增强模型的表达能力，如下图实例，当然增加了这么多隐藏层模型的复杂度也增加了好多。

深度神经网络 DNN

??

（2）输出层的神经元也可以不止一个输出（输出层有多个神经元），可以有多个输出，这样模型可以灵活的应用于分类回归，以及其他的机器学习领域比如降维和聚类等。多个神经元输出的输出层对应的一个实例如下图，输出层现在有4个神经元了。

深度神经网络 DNN

??

深度神经网络 DNN

深度神经网络 DNN

还有后来出现的tanh, softmax,和ReLU等。通过使用不同的激活函数，神经网络的表达能力进一步增强。

??

??

??

2 DNN的基本结构

??

神经网络是基于感知机的扩展，而DNN可以理解为有很多隐藏层的神经网络。多层神经网络和深度神经网络DNN其实也是指的一个东西，DNN有时也叫做多层感知机（Multi-Layer perceptron,MLP）。

??

从DNN按不同层的位置划分，DNN内部的神经网络层可以分为三类，输入层，隐藏层和输出层,如下图示例，一般来说第一层是输入层，最后一层是输出层，而中间的层数都是隐藏层。

深度神经网络 DNN

层与层之间是全连接的，也就是说，第i层的任意一个神经元一定与第i+1层的任意一个神经元相连。虽然DNN看起来很复杂，但是从小的局部模型来说，还是和感知机一样，即一个线性关系：

深度神经网络 DNN

深度神经网络 DNN

??

深度神经网络 DNN

??

深度神经网络 DNN

深度神经网络 DNN

??

深度神经网络 DNN

深度神经网络 DNN

??

??

??

3 DNN前向传播算法数学原理

??

深度神经网络 DNN

深度神经网络 DNN

??

深度神经网络 DNN

??

深度神经网络 DNN

??

所谓的DNN前向传播算法就是利用若干个权重系数矩阵W,偏倚向量b来和输入值向量x进行一系列线性运算和激活运算，从输入层开始，一层层的向后计算，一直到运算到输出层，得到输出结果为值。

??

深度神经网络 DNN

??

深度神经网络 DNN

深度神经网络 DNN

??

??

??

5 DNN的反向传播算法

??

5.1要解决的问题：

深度神经网络 DNN

??

深度神经网络 DNN

??

可以用一个合适的损失函数来度量训练样本的输出损失，接着对这个损失函数进行优化求最小化的极值，对应的一系列线性系数矩阵W,偏置向量b即为我们的最终结果。在DNN中，损失函数优化极值求解的过程最常见的一般是通过梯度下降法来一步步迭代完成的，也可以是其他的迭代方法比如牛顿法与拟牛顿法。

??

5.2反向传播算法的基本思路：

在进行DNN反向传播算法前，我们需要选择一个损失函数，来度量训练样本计算出的输出和真实的训练样本输出之间的损失。

??

DNN可选择的损失函数有不少，为了专注算法，这里使用最常见的均方差来度量损失。即对于每个样本，我们期望最小化下式：

深度神经网络 DNN

??

深度神经网络 DNN

深度神经网络 DNN

深度神经网络 DNN

对于输出层的参数，损失函数变为：

深度神经网络 DNN

求解W,b的梯度：

深度神经网络 DNN

??

深度神经网络 DNN

??

深度神经网络 DNN

??

5.3DNN反向传播算法过程：

由于梯度下降法有批量（Batch），小批量(mini-Batch)，随机三个变种，为了简化描述，这里我们以最基本的批量梯度下降法为例来描述反向传播算法。实际上在业界使用最多的是mini-Batch的梯度下降法。区别仅仅在于迭代时训练样本的选择。

??

深度神经网络 DNN

??

深度神经网络 DNN

深度神经网络 DNN

??

??

6 均方差损失函数+Sigmoid激活函数的问题

??

在讲反向传播算法时，我们用均方差损失函数和Sigmoid激活函数做了实例，首先我们就来看看均方差+Sigmoid的组合有什么问题。

??

首先我们回顾下Sigmoid激活函数的表达式为：

深度神经网络 DNN

??

7 交叉熵损失函数+Sigmoid激活函数改进DNN算法收敛速度

??

??

??

??

??

??

: georgesale

相关推荐

使用NetworkX模块绘制深度神经网络（DNN）结构图

本文将展示如何利用Python中的NetworkX模块来绘制深度神经网络结构图。在文章Keras入门（一）搭建深度神经网络解决多分类问题中，我们创建的DNN结构图如下：。该DNN模型由输入层、隐藏层、输出层和softmax函数组成，每一层的神经元个数分别为

sjzhahalala 0喜欢 / 0评论 2019-06-28

Keras入门（一）搭建深度神经网络（DNN）解决多分类问题

Keras介绍Keras是一个开源的高层神经网络API，由纯Python编写而成，其后端可以基于Tensorflow、Theano、MXNet以及CNTK。Keras 为支持快速实验而生，能够把你的idea迅速转换为结果。Keras适用的Python版本是

kinghighbury 0喜欢 / 0评论 2019-06-28

DotNetNuke 5 C#版本解读之--架构介绍

整体上DNN5和其它比较大的企业级应用系统一样分为web服务器和数据库服务器。Web服务器包括表现层，商业逻辑层和数据访问层，而数据库服务器主要是数据层。表现层主要包含如下几个部分：webforms:整个DNN主要的就是哪个default.aspx页面来展

有瑕疵的老兵 0喜欢 / 0评论 2012-07-06

UIUC推出最新DNN/FPGA协同设计方案，助力物联网终端设备AI应用

UIUC、IBM 和 Inspirit IoT, Inc的研究人员提出 DNN 和 FPGA 加速器的协同设计方案，通过首创的「Auto-DNN」网络搜索引擎 +「Auto-HLS」加速器生成技术，自动生成适用于终端设备的 DNN 模型及 FPGA 加速器

zhuhong 0喜欢 / 0评论 2019-05-28

微软资深研究员详解基于交错组卷积的高效DNN｜公开课笔记

卷积神经网络在近几年获得了跨越式的发展，虽然它们在诸如图像识别任务上的效果越来越好，但是随之而来的则是模型复杂度的不断提升。越来越深、越来越复杂的卷积神经网络需要大量存储与计算资源，因此设计高效的卷积神经网络是非常重要和基础的问题，而消除卷积的冗余性是该问

FromZerotoHero 0喜欢 / 0评论 2018-07-11

微软资深研究员详解基于交错组卷积的高效DNN

卷积神经网络在近几年获得了跨越式的发展，虽然它们在诸如图像识别任务上的效果越来越好，但是随之而来的则是模型复杂度的不断提升。越来越深、越来越复杂的卷积神经网络需要大量存储与计算资源，因此设计高效的卷积神经网络是非常重要和基础的问题，而消除卷积的冗余性是该问

yuyin 0喜欢 / 0评论 2018-07-11

周志华最新论文：首个基于决策树集成的自动编码器，表现优于DNN

今年 2 月，南京大学的周志华教授和他的学生 Ji Feng 提出了一种不同于深度神经网络的 Deep Forest 模型——gcForest，这是一种决策树集成的方法，较之深度神经网络有很强的竞争力。深度神经网络需要花大力气调参，相比之下 gcFores

沦落天堂 0喜欢 / 0评论 2017-09-27

腾讯AI Lab参与：基于弹性网络正则化的深度神经网络对抗样本攻击

腾讯 AI Lab 在 2018 年 AAAI 中入选论文 11 篇，其中一篇与 IBM Research、The Cooper Union 和加州大学戴维斯分校合作的论文入选口头报告。这篇论文提出一种基于弹性网络正则化的攻击算法，该算法将对抗样本攻击

lwnylslwnyls 0喜欢 / 0评论 2018-01-30

EDEN：结合进化算法与DNN自动搜索神经网络架构与超参数

在该论文中，研究者提出了一种进化深度网络，即一种神经进化算法。该算法结合了遗传算法和深度神经网络，并可用于探索神经网络架构的搜索空间、与之相关联的超参数和训练迭代所采用的 epoch 数量。机器之心简要介绍了该论文。通过使用 EDEN，研究者认为我们可以解

VincentLee 0喜欢 / 0评论 2017-09-28

最全的DNN概述论文：详解前馈、卷积和循环神经网络技术

本论文技术性地介绍了三种最常见的神经网络：前馈神经网络、卷积神经网络和循环神经网络。且该文详细介绍了每一种网络的基本构建块，其包括了基本架构、传播方式、连接方式、激活函数、反向传播的应用和各种优化算法的原理。本文不仅介绍了这三种神经网络的基本原理与概念，同

fengzhimohan 0喜欢 / 0评论 2017-09-07

10大任务超越BERT，微软提出多任务深度神经网络MT-DNN

新智元将于3月27日在北京泰富酒店举办“2019新智元AI技术峰会——智能云芯世界”，聚焦智能云和AI芯片发展，重塑未来AI世界格局。同时，新智元将现场权威发布若干AI白皮书，聚焦产业链的创新活跃，助力中国在世界级的AI竞争中实现超越。MT-DNN结合了B

zhousenbiao 0喜欢 / 0评论 2019-03-22

浏览器最快的DNN执行框架WebDNN：从基本特性到性能测评

WebDNN 是网页浏览器中最快的 DNN 执行框架，而本文首先简单介绍了 WebDNN 特征与其框架结构，即表明了为什么 WebDNN 能为端用户提供高效的 DNN 应用。而后文章将给出 WebDNN 与 Keras.js 的详细对比，并在最后一部分介绍

hyv 0喜欢 / 0评论 2017-06-05

神经网络：从基本概念到新的可能性

生物学中的神经网络是互相交换信息的相互连接的神经元。这个想法现在已经适用于机器学习的世界，并被称为人工神经网络。深度学习是一个经常出现的词，是指几层连续放置的人工神经网络。DNN 在很多人工智能任务之中表现出了当前最佳的准确度，但同时也存在着计算复杂度高的

hexianhao 0喜欢 / 0评论 2017-04-19

论文详解：有关DNN那点儿事

麻省理工学院MIC旨在对整个社区进行进行关于机器学习的教育，使得大家能够更快的进入机器学习这个领域。深度神经网络在越来越广泛的工业应用中提供无与伦比的精度和性能，例如图像识别、自然语言处理和其他复杂问题，如自动驾驶车辆的控制。尽管与旧机器学习算法相比有了巨

Pokemogo 0喜欢 / 0评论 2018-07-20

「深度森林第三弹」周志华等提出梯度提升决策树再胜DNN

今天，ArXiv上公布了深度森林系列最新的第三弹——可做表示学习的多层GBDT，冯霁、俞扬和周志华提出了一种新颖的具有显式表示学习能力的多层GBDT森林，它可以与目标传播的变体进行共同训练，这种方法在很多神经网络不适合的应用领域中具有巨大的潜力。还记得周志

freefly 0喜欢 / 0评论 2018-06-04

OpenCv-C++-深度神经网络（DNN）模块-使用FCN模型实现图像分割

中文名称是“全卷积网络”，它将传统CNN中的全连接层转化成一个个的卷积层。在传统的CNN结构中，前5层是卷积层，第6层和第7层分别是一个长度为4096的一维向量，第8层是长度为1000的一维向量，分别对应1000个类别的概率。cout <&a

hhhhhjkk 0喜欢 / 0评论 2019-02-22

超过70个DNN卷积算法的模板库

在机器学习中，卷积神经网络是一种深度前馈人工神经网络，已成功地应用于图像识别。卷积神经网络是解决各种重要神经网络的机器算法之一。今天介绍的triNNity是在一个地方收集尽可能多的DNN卷积算法，并提供干净、简单和高性能的实现，它也是DNN卷积算法设计的试

pengkingli 0喜欢 / 0评论 2017-11-23

自学习芯片、实时3D表情捕捉渲染，百倍DNN模型无损压缩

英特尔中国研究院媒体开放日，英特尔中国研究院院长宋继强率领团队，共同分享了英特尔中国研究院的整体定位、研究方向和创新机制，以及英特尔在人工智能、机器人等领域的最新研究成果。在人工智能的大背景下，这几年，说起芯片霸主英特尔，似乎总有一股时过境迁的味道。明年就

songfeidream 0喜欢 / 0评论 2017-12-01

Hinton实验室探访：Capsule后最新研究，软决策树更好理解DNN分类

《纽约时报》今日发文，记者走访Hinton在多伦多的实验室，为我们带来Hinton新作“Capsule Network”的更多信息。同时，新智元注意到Hinton和Capsule Network作者之一的Nicholas Frosst最近新发表了论文，使用

gscienty 0喜欢 / 0评论 2017-11-29

使用TensorFlow实现DNN

使用高级API实现多层神经网络这里我们使用tensorflow.contrib包，这是一个高度封装的包，里面包含了许多类似seq2seq、keras一些实用的方法。y = tf.placeholder#注意数据类型上面使用占位符的方法来声明模型的输入X和y

ukakasu 0喜欢 / 0评论 2017-12-18

python构建深度神经网络（DNN）

本文学习Neural Networks and Deep Learning 在线免费书籍，用python构建神经网络识别手写体的一个总结。n = [np.reshape for x in t_d[0]] # 将5万个数据分别逐个取出化成，逐个排列。m =

zhousenbiao 0喜欢 / 0评论 2018-03-10

机器不学习：深度模型DNN在个性化推荐场景中的应用

随着深度神经网络在语音和图像识别上取得的巨大成功，AlphaGo 战胜人类围棋顶尖高手，以深度网络为基础的人工智能迎来第三次高潮。与此同时互联网所面临的信息超载问题愈演愈烈，其中个性化推荐是重要的信息过滤手段。在第九期美图技术沙龙中，来自美图公司的蒋文瑞以

kunlong00 0喜欢 / 0评论 2019-04-20

深度 | 详解首个系统性测试现实深度学习系统的白箱框架DeepXplore

五月份，来自哥伦比亚大学和理海大学的几位研究者的论文《DeepXplore: Automated Whitebox Testing of Deep Learning Systems》提出了一种深度学习系统的自动白箱测试方法 DeepXplore，参阅机器之

comwayLi 0喜欢 / 0评论 2017-06-19

深度神经网络（DNN）是否模拟了人类大脑皮层结构？

我是生物本科，认知神经科学研究生在读，课余时间比较喜欢编程和机器学习，正在自学，了解的稍微多一些。我试着从我的角度来说下我看到的深度学习和神经科学的联系。深度学习和神经科学这两个学科现在都很大，我的经历尚浅，如果大家发现哪里说得不太对，欢迎提出指正，谢谢!

demm 0喜欢 / 0评论 2017-08-11