神经网络的激活函数为什么要使用非线性函数？

aaJamesJones 2019-11-04

神经网络的激活函数为什么要使用非线性函数？

有人说这曾经是一道面试题！
我没说过这句话，但是感觉挺有道理 --- 鲁迅

▍什么是激活函数

在神经元中，输入的inputs通过加权求和，然后被作用了一个函数，这个函数就是激活函数 Activation Function。激活函数在神经网络中的位置如图所示：
神经网络的激活函数为什么要使用非线性函数？

▍为什么要用非线性函数

要解释这个问题，可以反过来思考一下，为什么激活函数不能使用线性函数。
如果使用线性函数，每一层输出都是上层输入的线性函数，无论神经网络有多少层，输出都是输入的线性组合。加深神经网络的层数就没有什么意义了。线性函数的问题在于不管加深层数到多少，总是存在与之等效的「无隐藏层」的神经网络。为了稍微直观的理解这一点，考虑下面一个简单的例子。

存在一个线性函数f(x)=kx(k≠0)作为激活函数，将y=f(f(f(x)))对应三层的神经网络。很明显可以想到同样的处理可以由y=ax(a=k^3)，一个没有隐藏层的神经网络来表示。该例子仅仅是一个近似，实际中的神经网络的运算要比这个例子复杂很多，但不影响结论的成立。也就是说，使用线性激活函数时，无法发挥多层网络带来的优势。

相反如果使用非线性函数，激活函数给神经元引入了非线性因素，使得神经网络可以任意逼近任何非线性函数，这样神经网络就可以应用到众多的非线性模型中。

以上！

神经网络的激活函数为什么要使用非线性函数？

: aaJamesJones

相关推荐

机器学习的未来就在这里：高斯过程和神经网络是等价的

高斯进程已经存在了一段时间，但它只是在过去5-10年，有一个大的复苏，其兴趣。部分原因是求解的计算复杂：由于他们的模型需要矩阵反转，复杂性是 O，很难更快地获得。高斯过程最酷的特征之一是它们非常非常相似的神经网络。中央极限定理可以统一明显复杂的现象，在这

lemonade 0喜欢 / 12评论 2020-11-10

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 0喜欢 / 14评论 2020-11-02

【干货】图神经网络的十大学习资源分享

本文转自雷锋网，如需转载请至雷锋网官网申请授权。图神经网络是深度学习的一个相对较新的领域，从最近开始越来越流行。Twitter、Google或Facebook等大公司都会开始对于GNN投入研究，事实证明了GNN优于其他使用图数据的机器学习模型。由于此领域的

walegahaha 0喜欢 / 0评论 2020-10-20

神经网络：高深莫测又妙趣横生的完整历史！

在翻阅各种资料之后，我对神经网络的历史深深入迷了。这是个非常有趣的研究主题，我从中获得了不少快乐。自上个世纪以来，神经网络和人工智能一直是热门话题。在流行文化电影中，人工智能机器人风靡全球，吸引着大量猎奇之士。神经网络的灵感来源于生物神经元是一种受编程范式

WFRainn 0喜欢 / 0评论 2020-10-19

建神经网络模型，哪种优化算法更好？35000次测试告诉你

想要优化自己的神经网络，却不知道哪种优化器更适合自己？又或者，想知道深度学习中梯度下降的算法到底都有哪些？现在，最全面的优化算法分析来了。它整理了自1964年以来，几乎所有的优化方法，将它们进行了分类。此外，它还给出了几种基准测试方法，并用它分析了1344

WhiteHacker 0喜欢 / 0评论 2020-10-14

图神经网络快速爆发，最新进展都在这里了

近年来，图神经网络发展迅速，最近的会议上发表了大量相关的研究论文。本文作者正在整理一个GNN的简短介绍和最新研究报告的摘要。希望这对任何准备进入该领域或试图赶上最新技术进展的人有所帮助。在典型的GNN中，消息传递是由边在相邻节点之间上执行的。在任何神经层，

雜貨鋪 0喜欢 / 0评论 2020-10-13

神经网络“炼丹炉”内部构造长啥样？牛津大学博士小姐姐论文解读

神经网络就像“炼丹炉”一样，投喂大量数据，或许能获得神奇的效果。然而，这种情况下，神经网络其实成了“黑匣子”——具有一定的功能，但看不见是怎么起作用的。如果只做简单的图像分类，其实还好；但如果用在医学方向，对疾病进行预测，那么神经网络下的“判断”就不可轻信

zyhzyh 0喜欢 / 2评论 2020-10-09

2019年Philip S. Yu团队的图神经网络综述

使用graph来表示对象之间的复杂关系和依赖关系，然而graph数据的复杂已有的机器学习算法很难处理，所以使用深度学习方法来处理。此外还讨论图神经网络跨各种领域的应用、总结开源代码、数据集和图神经网络评价指标。最后给出可能的研究方向。然而graph与图像不

cherry0 0喜欢 / 0评论 2020-09-23

9大主题卷积神经网络（CNN）的PyTorch实现

大家还记得这张图吗？深度系统介绍了 52 个目标检测模型，纵观 2013 年到 2020 年，从最早的 R-CNN、OverFeat 到后来的 SSD、YOLO v3 再到去年的 M2Det，新模型层出不穷，性能也越来越好！上文聚焦于源码和论文，对于各种卷

demm 0喜欢 / 0评论 2020-09-18

什么时候以及为什么基于树的模型可以超过神经网络模型？

基于树的模型和神经网络其实并没有太多的不同。神经网络通常被认为是机器学习的圣杯，无所不知，解决一切问题，主要是因为它们很复杂。虽然它们看起来如此不同，但它们只是一枚硬币的两面。任何Kaggler都知道XGBoost是到目前为止最受欢迎的最佳竞赛提交选择。决

zhaoyin 0喜欢 / 0评论 2020-09-16

当支持向量机遇上神经网络：SVM、GAN距离之间的关系

SVM 是机器学习领域的经典算法之一。给定一组训练实例，每个训练实例被标记为属于两个类别中的一个或另一个，SVM 训练算法创建一个将新的实例分配给两个类别之一的模型，使其成为非概率二元线性分类器。SVM 模型将实例表示为空间中的点，这样映射就使得单独类别的

绝望的乐园 0喜欢 / 0评论 2020-09-02

浅谈CNN和RNN

在上一篇文稿中主要对深度学习的基础做了一个阐述，对于其中的神经网络和BP算法进行额外的延伸与拓展。但作为日前最为火热的人工智能技术，掌握这些内容远远还不够。因为深度学习面临的实际问题往往不是线性可分的问题，有时甚至超出了分类的问题，这就必须对深度学习模型加

Site 0喜欢 / 0评论 2020-08-20

图神经网络的究竟有多强大？道翰天琼认知智能机器人平台API接口大脑为您揭秘。

图神经网络的究竟有多强大？道翰天琼认知智能机器人平台API接口大脑为您揭秘。认知智能CI机器人是杭州道翰天琼智能科技有限公司旗下产品。具有突破性，创新性，领航性。认知智能机器人技术体系更加先进，更加智能，是新一代智能，认知智能领域世界范围内唯一的认知智能机

CristianoJason 0喜欢 / 0评论 2020-08-19

谷歌用算力爆了一篇论文，解答有关无限宽度网络的一切

无限宽度神经网络是近来一个重要的研究课题，但要通过实证实验来探索它们的性质，必需大规模的计算能力才行。近日，谷歌大脑公布的一篇论文介绍了他们在有限和无限神经网络方面的系统性探索成果。该研究通过大规模对比实验得到了 12 条重要的实验结论并在此过程中找到了一

cetrolchen 0喜欢 / 0评论 2020-08-18

Pytorch_第十篇_卷积神经网络（CNN）概述

卷积神经网络，简称CNN。卷积神经网络相比于人工神经网络而言更适合于图像识别、语音识别等任务。本文主要涉及卷积神经网络的概念介绍，首先介绍卷积神经网络相比于人工神经网络的优势，其次介绍卷积神经网络的基本结构，最后我们分别介绍神经网络的各个部件从而完整的了解

walegahaha 0喜欢 / 0评论 2020-08-15

一文了解卷积神经网络基础，建议收藏

今天给大家讲一下卷积神经网络，主要包括四个部分：卷积神经网络的历史、全连接层、卷积层和池化层。CNN的英文全称是Convolutional Neural Network，雏形是LeCun在1998年发明的LeNet网络结构。那么到底什么是神经网络呢？198

georgesale 0喜欢 / 0评论 2020-08-14

用神经网络给照片补光，谷歌这项研究却实现了「鬼片」效果

打光是图像处理过程中的重要步骤，打光的好坏可能会影响整体效果的展示。打光方法也各有不同，MIT、谷歌等的一项新研究另辟蹊径，通过神经光传输方法进行图像的二次打光和视图合成，实现了相当不错的效果。图像合成早已不是新鲜话题，但是「打光」可是所有照片的难题。对于

XiaotingCheng 0喜欢 / 0评论 2020-08-13

图神经网络越深，表现就一定越好吗？

数十层甚至数百层神经网络的应用，是深度学习的重要标志之一。但现实情况却远非如此：比如今年被视作机器学习领域最火热的研究方向之一——图神经网络，大多数都只运用了寥寥几层网络。众所周知，深度图神经网络的训练过程非常艰难。近日来，人们致力于解决图神经网络中的深度

码猿同学 0喜欢 / 0评论 2020-08-07

73岁Hinton老爷子构思下一代神经网络：属于无监督对比学习

在近期举行的第 43 届国际信息检索年会上，Geoffrey Hinton 做了主题为《The Next Generation of Neural Networks》的报告。Geoffrey Hinton 是谷歌副总裁、工程研究员，也是 Vector

白飞飞Alan 0喜欢 / 0评论 2020-07-29

人工智能迁移学习如何工作在AI模型和培训过程起到那些作用

如今，人工智能程序可以识别照片和视频中的面部和物体，实时转录音频，提前数年通过X射线扫描检测癌症，并在某些最复杂的游戏中与人类竞争。幸运的是，转移学习是一种使用从一种训练有素的AI模型获得的知识到另一种知识的学科，可以帮助解决这些问题。例如，基本模型可能无

AI启蒙研究院 0喜欢 / 0评论 2020-07-23

人工智能迁移学习如何工作在AI模型和培训过程起到那些作用

如今，人工智能程序可以识别照片和视频中的面部和物体，实时转录音频，提前数年通过X射线扫描检测癌症，并在某些最复杂的游戏中与人类竞争。幸运的是，转移学习是一种使用从一种训练有素的AI模型获得的知识到另一种知识的学科，可以帮助解决这些问题。例如，基本模型可能无

gscienty 0喜欢 / 0评论 2020-07-22

深度学习面试题32：循环神经网络原理(RNN)

RNN 的英文全称是 Recurrent Neural Networks ，即循环神经网络，他是一种对序列型数据进行建模的深度模型。在学习之前，先来复习基本的单层神经网络。单层网络的输入是向量x，经过Wx+b和激活函数f得到输出y。自然语言处理问题中，x1

hnyzyty 0喜欢 / 0评论 2020-07-05

LVQ神经网络的分类——乳腺肿瘤诊断

程序和数据上传到网盘中，程序也可以看附录。LVQ算法是一种有监督的学习方法，其在模式识别和优化领域有广泛的应用。通过实验结果表示，本文中的LVQ算法分类精度为94.2%，与其他分类方法相比，分类精度得到进一步提高。目前，乳腺癌已经成为世界上妇女发病率最高的

wenxuegeng 0喜欢 / 0评论 2020-06-26

神经网络的学习之感知器

最近在研究深度学习的论文，但是由于基础薄弱，所以下网上看了好多关于感知器的文章，总结如下：。我们先从最简单的单层感知机学起，单层感知机是一个多输入单输出的模型。为什么要f映射呢？我们知道f是激活函数，是非线性函数。将第一层代入到第二层：

hnyzyty 0喜欢 / 0评论 2020-06-25

深度学习-神经网络

机器学习是人工智能的核心，而深度学习又是机器学习的核心。三者关系可用如下图来表示。神经网络仿照人脑的神经元结构之间的联系，当某个神经元的轴突电信号强度达到一定程度时，就会触发将信号传递到下一个神经元。相比于其他神经网络结构，卷积神经网络需要的参数相对较少，

georgesale 0喜欢 / 0评论 2020-06-11

【理论】适用于手机端目标检测的卷积神经网络方案

　　本文作者在工作中需要实现一种适用于手机端目标检测任务的神经网络，因此撰写这篇综述性报告，详细梳理目前手机端目标检测领域的神经网络应用现状。　　1959年，Hubel和Wiesel发现人类视觉系统中的可视皮层是采用分层机制处理信息的。受此启发，人们提出了

wenxuegeng 0喜欢 / 0评论 2020-06-08

Keras训练神经网络DEMO——全连接神经网络训练MNIST

　　Keras是搭建神经网络的一个框架，以代码简洁著称。MNIST数据集的输入是手写数字0~9的图片，标签是每张图片对应的数字，整个数据集可以直接从Keras.库中下载。下面使用Keras搭建一个双层的神经网络，测试它在MNIST数据集上的性能。　　3、将

liqing 0喜欢 / 0评论 2020-06-07

基于深度卷积神经网络的图像风格迁移与神经涂鸦系统的设计与实现

本文中设计并实现了一款基于卷积神经网络的图像风格迁移系统，可以通过神经表示来分离和重组任意图像的内容与风格，为艺术图像的创建提供了新的算法与算法框架；本文中还实现了神经涂鸦系统作为风格迁移功能的补充，神经涂鸦系统通过使用语义注释及手动创建像素标签的方法提高

hnyzyty 0喜欢 / 0评论 2020-06-05

AI安全对抗中，只用一招轻松骗过五种神经网络

但在大规模商业化的同时，也面临更多方面的威胁。对抗样本通过对图像做微小的改动，在用户无感知的情况下，会导致AI系统被入侵、错误命令被执行。欺骗AI系统做出错误的决断，将会给社会造成重大的损失。通过研究如何欺骗AI系统，对现有的薄弱点进行修补，使得AI系统更

georgesale 0喜欢 / 0评论 2020-06-05

神经网络中的批标准化

训练学习系统的一个主要假设是在整个训练过程中输入的分布保持不变。对于简单地将输入数据映射到某些适当输出的线性模型，这种条件总是满足的，但在处理由多层叠加而成的神经网络时，情况就不一样了。在训练过程中，每一层都需要不断地适应前一层得到的新分布，这就减慢了收敛

hnyzyty 0喜欢 / 0评论 2020-06-04

为什么神经网络如此强大？

众所周知，神经网络非常强大，可以将其用于几乎任何统计学习问题，而且效果很好。但是您是否考虑过为什么会这样?为什么在大多数情况下此方法比许多其他算法更强大?与机器学习一样，这有一个精确的数学原因。让我们以一个抽象的观点来阐述什么是机器学习问题。其中x是数据点

fengzhimohan 0喜欢 / 0评论 2020-05-29

你在打王者农药，有人却用iPhone来训练神经网络

在 iOS 设备上也可以直接训练 LeNet 卷积神经网络，而且性能一点也不差，iPhone 和 iPad 也能化为实实在在的生产力。Core ML 主要解决的就是最后的模型部署这一环节，它为开发者提供了一个便捷的模型转换工具，可以很方便地将训练好的模型转

liqing 0喜欢 / 0评论 2020-05-28

神经网络？决策树？都做不到！谁能解决可解释性AI？

来自IEEE研究员Cuntai Guan这样认为：“许多机器决策仍然没有得到很好的理解”。大多数论文甚至提出在准确性和可解释性之间进行严格区分。神经网络是准确的，但无法解释;在计算机视觉中，决策树是可解释的，但不准确。这意味着金融和医学等应用领域的从业者

WFRainn 0喜欢 / 0评论 2020-05-14

看得见的机器学习：零基础看懂神经网络

Machine learning is like highschool sex. Everyone says they do it, nobody really does, and no one knows what it actually is. [1

lgblove 0喜欢 / 0评论 2020-05-06

卷积神经网络模型可解释性

缺乏可解释性仍然是在许多应用中采用深层模型的一个关键障碍。在这项工作中，明确地调整了深层模型，这样人类用户可以在很短的时间内完成他们预测背后的过程。具体地说，训练了深度时间序列模型，使得类概率预测具有较高的精度，同时被节点较少的决策树紧密地建模。使用直观的

wenxuegeng 0喜欢 / 0评论 2020-05-04

决策树的复兴？结合神经网络，提升ImageNet分类准确率且可解释

鱼和熊掌我都要！BAIR公布神经支持决策树新研究，兼顾准确率与可解释性。然而，深度神经网络缺乏可解释性也是出了名的，这就带来了一种矛盾。决策树是一种用于分类的经典机器学习方法，它易于理解且可解释性强，能够在中等规模数据上以低难度获得较好的模型。之前很火的微

WhiteHacker 0喜欢 / 0评论 2020-04-26

网络特征处理基于图神经网络

我记得运筹学课本有一章节是讲过图论的。G=(V,E),V是土中节点的集合，E是边的集合，一个图中的节点个数为N.RNN提取的自然语言是一种序列化的数据，因此能够通过各种门提取序列特征，使得序列特征前后能够相互影响。推荐系统的关键是评价一个项目对用户的重要性

liqing 0喜欢 / 0评论 2020-04-23

神经正切，5行代码打造无限宽的神经网络模型

本文转自雷锋网，如需转载请至雷锋网官网申请授权。本文是对 ICLR 2020 论文《NEURAL TANGENTS: FAST AND EASY INFINITE NEURAL NETWORKS IN PYTHON》的解读，作者来自谷歌。最近的许多结果表明

玉来愈宏的随笔 0喜欢 / 0评论 2020-04-20

揭开黑盒一角！OpenAI发布“显微镜”，可视化神经网络内部结构

本文转自雷锋网，如需转载请至雷锋网官网申请授权。躺尸接近三个月的OpenAI博客终于有了更新，这次它为AI研究者带来的作品是“OpenAI Microscope”，中文译名OpenAI 显微镜。意为可以像实验室中的显微镜一样工作，帮助AI研究人员更好地理解

86357811 0喜欢 / 0评论 2020-04-15

【DL-3】循环神经网络（RNN）

RNN是一类用于处理序列数据的神经网络。这些序列比较长，且长度不一，比较难直接的拆分成一个个独立的样本来通过DNN/CNN进行训练。这幅图描述了在序列索引号t附近RNN的模型。1）x代表在序列索引号t时训练样本的输入。

wenxuegeng 0喜欢 / 0评论 2020-04-08

华为开源只用加法的神经网络：实习生领衔打造，效果不输传统CNN

无论是单个神经元的运算还是卷积运算，都不可避免地要使用乘法。然而乘法对硬件资源的消耗远大于加法。如果不用乘法，全部改用加法应该可以让运算速度大大提升。去年年底，来自北京大学、华为诺亚方舟实验室、鹏城实验室的研究人员将这一想法付诸实践，他们提出了一种只用加法

demm 0喜欢 / 0评论 2020-03-17

Bengio参与、LeCun点赞：图神经网络权威基准现已开源

现在我们有了专用的 Benchmark 工具来进行评测。近期的大量研究已经让我们看到了图神经网络模型的强大潜力，很多研究团队都在不断改进和构建基础模块。在这种情况下，即使是非图神经网络的性能也是可观的。近日，来自南洋理工大学、洛约拉马利蒙特大学、蒙特利尔大

fengzhimohan 0喜欢 / 0评论 2020-03-06

深度学习优缺点

但是，当神经网络规模逐渐增大，包含的隐藏层逐渐增多，此时采用BP算法的过程中，会出现梯度消失的过程，往往是因为误差消失而导致的，因此神经网络前面的权值几乎不会更新，因此导致了神经网络拟合数据的准确率受限制。因此，研究者为了尽可能避免神经网络过拟合的情况发生

cherry0 0喜欢 / 0评论 2020-03-03

搭建pytorch神经网络的常用两种方式

‘‘‘本节说明搭建pytorch神经网络的常用两种方式相比快速搭建法第一种可以个性化设置网络结构‘‘‘。‘‘‘结论：我们会发现 net2 多显示了一些内容, 这是为什么呢?原来他把激励函数也一同纳入进去了, 但是 net1 中,激励函数实际上是在 fo

cherry0 0喜欢 / 0评论 2020-03-01

Tensorflow--RNN-LSTM循环神经网络（四）

# Batch size : 批次(样本)数目。一次迭代所用的样本数目。Batch size 越大，所需的内存就越大。每一次迭代更新一次权重，每一次权重更新需要 Batch size 个数据进行 Forward 运算，再进行 BP 运算。# Epoch :

hnyzyty 0喜欢 / 0评论 2020-02-22

DeepMind发布神经网络、强化学习库，网友：推动JAX发展

DeepMind今日发布了Haiku和RLax两个库，都是基于JAX。而此次发布的两个库，分别针对神经网络和强化学习，大幅简化了JAX的使用。Haiku是基于JAX的神经网络库，允许用户使用熟悉的面向对象程序设计模型，可完全访问 JAX 的纯函数变换。RL

XuFangfang0 0喜欢 / 0评论 2020-02-21

动手学pytorch-经典卷积神经网络模型

卷积层块里的基本单位是卷积层后接平均池化层：卷积层用来识别图像里的空间模式，如线条和物体局部，之后的平均池化层则用来降低卷积层对位置的敏感性。卷积层块由两个这样的基本单位重复堆叠构成。在卷积层块中，每个卷积层都使用5×5的窗口，并在输出上使用sigmoid

wenxuegeng 0喜欢 / 0评论 2020-02-19

神经网络(1)

神经网络是一种模仿生物神经网络构造的数学模型。很多文章喜欢从生物的神经元结构方面入手，展开对人工神经网络的介绍。但那样会引入更多意味不明的单词，比如突触，树突，轴突……本文按照时间顺序依次介绍神经网络中的几个重要概念，并在当中穿插一些思考，大致分为以下几个

liqing 0喜欢 / 0评论 2020-02-14

keras API的使用，神经网络层，优化器

#通过Sequential创建网络。#通过Model创建模型

dataastron 0喜欢 / 0评论 2020-02-01

吴恩达深度学习课程第一课 — 神经网络与深度学习 — 第一周练习

“人工智能是新电力”这个比喻指的是什么？A.人工智能为我们的家庭和办公室的个人设备供电，类似于电力。D.与100年前开始的电力类似，人工智能正在改变多个行业。用于猫识别的图像是“结构化”数据的一个例子，因为它在计算机中表示为结构化的数组。人口数据集包含不同

georgesale 0喜欢 / 0评论 2020-01-31