strint 2019-05-22
机器学习(ML)是人工智能(AI)的子集。这是一组实现人工智能的方法。ML旨在使计算机系统能够“学习”,使用提供的数据并作出准确的预测。可以猜到,深度学习(DL)是ML的一个子集。它只是实施ML的方式之一。换句话说,DL是机器学习的下一个发展。
DL算法可以被视为识别模式和分类各种类型信息的方法,就像我们使用我们的大脑一样。大脑通常通过标记处理其收到的信息并将项目分配到各种类别。DL算法的概念类似于我们的大脑吸收新信息的过程:在理解它之前尝试将其与已知事物进行比较,找到相似之处。最强大的算法,模仿我们的大脑做出决策的方式,是人工神经网络(ANNs),并且DL基于它们并不奇怪。
ANN是一个用于模拟复杂系统行为的信息处理概念。人工神经网络的主要思想是利用人类大脑的方式来解决任何特定问题。ANN由多个节点构成,这些节点模拟人脑的生物神经元。节点被组织成层并连接起来进行通信,通常是在邻近层之间。数据通过层从输入层传递到输出层。层中的节点数可以不同。
DL是一个ANN,但是它有一系列层,每一层都创建了转换输入数据的更抽象的表示。这个层次结构识别输入特性,并根据数据创建一组新特性。输出层结合了所有这些特性并进行预测。一个简单的人工神经网络只有一个隐藏层,不能学习像DL这样的复杂特征,因为它有多个隐藏层。它拥有的层越多,学习到的特性级别就越高。数据和函数呈指数关系。例如,拥有十个特性需要提供至少100个数据值。DL非常昂贵,需要大量的数据集来训练和大量的计算资源。它在20世纪80年代首次理论化,直到最近才变得有用的主要原因有两个:
DL需要大量标记数据,并且最近才发明了适当的数据存储,而数据标记过程使结果变得单调乏味。
DL需要大量的计算能力。高性能GPU具有广泛用于DL的并行体系架构。与集群或云计算相结合,它提供了减少训练时间的机会。
DL不仅是更多的隐含层,还有一些深度学习技术,如卷积神经网络(CNN),循环神经网络(RNN),生成对抗网络(GAN)。DL专门研究像大脑这样的模型。识别一个网络比其他网络更好是错误的;它们更适合于特定任务。CNN通过从图像中提取特征而很好地工作。它们在系统训练一组图像时实现,使CNN对计算机视觉任务非常精确。CNNs不需要手动提取特征,而是直接从图像中提取特征。
虽然CNNs通常用于图像处理,但是另一类DL模型RNNs通常用于语言处理。它们具有内置的反馈循环,对内存进行建模,其中层的输出可以反馈到自身中,就像循环一样,这会产生记忆效应。RNNs可以通过处理真实的数据序列来预测接下来会发生什么来训练序列生成。
在GANs中,两个神经网络分别扮演着不同的角色:生成器和判别器。第一个试图创建有说服力的“假”数据,而另一个试图找到假数据和真实数据之间的差异。每个训练周期使得生成器更好地创建假数据,并且判别器在识别假数据时更敏锐。两者都在对抗中得到改善,双方都在人与人之间的真实辩论中获利。GANs可用于非常有趣的应用程序,包括从书面文本生成图像。
DL模型已应用于许多领域和概念,如社交网络过滤,图像识别,金融欺诈检测,语音识别,计算机视觉,医学图像处理,自然语言处理,视觉艺术处理,药物发现和设计,毒理学,生物信息学,客户关系管理,音频识别等。事实证明了在ML技术中处于领先地位;DL的深度不在于层数,而在于我们大脑不同专业结构的建模。