人脸识别专家王国田:到底什么是人工智能、机器学习和机器视觉

lizhengjava 2017-03-18

如今,人工智能越来越多的被大家提及和应用,但是,到底什么是人工智能、机器学习和机器视觉?对于人工智能和它的细分领域,例如机器视觉,却很少能有人说得清楚它们到底是什么以及如何工作的。

今天,小编特意采访采访了人脸识别专家、获得国家科技进步奖二等奖、广东非思智能科技股份有限公司的CEO王国田博士,给大家介绍关于人工智能和人脸识别应用之间的相关技术概念。

人脸识别专家王国田:到底什么是人工智能、机器学习和机器视觉

人脸识别专家王国田博士

王国田博士解释道:

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

机器学习 ( Machine Learning, ML ) 是人工智能的一个研究分支,主要是设计和分析一些让计算及自动获取知识的算法,涉及到概率论、统计学、逼近论等多个领域。

深度学习( Deep Learning, DL )又是机器学习的一个分支,深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像、声音和文本。同机器学习方法一样,深度机器学习方法也有监督学习与无监督学习之分。

作为人脸识别专家,王国田博士特别指出:不同的学习框架下建立的学习模型很是不同,例如,卷积神经网络(Convolutional neural networks,简称CNNs)就是一种深度的监督学习下的机器学习模型,而深度置信网(Deep Belief Nets,简称DBNs)就是一种无监督学习下的机器学习模型。

因此,简单而言,人工智能、机器学习和深度学习是一种包含关系。我们通过在计算能力和计算方式上的探索在不断接近人工智能的本质——一个具备自我学习和应变能力的智能机体。但我们不能单纯地认为人工智能只是把数学模型做的更准确一点,让机器拥有拟人化能力是一个漫长的发展过程:毕竟从计算机诞生到现在的移动互联网,我们就用了70年的时间,在人脸识别技术领域浸研了二十年多年后,人脸识别专家王国田博士对此事深有体会。

人脸识别专家王国田:到底什么是人工智能、机器学习和机器视觉

王国田博士表示:大数据和机器学习让计算机变得特别聪明,以至于使计算机能够在某些领域很大程度的超过人类的极限能力,比如谷歌AlphaGo战胜了围棋世界冠军李世石,而人工智能的目的绝对不是让计算机和人类下下棋而已,可以说未来几十年将面临由大数据带来的智能革命,机器会获得越来越全面的能力。

但实际上,人工智能的应用范围博大精深,繁冗复杂,在每一个垂直领域的应用都需要克服难以想象的障碍。所以,我们先拆分大脑的功能,让机器一点点实现智能化。人的大脑需要借助各种感官,如眼睛、耳朵等,感知外界信息,然后进行判断,这其中用机器来代替人眼来做测量跟判断的动作,称为机器视觉,机器视觉是人工智能学科中发展的最为快速的分支,而当今大家熟知的人脸识别技术就是机器视觉最富有挑战性的课题之一。

在人脸识别领域,王国田博士特别强调:传统的人脸特征都是人工选取,例如SIFT,HOG等等,但是人工选取特征是一件非常费力事情,并且选取特征的好坏很大程度上依赖于经验和运气,而深度学习是一种无监督学习自动学习特征的方法,可以更好的表达样本。人脸识别以其所具有的非侵入性、便捷性、安全性等特性拥有着广阔的应用前景和科研价值,因此使用深度学习方法的对人脸识别进行研究,可以在光照、表情、姿态以及低分辨率等问题进行改进。

人脸识别专家王国田:到底什么是人工智能、机器学习和机器视觉

在人脸识别专家王国田博士看来,基于深度学习的人脸识别方法,以稀疏自编码神经网络和softmax分类器构建深度层次网络为例,并对该深度层次网络进行了训练。为了验证深度学习方法的人脸识别率,分别在ORL、Yale、Yale-B以及PERET人脸数据库上做算法测评,测试内容有softmax分类器人脸识别、深度网络顶层微调算法和深度网络整体微调算法三个方面。对各个数据库的人脸图像进行的预处理有直方图均衡化、非局部均值算法、小波变换处理、Retinex图像增强算法以及同态滤波算法。另外,使用深度网络整体微调算法对低分辨率问题做了进一步验证。最后,利用matlab GUI编程实现一个基于稀疏自编码神经网络和softmax分类器的人脸识别系统,该系统的深度层次网络的层次和节点可调,且具备完整的识别功能。

王国田博士总结道:实验结果表明深度学习方法对原始数据具有高效准确的抽象表达,在光照、表情、姿态以及低分辨率的条件下取得了良好的表现,尤其是在低分辨率的情况下。

相关推荐