黄刚的技术 2016-02-20
卡耐基梅隆大学的Sandra Kuhlman使用荧光成像技术获得的神经网络图像,其中可以看到单个大脑神经元细胞。
为了提高效率以及对自身的理解,我们人类在开发更强大的计算机和打造自动化世界上进行了很大的投入。尽管现在计算机已经可以毫不停顿地高速执行大量计算,但和自然界中的生物计算机(大脑)比起来,仍旧还是望尘莫及。但人类从未停止过对大自然般造化之力的追求,卡内基梅隆大学(CMU)正在进行的一项计算机科学研究有望加深我们对生物的理解,并以此促进类大脑算法的开发。
卡内基梅隆大学计算机科学系和认知神经基础中心(CNBC,卡耐基梅隆大学与匹兹堡大学之间的一个合作研究项目)教授Tai-Sing Lee领头的研究项目将会尝试使用反向工程研究大脑,并希望能够以此揭示大脑的学习算法,将其应用于推进机器学习算法。按照计划,这一研究项目将持续五年,共耗资约1200万美元。这些资金来自于高级情报研究计划署(IARPA)大脑皮层网络机器智能(MICrONS)计划;该项目正在帮助推动美国总统奥巴马的脑计划(BRAIN Initiative)彻底刷新我们对人类大脑的理解。
Lee说:「MICrONS在设计和范围上与首次测绘排序人类基因的人类基因组计划(Human Genome Project)相似。它很有可能将具有长期的影响并有望彻底改变神经科学和人工智能。」
除了生物学家在努力揭示大脑的秘密之外,计算机科学家也一直在忙于改进机器学习,并在近几十年内取得了显著的进步。
机器学习的主要目标是使用计算机破译数据中的模式并生成模型,然后再使用该模型来预测新数据;与此同时,模型还会与新数据共同进化使之变得更为稳健。机器学习算法为近年来的许多进步做出了贡献,包括基因组分析、大规模大数据应用和自动驾驶汽车。
新技术的发展让收集关于大脑活动的海量数据成为可能,更重要的是,新技术让我们可以对这些数据进行分析并得出重要的结论。Lee领导的项目的一个主要目标是创建一个代表神经回路的大型数据库。为了实现这一目标,Lee所领导的团队将与另一支Wyss生物启发工程研究所(Wyss Institute for Biologically Inspired Engineering)的MICrONS团队建立合作,该团队的领头人是哈佛医学院遗传学教授George Church,目前正与来自冷泉港实验室、麻省理工学院和哥伦比亚大学的研究者合作开发用于重建卡耐基梅隆大学所记录的全部神经元回路的革命性技术。这个数据库与另外两个其它MICrONS团队贡献的数据库的规模将是前所未有的;建成后还将开放给世界上其它地方的研究者用于研究。而Lee也将和卡耐基梅隆与CNBC生物科学助理教授Sandra Kuhlman、约翰霍普金斯大学与彭博公司的特聘认知科学教授Alan Yuille对其中的数据进行分析。
在这个MICrONS项目中,相关研究人员除了可以提高对大脑计算原理的认识,还能使用这些大型数据库评估一些计算和学习模型,并利用反向工程处理这些数据以打造更好的计算机学习和模式识别算法。
而目前已经在机器学习中得到应用的技术是神经网络:其中的算法基于类似动物神经元的可互相分享数据并作出计算的简单计算单元。神经网络在1990年代达到过一次研究顶峰,近年来随着计算机算力与数据集的增长,研究热度又再次回升。并在一些不同的领域产出了一些有趣的应用,包括面部识别、语音和手写文字识别、自动驾驶汽车的自动决策、自动交易和预防金融诈骗等。
Lee说:「但今天的神经网络实质上使用的是1980年代初期开发的算法。它们是很强大,但它们仍然无法达到人脑算法那样的高效和强大。比如说学习识别一个物体,计算机可能首先需要成千上万张带有标签的样本,还需要进行监督式的教导才行;而人类则只需少量样本且可能不需要监督。」
人工神经网络的信息处理是单向的:从输入节点到输出节点。而大脑的工作方式则很不相同。人类大脑由许多神经元构成,这些小单元可以通过巨大的电脉冲网络互相发送信息,这些信息调控了所有大脑所控制的身体功能,包括理解场景和肢体运动等。通过最近的研究数据可以发现,大脑中的神经元是高度互连的,每一步处理过程都可能产生反馈。尽管近几十年来生物学家已经在相关研究上取得了丰硕的成果,但到目前为止,科学家还并没有完全理解神经元的工作机制。而一旦理解其中的机制,我们可能就将有能力打造出更有能力且更近似于人脑的神经网络。
为了更好地理解生物神经网络和它们的反馈回路,Kuhlman将使用一种被称为「双光子钙成像显微镜(2-photon calcium imaging microscopy)」的技术来记录上万个小鼠神经元处理视觉信息时所产生的信号。记录下的数据将用于帮助打造一个互连神经元模型。她指出,几年前这样的成果还无法实现,因为当时的观测精度有限,几个在一起的神经元会被同时观测到,而且单次实验时也只能观测到几个或十几个神经元。
「通过将分子传感器与光学方法的复杂组合整合起来检测神经活动,现在就算不能监控全部神经元,也有可能可以实时追踪一个大脑区域内神经元的大部分神经动态。」Kuhlman说,「因此我们可以得到一个巨大的数据集,帮助我们详细认识视觉皮层某个区域中神经元的行为。」
科学家认为如果我们能以某种方式了解大脑,那么我们就能知道如何复制它,而我们的机器也将有能力靠自己学习。(一个项目同时实现这两个目标非常符合卡内基梅隆大学的跨学科文化。)
研究人员希望使用这个大规模数据集解开神经网络的复杂难题。他们的目标是将获得的新知识应用到机器学习算法上,使他们可以使用少得多的样本就能开发出模型。这对未来具有重要的意义。Lee说:「希望这些知识可用以促进新一代机器学习算法的开发,使人工智能机器可以在不需要监督的坏境下通过少量样本进行学习,而这正是人类智能的标志。」
「从这些大规模数据中提取大脑学习和推理的秘密算法以推动机器学习的发展是颇具野心的,可能是这个项目中最不能明确的一部分。」卡耐基梅隆大学计算机科学学院院长Andrew Moore说,「这就相当于登月计划,但卡耐基梅隆是做这件事最好的地方,因为我们在人工智能方面有非常强大的传统和社区。我们还有一个与认知神经基础中心和大学的BrainHub计划有合作的强大的理论和实验神经科学家社区。」(BrainHub是一个神经科学研究倡议,该倡议的目的是将大学的生物学、计算机科学、心理学、统计学与工程学结合起来研究理解大脑的结构和行为如何产生复杂行为。)
纽约大学数据科学中心主任Yann LeCun在卡内基梅隆大学的一场新闻发布会上对此评论说:「人工智能在不断进步中从失败走向失败,但这次可能又是一次飞跃。」