大数据为什么不够聪明?机器要如何走向强人工智能

大数据周刊 2019-10-12

大数据为什么不够聪明?比概率语言更强大的思考工具是什么?科幻电影中的强人工智能到底怎样实现?如何让智能机器像人一样思考?搞清楚因果关系才能拨云见日。

图灵奖得主、“贝叶斯网络之父”朱迪亚·珀尔(Judea Pearl)的重磅力作 《为什么:关于因果关系的新科学》 中就为我们解答了这些问题。

大数据为什么不够聪明?机器要如何走向强人工智能

人工智能领域中的大多数问题都是决策问题。1939 年,统计学家亚伯拉罕·沃德撰文指出参数估计和假设检验都是统计决策问题,甚至计划把整个统计学纳入统计决策理论的框架。损失函数是统计决策的起点,给定了损失函数,贝叶斯学派将始终如一地选择期望损失最小的决策,有或没有观测数据时都是如此。频率派则需要预先制定决策规则,基于损失函数和样本定义一个风险函数,然后根据某些原则(如极大极小原则、贝叶斯风险原则等)来选择最优的决策。

如果决策是基于被动接受的观测数据,那么它就处于因果关系之梯的第一层级,强烈地依赖于观测数据,因而难免带有偏颇。而有了第二层级的利器——干预,决策就可以不受观察样本的束缚,把一些样本无法反映的事实揭露出来。简而言之,达到第二层级的 AI 将具有主动实施行动来分析因果效应的能力,这种能力使得决策行为更加智能化。

第三层级的反事实推理允许机器拥有“想象能力”。反事实推理考虑的是一个假想世界,是无法通过直接观测数据进行推理的,必须借助一个因果模型。

大数据为什么不够聪明?机器要如何走向强人工智能

因果关系之梯

时至今日,深度学习依然是 AI 的热点方法,甚至有人将之盲目地等同于 AI。其实,机器学习的方法多如牛毛,深度学习只是沧海一粟。理论上可以证明,人工智能即便在因果关系之梯的最低层级做到极致,也无法跃升到干预层面,更不可能进入反事实的世界。

作为处在因果关系之梯最低层级的机器学习技术,大数据分析就是多变量统计分析,深度学习就是隐层多了一些的神经网络而已,理论上没有太多新意。珀尔教授认为大数据分析和深度学习(甚至多数传统的机器学习)都处于因果关系之梯的第一层级,因为它们的研究对象还是相关关系而非因果关系。

珀尔并没有贬低处于因果关系之梯最低层级的相关性分析,他只是在提醒我们不要满足于这个高度,还要继续向上攀登。不同层级之间也可以形成合作,例如,在实践中,深度学习可用于拟合强化学习中的策略,二者强强联手,成为“深度强化学习”,后者曾作为核心技术之一在 AlphaGo(“阿尔法狗”)那里大放异彩。

众所周知,这轮 AI 的爆发在很大程度上得益于算力的提升,例如,深度学习就是人工神经网络借助算力的“卷土重来”,把数据驱动的方法推向了一个巅峰。人们甚至产生了一个幻觉 ——“所有科学问题的答案都藏于数据之中,有待巧妙的数据挖掘技巧来揭示”。珀尔教授批判了这种思潮,他将因果模型置于更高的位置,把数学或统计建模的荣耀重新归还给了相应领域的专家。我们希望,未来的机器学习可以不再靠炼金术士的碰运气而获得成功,随着知识推理和计算越发受到关注,可解释 AI 将从关于因果关系的新科学中汲取更多的力量,甚至可以闯进反事实的世界。

DeepMind 研发的 AlphaGo 围棋程序在 2016 年首次打败了人类顶尖围棋高手李世石,次年横扫所有人类高手取得全胜(包括以 3∶0 战胜柯洁)。聂卫平(九段)称它的水平为“至少二十段”。AlphaGo 采用深度强化学习和蒙特卡罗树搜索,其最终版本 AlphaGo Zero 仅需要 3 天便可自我训练至战胜李世石的水平。2017 年,DeepMind 宣布 AlphaGo“退役”, 不再参加任何围棋比赛。

大数据为什么不够聪明?机器要如何走向强人工智能

在棋类游戏中,围棋所包含的巨大的搜索空间(其状态数远远超过整个宇宙中的原子数)一直是机器学习未能攻克的难题,甚至一度被认为在近期内是不可能被 AI 解决的。AlphaGo 的成功不仅让人们看到了强化学习和随机模拟技术(也称“蒙特卡罗”技术)的魅力,也让深度学习变得更加炙手可热。冷静之余,人们认识到 AlphaGo 的算法更适用于大规模概率空间的智能搜索,其环境和状态都是可模拟的。DeepMind 的创始人德米斯·哈萨比斯表示,对于那些环境难以模拟的决策问题(如自动驾驶),这些算法也无能为力。珀尔在《为什么》第十章也谈论了 AlphaGo,他认为缺乏可解释性是它的硬伤。

拿强化学习来说,它不同于有监督学习(supervised learning)和无监督学习(unsupervised learning),是基于马尔科夫决策过程发展起来的第三类机器学习方法——智能体通过与环境互动变得越来越“聪明”。强化学习和因果推断都寻求策略(policy),其中,行动之间是有因果关系的,但因果推断更开放一些,它可以利用数据之外的知识来推断策略的效果。强化学习允许推断干预的结果,因此能攀上因果关系之梯的第二层级。通过模拟环境,强化学习无须从现实世界获取观测数据来训练模型,所以也有可能产生反事实从而登上因果关系之梯的第三层级。尽管目前的强化学习很少用到先验知识,我们仍很好奇强化学习和因果推断的理论联系。

相关推荐