大数据为什么不够聪明？机器要如何走向强人工智能

大数据为什么不够聪明？比概率语言更强大的思考工具是什么？科幻电影中的强人工智能到底怎样实现？如何让智能机器像人一样思考？搞清楚因果关系才能拨云见日。

图灵奖得主、“贝叶斯网络之父”朱迪亚·珀尔（Judea Pearl）的重磅力作《为什么：关于因果关系的新科学》中就为我们解答了这些问题。

人工智能领域中的大多数问题都是决策问题。1939 年，统计学家亚伯拉罕·沃德撰文指出参数估计和假设检验都是统计决策问题，甚至计划把整个统计学纳入统计决策理论的框架。损失函数是统计决策的起点，给定了损失函数，贝叶斯学派将始终如一地选择期望损失最小的决策，有或没有观测数据时都是如此。频率派则需要预先制定决策规则，基于损失函数和样本定义一个风险函数，然后根据某些原则（如极大极小原则、贝叶斯风险原则等）来选择最优的决策。

如果决策是基于被动接受的观测数据，那么它就处于因果关系之梯的第一层级，强烈地依赖于观测数据，因而难免带有偏颇。而有了第二层级的利器——干预，决策就可以不受观察样本的束缚，把一些样本无法反映的事实揭露出来。简而言之，达到第二层级的 AI 将具有主动实施行动来分析因果效应的能力，这种能力使得决策行为更加智能化。

第三层级的反事实推理允许机器拥有“想象能力”。反事实推理考虑的是一个假想世界，是无法通过直接观测数据进行推理的，必须借助一个因果模型。

大数据为什么不够聪明？机器要如何走向强人工智能

因果关系之梯

时至今日，深度学习依然是 AI 的热点方法，甚至有人将之盲目地等同于 AI。其实，机器学习的方法多如牛毛，深度学习只是沧海一粟。理论上可以证明，人工智能即便在因果关系之梯的最低层级做到极致，也无法跃升到干预层面，更不可能进入反事实的世界。

作为处在因果关系之梯最低层级的机器学习技术，大数据分析就是多变量统计分析，深度学习就是隐层多了一些的神经网络而已，理论上没有太多新意。珀尔教授认为大数据分析和深度学习（甚至多数传统的机器学习）都处于因果关系之梯的第一层级，因为它们的研究对象还是相关关系而非因果关系。

珀尔并没有贬低处于因果关系之梯最低层级的相关性分析，他只是在提醒我们不要满足于这个高度，还要继续向上攀登。不同层级之间也可以形成合作，例如，在实践中，深度学习可用于拟合强化学习中的策略，二者强强联手，成为“深度强化学习”，后者曾作为核心技术之一在 AlphaGo（“阿尔法狗”）那里大放异彩。

众所周知，这轮 AI 的爆发在很大程度上得益于算力的提升，例如，深度学习就是人工神经网络借助算力的“卷土重来”，把数据驱动的方法推向了一个巅峰。人们甚至产生了一个幻觉 ——“所有科学问题的答案都藏于数据之中，有待巧妙的数据挖掘技巧来揭示”。珀尔教授批判了这种思潮，他将因果模型置于更高的位置，把数学或统计建模的荣耀重新归还给了相应领域的专家。我们希望，未来的机器学习可以不再靠炼金术士的碰运气而获得成功，随着知识推理和计算越发受到关注，可解释 AI 将从关于因果关系的新科学中汲取更多的力量，甚至可以闯进反事实的世界。

DeepMind 研发的 AlphaGo 围棋程序在 2016 年首次打败了人类顶尖围棋高手李世石，次年横扫所有人类高手取得全胜（包括以 3∶0 战胜柯洁）。聂卫平（九段）称它的水平为“至少二十段”。AlphaGo 采用深度强化学习和蒙特卡罗树搜索，其最终版本 AlphaGo Zero 仅需要 3 天便可自我训练至战胜李世石的水平。2017 年，DeepMind 宣布 AlphaGo“退役”，不再参加任何围棋比赛。

大数据为什么不够聪明？机器要如何走向强人工智能

在棋类游戏中，围棋所包含的巨大的搜索空间（其状态数远远超过整个宇宙中的原子数）一直是机器学习未能攻克的难题，甚至一度被认为在近期内是不可能被 AI 解决的。AlphaGo 的成功不仅让人们看到了强化学习和随机模拟技术（也称“蒙特卡罗”技术）的魅力，也让深度学习变得更加炙手可热。冷静之余，人们认识到 AlphaGo 的算法更适用于大规模概率空间的智能搜索，其环境和状态都是可模拟的。DeepMind 的创始人德米斯·哈萨比斯表示，对于那些环境难以模拟的决策问题（如自动驾驶），这些算法也无能为力。珀尔在《为什么》第十章也谈论了 AlphaGo，他认为缺乏可解释性是它的硬伤。

拿强化学习来说，它不同于有监督学习（supervised learning）和无监督学习（unsupervised learning），是基于马尔科夫决策过程发展起来的第三类机器学习方法——智能体通过与环境互动变得越来越“聪明”。强化学习和因果推断都寻求策略（policy），其中，行动之间是有因果关系的，但因果推断更开放一些，它可以利用数据之外的知识来推断策略的效果。强化学习允许推断干预的结果，因此能攀上因果关系之梯的第二层级。通过模拟环境，强化学习无须从现实世界获取观测数据来训练模型，所以也有可能产生反事实从而登上因果关系之梯的第三层级。尽管目前的强化学习很少用到先验知识，我们仍很好奇强化学习和因果推断的理论联系。

大数据为什么不够聪明？机器要如何走向强人工智能

大数据周刊