小道一只朱 2017-01-13
去年对我影响比较大的一本书是尤瓦尔·赫拉利的《人类简史》,所以知道他的新书《未来简史》即将上市,我还是比较关注的。不过,这本书还没有上市,我倒是听到了另一位著名人士所描绘的 AI 未来简史。
1月10日,创新工场宣布正式成立人工智能工程院,院长李开复与两位副院长王咏刚、王嘉平亮相,正式发布了 AI 战略白皮书(在 AI100 后台回复 “白皮书” 查看 “创新工场人工智能战略白皮书2017”)。我受邀代表 AI100 参加了这个活动。一个投资机构成立工程院当然是一件新鲜事,而这份白皮书也是非常的流畅明晰,值得推荐给所有关心 AI 的人士细读,不过我当天最大的收获,是李开复先生在演讲和媒体交流环节中谈到的几个重要观点。
李开复本人三十多年前在卡耐基梅隆大学攻读博士时,所研究的课题即是以统计学为基础的语音识别系统,放到今天,这就是正宗的机器学习课题,他确实是根正苗红的人工智能专家。三十年来,人工智能这个领域进展巨大,但是基本思想方法甚至重要理论,并没有本质改变,所以李开复是机器学习与人工智能的内行,看得会比其他人更清楚。毫无疑问,对于我以及所有关心 AI 这个话题的人,李开复的观点是非常值得深入思考的。
李开复对于 AI 到底有什么观点?虽然他并没有明确的这么表达,但是把他的观点串起来,我认为他实际上梳理出整个 AI 产业未来十年的一个“简史”。我把这个简史概括为“ AI 红利三段论”,也就是 AI 发展过程中将会出现的三阶段红利期。
请注意,这三段红利期的划分和命名完全是是我的概括,如果与李开复先生的表述有矛盾,请以他的表述为准。
第一个红利期是“技术创新红利期”,时间短则两三年,长则三五年。
李开复认为近年来人工智能在深度学习、增强学习等连接主义学派方向上取得了无可争议的重大学术突破,具体体现在计算机视觉、语音识别、博弈等领域,已经达到和超过了人的水准。而这些技术可以有条件的向诸多其他垂直行业拓展,短期内即可带来巨大突破,创造可观的价值。在这个方向上,学术上的通道已经打开。
按照李开复的说法,大量举手可得的桃子就在眼前,人工智能有机会在若干行业激发数千亿美元的创新,自然也有希望出现一批明日的明星企业。不过李开复也指出,桃子好看不好摘,要想把握住技术红利期的机遇,有几个条件是绕不过去的。
首先是要有一流的 AI 科学家。因为近年来的学术突破虽然指明了方向,但是具体应用在各个行业,各种大大小小的难题仍然存在,要想解决问题,取得最好的结果,还必须进行大量的创新,只有一流的 AI 专家才能做得到。而现在的一流专家,是在这一轮人工智能热潮到来之前就投入其中的,数量非常有限,所以对于一流人才的争夺战现在是个核心竞争。
其次是要有一流的工程化能力。因为现在的 AI 科学家大部分是在科研环境中培养出来的,不但欠缺工程化、产品化的经验,而且对于错综复杂的商业环境也并不熟悉,更缺乏解决实际问题所必须的数据资源。所以AI科学家要想在AI产业中有一番作为,还必须有一个强悍的工程化平台的支撑。这包括工程团队,更包括一整套的配套腐化基础设施。
第三是要有较高的启动资金。当前 AI 创业的硬件成本门槛较高,已经不是几个年轻人猫在大学生宿舍里熬熬夜就可以出头的时代。李开复举了一个例子,创新工场投资的一家 AI 创业企业,才刚一启动就把拿到的钱差不多花光了,仔细一了解情况,原来他们光买硬件就花了三百万,这还只是刚入门。很显然,这么高的门槛,确实不是小打小闹的团队能够承受的了。
另一重要条件是要从“低摩擦”的行业切入。所谓低摩擦行业,就是数据资源获取难度和成本较低,而对于解决核心问题来说又相对完备,并且相关商业和政策摩擦很低,获取收益的方式比较直接。举例来说,证券投资对于人工智能来说就是典型的低摩擦行业,医疗健康的摩擦稍高些,其他大多数行业摩擦更高。低摩擦行业比较容易很快取得成功,但是这样的行业数量有限,存在一个“跑马圈地”的竞争。
创新工场当前对于 AI 的投资战略基本上围绕李开复对 AI 技术发展的方向和第一阶段红利期的判断展开,其 AI 工程院就是特别为解决这些问题而设立的。工程院一方面为科学家争取低成本的优质数据资源,降低摩擦,另一方面为他们铺垫高质量的工程化、产品化服务平台,批量的将一批数学天才快速培养成为优秀的 AI 人才,围绕 AI 专家形成快速的技术突破和工程开发能力。
当前 AI 很火,但是质疑的声音不是没有,历史上 AI 好几次上演悲情反转,每每人们以为终极算法即将问世,高歌猛进之后却很快撞上一堵厚墙,弄得人心灰意冷。很多人担心这次 AI 热潮又是 yesterday once more,担心投资机构对于 AI 的加持,或是炒作,或是对未来技术突破做的不切实际的押宝。
而通过李开复对于“技术红利期”的解说,我了解到,创新工场对于 AI 当前所面临的挑战非常清楚,绝无刻意淡化之意,也并不预期科幻级人工智能将很快出现。创新工场之所以看好 AI 的发展,并不是基于对未来的浪漫猜想,而是基于已经发生的事实,特别是基于李开复、王咏刚、王嘉平等人对于 AI 技术发展内在规律的认识。
在华盛顿大学教授佩德罗·多明戈斯的近作《终极算法》一书中,作者将机器学习划分为五大学派,深度学习属于其中的连接学派,其他几派分别是符号学派、类推学派、遗传学派和贝叶斯学派。五大学派代表五大方向,历史上此消彼长,不断上演反转神剧。不过创新工厂认为,以深度学习为代表的连接学派对于高度复杂的问题具有最强的建模和描述能力,因此最具希望。也就是说,目前正在发生的这一轮 AI 热潮,确实与之前的那几轮有本质的差别,一定能够取得切实的进展,不容犹疑和错过。
对我来说,这是一个坚实可信赖的逻辑。
第二个红利期是“平台及应用红利期”。李开复认为大约三五年之后出现,而在这个阶段到来之后,非 AI 科班出身、数学水平中上的技术人员和传统的开发者将迎来创建爆款应用和行业级平台的良机,上面提到的几个创业成功的条件都将发生戏剧性的变化。
按照 AI 工程院副院长王咏刚的解释,过去一两年出现了一次 AI 工具平台和开发框架的“婴儿潮”,被点名的有 Tensor Flow, Caffe 和 MXNet,但一个完整 AI 生态所必备的,从芯片、总线、平台、架构到框架、应用模型、测评工具、可视化工具、云服务的模块化与标准化工作,尚需三年或更长时间才能真正成熟。这些工具一旦接近成熟,对于 AI 技术人群来说,创业门槛将大幅度下降。
首先你不必非要是 AI 领域的科学家、博士,也不必非要是顶尖的数学天才,只要具备扎实的基本功,能够熟练使用工具,能够快速学习提高,就有机会成功。其次,AI 创业的资金门槛也将大幅度下降,小团队创业的机会开始大量涌现。虽然低摩擦行业的大桃子可能已经被前一阶段成功企业摘光了,但在中低度摩擦的行业里,只要具备相应的工程化能力、商业模式创新能力、数据资源获取能力,同样可能取得非凡的成就。
我个人对于这个红利期非常感兴趣,也认为这是有意转战AI的普通程序员们最需要关注的一个机会。稍后我将撰文详细阐述我的看法。
第二红利期之后,将进入第三个红利期,也就是所谓的“商业红利期”。这个时期所有中低摩擦领域中踮着脚跳一跳就能摘到的大桃子已经被抢光,AI 创业进入高摩擦领域,这个时候拼的已经是商业、社会和行政资源整合能力了,技术的重要性开始下降。这个阶段当然并不在创新工场的投资战略覆盖之中,因此李开复也没有更多的谈及。
不过有一点需要明确,在 AI 不同应用领域中,三个红利期的出现不会是完全同步的。从下面这张精心归纳的图中可以看到,在大数据中,技术红利期与工具红利期的划分并不明显,而在其他若干方向,三到五年之后将出现一个明确的工具与平台的成熟阶段,成为两个红利期的明确的分界线。
创新工场提出来的这个 AI 红利三段论,我是认可的。IT 产业发展至今六七十年,前面一大半我没有赶上,但后面的这一小半,也就是互联网和移动互联网的全过程,我是亲身参与其中。
两次产业热潮基本上都经历了类似的三个时期。就拿移动互联网来说,第一波吃到技术红利的苹果和谷歌,都进行了长期的积累和创新,突破了很多技术难题才摘到桃子。
等到开发工具成熟,AppStore 等应用市场出现,一大批具有很强工程化能力的开发者杀入这个领域,迅速的构建爆款大众应用或者行业级平台,体现出很强的颠覆性,也掀起了移动互联网的高潮。
但今天,移动互联网正在进入到第三个阶段,App 开发技能的市场稀缺性大幅下降,最近新出来的很多 App 都是传统行业处于优势地位、具有超强资源整合能力的企业所主导,对于普通技术人员来说,创业红利期接近尾声。通过这样一个对比,我们可以确认李开复所描述的 AI 红利三段论背后的逻辑是可信的。
如果说在这三段之中,创新工场选择的发力点是在第一阶段,那么 AI100 作为一个人工智能技术产业社区又有怎样的一个发展逻辑呢?我将择机撰文阐述。
【在 AI100 后台回复 “白皮书” 查看 “创新工场人工智能战略白皮书2017”】