lanyun0 2019-12-17
2016 年,AlphaGo 在与人类围棋高手李世石的“人机大战”中一战成名,正式拉开了“人工智能元年”的序幕。正是从那一年开始,“人工智能”这个曾经只存在于科幻电影中的名词,成为了寻常百姓日常生活的话题之一。深度学习技术的爆发,为科技产业打开了新的大门,包括美国、中国等国在内的国家政府更是将人工智能定为国家未来发展计划的重要一环…种种迹象都昭示着:人工智能的时代来临了。
四年过去了,人工智能产业经历过狂热的高潮,也迎来了一次巨大的“洗牌”。人们也终于从狂热中冷静了下来:一切对于人工智能的期待似乎有些过早、过高、过于心急了。InfoQ 见证了人工智能技术的迭代与产业的革新,本文将从技术、企业、产业三个方面,回顾 2016 年到 2019 年间,人工智能领域经历的“大洗牌”。
人工智能的发展需要三大要素的支持:算法、算力、数据。
随着“人机大战”落下帷幕,深度学习成为了企业、研究机构重点关注的对象。虽然有关深度学习的研究与应用早已展开,但是“人机大战”之后,行业出现了更加集中的爆发。
作为机器学习的分支,深度学习要解决的就是三要素中算法的问题。但是,对于开发者来说,从零开始实现一套神经网络费时费力,因此为了支持深度学习得到更好地应用,深度学习框架应运而生,并成为展示企业或研究机构 AI 研发实力的重要产品。
2016 年 -2017 年,几乎所有的科技巨头都推出了自家生产的深度学习框架:
随着技术迭代,一些框架不得不退出了历史舞台:2017 年 9 月,Theano 功成身退;同年,CNTK 正式更名 Cognitive Toolkit,以新的身份继续服务开发者。而 deepleanring4J、H2O 等框架,虽然仍在提供服务,但是已经不再是主流的选择。
到了 2019 年,深度学习框架几乎呈现出了 PyTorch 和 TensorFlow 两强争锋的局面,PyTorch 以其易用性成为了学术界的首选,有数据显示:2019 年主流学术顶会的大多数论文都是用 PyTorch 实现的;而 TensorFlow 以其工程方面的优势,仍然为工业界依赖。
另有一个趋势是:深度学习框架之间的趋同性越来越明显,主流框架支持的编程语言、硬件设备、功能等等越来越相似。这也昭示了其背后研发机构或企业的“野心”,即:占有整个机器学习垂直市场,成为市场唯一支持的机器学习框架。
虽然就目前形势来看,这一野心暂时没有人可以完成,但是,一个不争的事实是:科技巨头们确实已经垄断了深度学习框架,其他科技公司要么基于这些框架进行开发,要么把自己研发的框架产品并入这些巨头的框架中。
算法已经被科技巨头紧紧捏在手里,算力也不例外。
AI 系统进行计算往往需要消耗大量的算力,而传统 CPU 由于内核数量较少,并专为通用计算而设计,因此无法承受 AI 计算所需。英伟达公司生产的用于图像处理的芯片 GPU,是一种特殊类型的处理器,具有数百或数千个内核,经过优化,可并行运行大量计算。虽然 GPU 在游戏中以 3D 渲染而闻名,但它们对运行分析、深度学习和机器学习算法尤其有用。GPU 允许某些计算比传统 CPU 上运行相同的计算速度快 10 倍至 100 倍。
短短几年时间,GPU 成为了 AI 研发不可或缺的底层硬件,2017 年 3 月 10 日后,英伟达也顺应用户需求,发布了适用于个人研究使用的 GPU。这也成功让英伟达成为了 AI 时代最受关注的芯片企业之一。与此同时,老牌芯片厂英特尔也及时应战,推出了一系列用于 AI 推理和训练的专用芯片。
国内企业在芯片领域起步较晚,受到 2018 年“中兴事件”的影响,中国一众科技公司也开始踏上了芯片研发的道路,并在专用芯片领域取得了一定的成果。可由于芯片研发是一项长期工作,因此,为了在 AI 研究中获得较高的算力,国内外大部分企业及机构仍然需要依赖头部的芯片巨头。
得益于早些年大数据的发展,对于企业与研究机构来说,数据已经不再是特别难以解决的问题。然而,2018 年出现的由谷歌推出的 NLP(自然语言处理)预训练模型 BERT 让行业不得不感叹:数据依然是巨头的“游戏”。
BERT 基于大型文本语料库(如维基百科)训练通用的“语言理解”模型,然后将模型用于下游的 NLP 任务(如问答) 。它能够做到比之前的方法更优,因为这是第一个用于预训练 NLP 的无监督、深度双向系统。虽然为 NLP 带来了突破性的进展,但是,BERT 的训练成本相当高,在 4 到 16 个 Cloud TPU 上训练需要 4 天时间,而且对于每一种语言,都是一次性的程序。
另有 OpenAI 推出的“最强 NLP 模型”:GPT-2.0 最新开源的版本甚至包含 15 亿条参数。这几乎意味着:缺乏硬件支持和数据的公司一般无法支持这么大的开销,数据仍然是巨头们才可以玩转的资源。
在 AI 最为火爆的 2016-2017 年,行业里流传有这么一句话:不谈 AI,就拉不到投资;有了 AI,PPT 也能拉到投资。这当然是行业的一句调侃,却也反应出一个事实:人工智能已经火爆到人人都想分一杯羹的地步了。
投资如火如荼,企业也疯狂扩张。2017 年,仅人脸识别领域就获得超过 230 亿元的投资,在当年人工智能领域的投资当中占比超过三分之一。随着时间推移,投资到了需要回报的时候,AI 技术也需要用真正落地的应用让用户、投资人看到它是确实可用的,也是确实可以产生商业价值的。
因此,2018-2019 年,商业化落地成为了人工智能从业者及投资者最关心的问题,也正是在这个阶段,一些没能拿出落地产品的公司倒下了,而一些技术大厂的项目也由于种种原因没能撑下去,下表列出了部分 2018-2019 年倒闭的 AI 公司及项目:
可以看出:大部分企业 / 项目倒闭的原因是市场表现没能达到预期,因此,即使是如 Mayfield Robotics、Drive.ai 这样的明星公司,也免不了被冷冰冰的资本市场拍倒在沙滩上。
AI 创业公司倒闭,多是由于市场表现未达预期,但更深层次的原因在于技术。
以自动驾驶为例,2016 年开始,深耕自动驾驶技术的技术公司乘着 AI 浪潮,纷纷表达了对行业充满信心的豪言壮语。可是自 2018 年开始,越来越多的公司意识到,承诺似乎有些太早了。
自动驾驶共分为 5 个级别,级别越高,自动化程度也越高,L5 级为无需人工操作的全自动驾驶,也就是所有自动驾驶技术的终极目标。
可是,达成这个目标却难于上青天。尽管在全行业的不懈努力下,L3 级别的自动驾驶已经初具规模,并想着 L4 级努力靠近,但是仍然有很大的技术短板需要补全。2018 年的几起与自动驾驶有关的事故也表明:现有自动驾驶技术在处理紧急路况时,仍然能力不足。
不过,一个好的兆头是:在环境相对封闭、速度得到限制的情境下,自动驾驶汽车还是基本能够达到全自动运行的,这也给了希望发展无人车出行服务(Robotaxi)的企业一些信心。
另外,智能家居也是技术短板比较明显的行业。
早在 2017 年,就有智能音箱被曝出会“窃听”用户的对话,而随着类似事件越来越多,智能家居的安全性受到了公众质疑——但是,这并没有影响到这些产品的销量。
此外,用户对于智能产品的需求似乎也不是很明朗,不少用户都是抱着好奇、体验的心态购买了智能家居产品。仍然以智能音箱为例:根据分析公司 Canalys 的报告,2019 年第三季度,有屏智能音箱的出货量同比增长高达 500%。其中一个重要的原因是:有屏设备能够提供更加丰富的功能,并且在语音交互无法完成指令时,用户可通过触屏来操作。
人类的语言有其特殊性,简单几个字背后的复杂含义并不是 AI 现阶段能够理解的,NLP 虽然因为 BERT 等模型的出现迎来了新的突破,但是要理解人类语言并提供更好的服务,似乎还有一段距离;行业也在寻找解决方案,或是一场新的技术爆发,或是一些新的应用场景。
谈到 AI 就不能不提技术人才。
2017 年,AI 前线曾做过一篇有关 AI 领域技术人才薪资的专题,资料显示:某些 AI 技术人才的月薪最高甚至可达 25 万元。或许也是因为薪资的吸引,不少 IT 技术人纷纷转去研究 AI,虽然来势汹汹,但真正能满足 25 万月薪条件的人却寥寥无几。
当时,另外一个非常明显的趋势是:学术界的技术专家也都开始转向了工业界,离开校园走进企业,成为了技术部门的领导者,甚至自立门户,成立人工智能初创公司。比如 AI 大牛吴恩达,2017 年他离开任教的斯坦福大学,接连成立了 deeplearning.ai、Landing.ai 等公司,还入股妻子成立的 Drive.ai 任董事;国内同样如此,不少来自清华北大,甚至海外名校的华人技术专家,或是回国创业,或是加入 BAT 等大厂。一时间,“留在学术界做研究”还是“投身工业界做项目”成为了不少技术人之间的热门话题。
时间到了 2019 年,另一个趋势出现了:曾经投身工业界的专家重新回到了学术界。吴恩达、李飞飞等技术大牛均是如此。对于这一现象,有一种观点认为:技术专家作为走在浪潮最前端的人,最明白技术的发展趋势,他们的态度转变更是说明了 AI 已经迎来了发展的瓶颈,因此才回到学术界,寻找突破方法。
有人曾说:人工智能是一场赌局,企业与研究机构投入大量的人力、财力,却不知道怎么才算赢,更不知道什么时候才能赢。其实,对于任何一项新的技术,这句话都适用,正因为这项技术是新的,它才能有无限的可能。
人工智能在短短的四年时间里就进行了一场“大洗牌”,更能说明这一领域的发展是真正有能力的人才可以推动的。巨头或许可以垄断一时,但未必能垄断一世;明星虽然陨落,但也为后人指引了方向;疯狂过后,总是沉寂,但沉寂之后,终将迎来爆发。
大浪淘沙,优胜劣汰,21 世纪即将迈入第二个十年,人工智能的未来会走向何方,我们共同期待。