深圳湾 2018-07-13
21世纪经济报道 杨清清 北京报道
导读:未来人工智能技术将从当前基于单模态实现向基于多模态交互的转变,进入强人工智能时期。不过,要想真正实现与人脑类似的强人工智能,“可能至少还需要一个世纪的时间”。
人工智能正在变得越来越“聪明”,也越来越贴近人类。
在图像大数据识别方面,人工智能已经可以在海量图像中精准进行人脸识别;在人机交互方面,人工智能开始加入情感元素,甚至机器人小冰已经学会了写诗;阅片机器人能够基于大量数据,进行特殊疾病的辅助诊断;通过声音合成,人工智能也可以模仿许多名人的嗓音,达到“以假乱真”的效果。
同时,人工智能已经不再囿于线上虚拟世界,它也正在落地物理世界,成为真正物理世界的人工智能。通过高速视觉反馈技术,机器人可以快速感知高速行动的物体方向,并进行迅速躲避,通过未知动态系统和多传感控制系统,机器人甚至可以学会精准地将篮球投入运动的球框内。
“人工智能与机器人的高度结合,有望发展出能够改变生命本身的技术,使人类与机器进一步融合,从而进入‘人类2.0时代’。”在近日举办的2018机器人与人工智能大会上,德国汉堡科学院院士、德国汉堡大学教授张建伟表示。
同时,他指出,未来人工智能技术本身也将从当前基于单模态实现向基于多模态交互的转变,进入强人工智能时期。不过,要想真正实现与人脑类似的强人工智能,“可能至少还需要一个世纪的时间”。
机器智能
走出虚拟世界,走向物理世界——智能机器人的诞生,令人工智能技术有了真正实物的载体。
“当前,新一轮科技革命和产业变革正在迸发,大数据的形成、理论算法的革新、计算能力的提升以及智能机器人与人工智能产业的发展进入新阶段。”中国电子信息产业发展研究院党委书记、副院长宋显珠指出,“机器人与人工智能成为经济发展的新引擎。”
与之伴生的是机器智能(Machine Intelligence,即MI)的概念。德勤在《2017德勤技术趋势》中首提MI的概念,指出机器智能的几个主要分支包括:机器学习(ML)、深度学习(DL)、认知分析、机器人过程自动化(RPA)和 Bot。根据德勤预测,到 2019年,全球商业在机器智能(MI)的支出将达到313亿美元。
事实上,在全球对制造业提高重视的背景下,机器智能正被赋予了新的期许。去年9月,德国启动智能平台“学习系统”,拟将其作为工业4.0的发展新阶段;12月,日本政府在《2017财年制造业白皮书》中强调,应将“互联工业”纳入超智能社会“社会5.0”议程,在实现超智能社会5.0的过程中重点关注利用智能机器人打造协同的数字化社会;今年3月,美国战略和国际研究中心(CSIS)发布的《美国机器智能国家战略》中,建议白宫方面应任命专职人员协调和推进机器智能相关战略优先实施,注重机器智能与人工智能发展齐头并进。
“人工智能的应用创新面临着由软向硬的过渡。”工信部赛迪智库研究员王哲表示,“人工智能在软的消费端模式创新已经是遍地开花,但如何在硬的制造流程、产品、模式创新方面发力,是大家苦苦寻找的切入点。”
值得注意的是,作为我国国民支柱、亦是机器“重地”的制造业,其转型升级正有赖于与人工智能的深度融合。“我们提出的公式认为,机器智能=制造业+人工智能。”王哲指出。
其中,关键的生产设备智能化是实现智能制造的前提条件和关键难点,也是机器智能发挥作用的关键领域。从生产流程而言,机器智能应用在企业、生产线、车间、工厂的生产过程中,能够实现加工质量的升级、加工工业的优化、生产的智能调度和管理,推动企业生产能力的技术改造和智能升级。
此外,在具体产品方面,机器智能的核心是在终端产品中植入复杂程度不等的计算机系统,即“嵌入式系统”,这不仅将催生智能制造中最重要、最具有代表性的技术,而且会形成庞大的上下游产业链。
不过,张建伟指出,人工智能在机器中的应用,不仅需要多源传感器收集真实世界的鲜活数据,并进行感知和学习,还需要进一步使用决策驱动执行机构改变物理世界,从而引领机器人产业革命。
人机融合
人工智能不仅在走进机器,还在走近人类,从而实现人机融合。
狭义层面的人机融合,是指人类将自己的神经系统与计算机等机械相连接,以达到弥补人类感官、运动缺陷的效果,甚至还可能实现将人类意识与电脑AI融合的结果。
这在科幻电影中毫不新鲜:电影《星球大战》中,卢克·天行者被砍断手臂后接上了机械假肢,《攻壳机动队》中人类意识与计算机程序彻底融合……这些便是人机融合未来的发展路线图。
在当下,已有了人机融合的雏形产品。近日,日本科学家发明了一种由肌肉纤维与机器骨骼融合的机械手指,可以完成90°弯曲的动作;在2017年柏林国际消费电子展(IFA)上,全球主要助听设备制造商之一的丹麦瑞声达公司展示了一款智能助听器,与手机或平板电脑相连接后,该助听器可以将导航信息、音乐、体育新闻甚至是外语翻译等通过助听器传输给佩戴者。
“人工智能与机器人的高度结合,有望发展出能够改变生命本身的技术,使人类与机器进一步融合,进而加强人类(特别是残疾人和老人)的机能,提升人类生活质量,提高学习者效率和增强学习动机,实现人机跨载体的协作学习。”张建伟表示。
不过,广义的人机融合还包含了人机协作,人与机器之间不再是主仆关系,或替代关系,而是伙伴关系。人同时操控多个机器人协同工作,可以提高效率、增加灵活性;人与机器人协调互动,不仅将提高机器人的加工精度和加工速度,还能增强机器人的自我学习功能。
资料显示,当前机器人主要有工业机器人、服务机器人和特种机器人三大类。其中工业机器人主要应用于3C装配制造、物流仓储搬运以及农副产品制造等领域,服务机器人则在机器人助理、聊天和陪护等领域拥有市场空间,特种机器人的主要应用市场是智能汽车、无人机、医疗手术和金融交易决策等专业领域。
然而在中国工程院院士王天然看来,相当多的劳动密集型的工作,机器人未必能够胜任。他举例称,富士康公司曾希望用100万台机器人代替人工,但最终发现很多工作机器人代替不了。“此外,包括风靡全球的‘再制造’产业,也都是‘手工作坊’——把发动机拆下来、洗净油污、维修翻新,并没有现成的规律可循。”
因此,机器人发展的下一个阶段中,人机共融的模式将成为主流。“未来的自动化制造,不是机器换人、工厂无人、机器造人,而是机器助人、工厂要人、智能学人。” 德国菲尼克斯电气(中国)公司副总裁杜品圣表示。
智能升级
无论是机器智能还是人机融合,人工智能技术都是其中的一个关键要素。因此,AI自身的能力升级也备受关注。
张建伟介绍,现在的AI主要基于单模态实现,如只针对图像信息或语音信息进行基于大数据的人工神经网络学习,属于弱人工智能。所谓模态(Modality),是德国生物学家赫尔姆霍茨提出的生物学概念,即生物凭借感知感官与经验来接受信息的通道,如人类拥有视觉模态、听觉模态等。
“未来的人工智能技术将基于多模态交互,能够认知整合包括文本、图像、声音等在内的各种信息,从而让人机交互变得更自然、更精确、更稳定。”张建伟表示,要实现AI的多模态交互,需要进行跨模态研究,包括机器记忆、预测与数据校准、知识抽取、推理、归纳、表达和自主学习等。
21世纪经济报道记者了解到,当前AI感知模态主要有三种:语音交互(包括语音指令控制、语义理解、多轮对话、NLP、语音精准识别等领域)、机器视觉(包括自然物体识别、人脸识别、肢体动作识别等)和传感器智能(包括AI对热量、红外捕捉信号、空间信号的阅读与理解)。前沿的多模态感知研究当中,还包括机器嗅觉、机器触觉和情绪理解等内容。
值得注意的是,近来双模态交互甚至多模态混合交互的解决方案正在从实验室走出来。例如,许多研究机构或企业正在尝试使用机器视觉读取说话人的唇语和动作,从而判断每个声音指令的来源。在一些新的智能空调解决方案中,已开始出现空调在语音交互的基础上,通过机器视觉判断用户位置,提供智能送冷,并结合传感器判断屋内温度和湿度进行自行调控。
不过,目前的多模态交互协同主要还是依靠将不同传感源输入设备处理中心,启动相关程序来开启服务,但这与AI模型本身理解多模态信号相去甚远,“真正实现与人脑一样的强人工智能至少还需要一个世纪的时间。”张建伟表示。