2017年AI在游戏中完胜人类,2060年通吃一切人类任务

人工智能和大数据 2017-12-28

新智元报道 微信公众号:新智元(AI_era)

【新智元导读】2017 年,AI在各种游戏中横扫人类: 在围棋比赛中,AlphaGo Master战胜世界排名最高的柯洁,随后又衍生出AlphaGo Zero和更高水平的AlphaZero;在扑克比赛中Libratus已经可以在打牌时使诈,充分利用人类漏洞;马斯克的OpenAI在短短时间内在Dota 2中击败世界顶级选手。未来实现自我学习的AI将在更多的游戏中超越人类。

2017年AI在游戏中完胜人类,2060年通吃一切人类任务

2017年,AI在游戏中大获全胜。在过去的12个月里,从古老的围棋到德州扑克,AI越过了一系列新的门槛,最终在各种不同的游戏中击败人类玩家。

2017年AI在游戏中完胜人类,2060年通吃一切人类任务

围棋

在20世纪90年代后期,一台机器终于击败了国际象棋特级大师。面对挑战,计算机科学家把注意力转移到围棋这个古老的中国游戏上。围棋看起来简单易玩,但却非常复杂。

2015年10月,AlphaGo击败樊麾,成为第一个无需让子即可在19路棋盘上击败围棋职业棋手的电脑围棋程序,写下了历史,相关成果在2016年1月发表于Nature。

2016年的倒数第三天,一个用户名为“Master”的围棋用户,连续在围棋平台大开杀戒,“斩杀”包括柯洁、朴廷桓、井山裕太、陈耀烨、申真谞、常昊、古力等各路围棋高手,最终以以60连胜告终。柯洁连输三场,期间还因为急性肠胃炎住院……到1月4日,官方确认“Master”实际上是DeepMind的AI AlphaGo的最新版本。

2017年5月27日,乌镇围棋峰会,柯洁总比分 0:3 败于AlphaGo。比赛中,柯洁在局面不利时长时间离开,回来后又泪洒现场。赛后柯洁一度哽咽称:它太完美我很痛苦,看不到任何胜利的希望。

2017年AI在游戏中完胜人类,2060年通吃一切人类任务

2017年10月,DeepMind最新版AlphaGo论文介绍了迄今最强最新的版本AlphaGo Zero:使用纯强化学习,将价值网络和策略网络整合为一个架构,3天训练后就以100比0击败了上一版本的AlphaGo。

2017年12月,DeepMind推出了AlphaZero。可以在几个小时内掌握各种游戏。经过八个小时的自我训练,该系统不仅可以击败AlphaGo Zero之前的版本,还击败了国际象棋、将棋的最强AI。

2017年12月11日,AlphaGo的启蒙老师、欧洲围棋冠军樊麾在微博上透露:“AlphaGo教学工具共有两万多个变化,三十七万多步棋组成,通过AlphaGo的视角,分析并建议围棋开局的诸多下法。随后,当今世界围棋第一人柯洁随后转发此条微博,并评论到:“重新学习围棋。”

AlphaGo已经退休,但技术永存。

德州扑克

除了围棋之外,在无限制德州扑克上,人类顶级职业玩家也被人工智能击败。

首先完成这一胜利的是阿尔伯塔大学的计算机科学家开发的 DeepStack,该成果的成功背后还有来自捷克的查尔斯大学和布拉格捷克理工大学的帮助。去年 11 月初的四周里,DeepStack 击败了 11 位职业选手中的 10 位,统计上,赢的优势很大,与每位对手玩了 3000 手。

一个月后,卡内基梅隆大学所开发的 Libratus 又再次在与人类的比赛中取得了胜利。Libratus 击败了四个更加优秀的职业选手(专家级扑克玩家),总体交收 12 万多手。计算机最后赢得约为 180 万美元的筹码。

2017年AI在游戏中完胜人类,2060年通吃一切人类任务

电竞游戏

今年8月12日,埃隆·马斯克旗下旨在研究通用人工智能解决方案的公司OpenAI,所训练的一款人工智能算法在著名的电子竞技游戏Dota2国际邀请赛The International中,参与了1V1比赛环节,并压倒性的击败了顶级电子竞技选手Dendi。

2017年AI在游戏中完胜人类,2060年通吃一切人类任务

相比围棋这种完全信息静态博弈游戏(即双方都能获得局面的所有信息,下棋异步),电子竞技游戏具备非完全信息属性(双方只掌握视野里的部分信息),而且竞技过程是实时动态进行的。其规则和特征复杂度远超围棋,因此对人工智能的局面评估、决策能力要求显著更高。另外,相比围棋这种高度抽象的游戏(只有落子一个动作),电子竞技游戏性质上更类似人类现实世界对抗/战争的简化模拟,涉及了大量资源调配、部队构成选择、扩张策略、攻防对抗等复杂但具有现实意义的博弈,如能在电子竞技对抗中取得划时代的里程碑,则代表了人工智能迈向通用化又进了一大步。

AI几乎在每一场比赛中都战胜人类,下一步是什么?

如果在几乎每一场比赛中,AI都能击败我们。那么下一步会是什么?

法尔茅斯大学的一位研究人员最近透露了一个机器学习算法,声称自己可以从头开始玩游戏。这个被称为Angelina的人工智能系统每天都在不断改进,现在可以使用数据集来制作游戏,这些数据集可以从维基共享资源(Wikimedia Commons)获得。

这意味着什么?

也许2017年最重要、最可怕的发展是强化学习系统的巨大进步。这些程序可以有效地教导自己如何掌握新的技能。AlphaZero就是一个绝佳的例子。

一项针对350多名人工智能研究人员的大型调查显示,距离AI完虐人类,不会太久。调查预测10年内人工智能会比人类表现的更好。到2049年,它将能够写出一本畅销小说,到2053年,它在手术上的表现会比人类更好。事实上,调查得出的结论是,到2060年,有50%的可能性,AI将能做人类所能做的一切,而且做得更好。

2017年无疑是人工智能在越来越复杂的游戏中击败人类的一个重要里程碑,虽然这可能看起来像一个微不足道的成就,但其影响是巨大的。这些人工智能开发公司中的许多人正在迅速将目光转向现实世界。

DeepMind联合创始人兼首席执行官Demis Hassabis表示:“最终,我们希望利用算法突破来帮助解决各种紧迫的现实世界问题。如果类似的技术可以应用于其他结构性问题,如蛋白质折叠,减少能源消耗或寻找革命性的新材料,那么最终这些突破,有可能对我们的生活产生积极影响。”

相关推荐