DeepMind提出SPIRAL：使用强化对抗学习，实现会用画笔的智能体

hhycsdn 2018-03-29

近日，DeepMind 发布博客，提出一种结合了对抗训练和强化学习的智能体 SPIRAL。该智能体可与绘图程序互动，在数位画布上画画、改变笔触的大小、用力和颜色，并像街头艺人一样画画。也就是说，通过向 SPIRAL 提供人类用于描绘周围世界的工具，它们也可以生成类似的表征。

人类眼中的世界不只是角膜映射出的图像。比如，当我们看一幢建筑，赞美其设计精巧复杂时，我们能够欣赏到它的精巧工艺。通过创造事物的工具来解读事物是帮助我们理解世界的一项重要能力，也是人类智能的重要组成部分。

DeepMind 希望其系统能够按类似的方式构建对世界的丰富表征。例如，当系统观察一幅画的图像时，它们能够理解画家使用的笔触，而不只是看到屏幕上呈现的像素。

在《Synthesizing Programs for Images using Reinforced Adversarial Learning》研究中，DeepMind 给人工智能体配备了用于生成图像的工具，并展示了智能体可以推断出数字、字符和画像被创造出来的过程。关键是，它们学会这么做完全是出于自觉，没有使用人类标注的数据集。这与最近的研究《A Neural Representation of Sketch Drawings》恰恰相反，后者目前仍依赖于从人类演示中学习，是一个时间密集型的过程。

DeepMind提出SPIRAL：使用强化对抗学习，实现会用画笔的智能体

DeepMind 设计了一种深度强化学习智能体，该智能体可与计算机绘图程序（http://mypaint.org/）互动，在数位画布上画画、改变笔触的大小、用力和颜色。最初，这一未经训练的智能体下笔随意，其涂鸦没有明显的内容或结构。为了解决这个问题，DeepMind 不得不提出一种方式来奖励智能体，鼓励它生成有意义的涂鸦。

为此，DeepMind 训练出第二个神经网络，叫作判别器（discriminator），旨在预测特定画作是智能体生成的，还是来自现实照片数据集。绘画智能体所接受的奖励决定于它多大程度上能够「欺骗」判别器，使之认为其画作是真的。换言之，智能体的奖励信号是由自己学习而来。这和生成对抗网络使用的方法类似，但也有不同，因为 GAN 中的生成器通常是一个可以直接输出像素的神经网络。而 DeepMind 的智能体通过写图形程序与绘画环境互动，来生成图像。

DeepMind提出SPIRAL：使用强化对抗学习，实现会用画笔的智能体

在第一组实验中，智能体被训练来生成类似 MNIST 数字的图像，只对智能体显示数字，而没有数字生成的过程。通过尝试生成欺骗判别器的图像，智能体学会控制笔触，并绘制适合不同数字的风格，这种技术叫作视觉程序合成（visual program syhthesis）。

DeepMind 还训练它来重现特定图像。这里，判别器要确定重现出的图像是目标图像的复制，还是由智能体生成的。判别器判断二者的难度越大，智能体得到的奖励就越多。

关键是，该框架具备可解释性，因为它能生成一系列控制模拟画刷的动作。这意味着该模型可以将其学得的东西应用到模拟绘图程序上，以在其他类似环境中重新创建字符，如在模拟或真实的机械臂上。

DeepMind提出SPIRAL：使用强化对抗学习，实现会用画笔的智能体

也可以将该框架扩展到真实数据集上。在训练智能体绘制名人人脸时，它能够捕捉人脸、色调、发型的主要特征，就像一个寥寥几笔绘制人像的街头画家一样。

DeepMind提出SPIRAL：使用强化对抗学习，实现会用画笔的智能体

从原始感知中找到结构化表征是人类拥有且经常使用的能力。该研究显示通过向智能体提供人类用于描绘周围世界的工具，它们也可以生成类似的表征。这样，它们学会生成可简练表达因果关系的视觉程序。

尽管该研究只能代表朝灵活程序合成迈进的一小步，但 DeepMind 期望类似的技术可以赋予人工智能体类人感知、生成和交流的能力。

论文：Synthesizing Programs for Images using Reinforced Adversarial Learning

DeepMind提出SPIRAL：使用强化对抗学习，实现会用画笔的智能体

论文链接：https://deepmind.com/documents/183/SPIRAL.pdf

摘要：近年来，深度生成网络的进展带来了令人瞩目的成绩。但是，此类模型通常把精力浪费在数据集细节上，可能是因为其解码器的归纳偏置较弱。这样图形引擎就有了用武之地，因为图形引擎将低级别细节抽象化，并将图像表示为高级别程序。当前结合了深度学习和渲染器的方法受限于手动制作的相似度或距离函数、对大量监督信息的需求，或者将推断算法扩展至更丰富数据集的难度。为了缓解这些问题，我们提出了 SPIRAL，一种对抗训练的智能体，可以生成由图形引擎来执行的程序，以解释和采样图像。该智能体的目标是欺骗判别器网络（分辨真实数据和渲染数据），该智能体在分布式强化学习环境中进行训练，且训练过程无需任何监督。令人惊讶的是，使用判别器的输出作为奖励信号是使智能体获得期望输出渲染的关键。目前，这是在难度较高的现实世界数据集（MNIST、OMNIGLOT、CELEBA）和合成 3D 数据集上的第一次端到端、无监督和对抗逆图形（adversarial inverse graphics）智能体演示。

: hhycsdn

相关推荐

DeepMind,哈佛造出了 AI「小白鼠」:从觅食,击球窥探神经网络奥秘

在一篇 ICLR 2020 Spotlight 论文中，DeepMind 和哈佛大学的研究者构建了一个基于 AI 的虚拟小鼠，能够执行跑、跳、觅食、击球等多项复杂任务。他们还尝试用神经科学技术来理解这个「人造大脑」如何控制其行为。或许这一成果可以为我们提供

天行九歌 0喜欢 / 0评论 2020-04-29

DeepMind发布神经网络、强化学习库，网友：推动JAX发展

DeepMind今日发布了Haiku和RLax两个库，都是基于JAX。而此次发布的两个库，分别针对神经网络和强化学习，大幅简化了JAX的使用。Haiku是基于JAX的神经网络库，允许用户使用熟悉的面向对象程序设计模型，可完全访问 JAX 的纯函数变换。RL

XuFangfang0 0喜欢 / 0评论 2020-02-21

大脑也在用分布式强化学习？DeepMind新研究登上《Nature》

分布式强化学习是智能体在围棋、星际争霸等游戏中用到的技术，但 DeepMind 的一项研究表明，这种学习方式也为大脑中的奖励机制提供了一种新的解释，即大脑也应用了这种算法。这一发现验证了分布式强化学习的潜力，同时也使得 DeepMind 的研究人员越发坚信

专注坚持 0喜欢 / 0评论 2020-01-16

102页PPT，DeepMind强化学习最新进展，含图文、公式和代码

本文提供涵盖了强化学习RL基础概念、策略梯度、动态规划以及D4PG、R2D3等RL算法的资源。[ 导读 ]在DeepMing任职的Nando de Freitas在KHIPU 2019上做了关于强化学习的教程，102页ppt。在KHIPU 2019上，在D

trillionpower 0喜欢 / 0评论 2019-11-23

Alphabet 的 DeepMind 损失在 2018 年飙升至5.7亿美元

根据英国公司大楼登记处周三提交的文件显示，负责创建人类级人工智能的谷歌人工智能公司 DeepMind 在2018年度过了昂贵的一年。其 2018 年的税前亏损额从 2017 年的 3.41 亿美元和 2016 年的 1.54 亿美元增长至 5.7 亿美元。

芋头 0喜欢 / 0评论 2019-11-03

DeepMind 开源 Spriteworld，灵活，可配置的强化学习环境

Spriteworld是一个基于python的RL环境，由一个可以自由移动的简单形状的二维竞技场组成。该环境是为文章“COBRA：基于数据有效模型的RL通过无监督对象发现和好奇心驱动的探索”中介绍的COBRA代理开发的。环境的动机是为程序生成多对象场景提供

专注坚持 0喜欢 / 0评论 2019-11-03

DeepMind一次性开源3个新框架！深度强化学习应用落地即将迎来春天？

本文转自雷锋网，如需转载请至雷锋网官网申请授权。深度强化学习一直是近年来人工智能的一些重大突破的核心。然而，尽管 DRL 有了很大的进步，但由于缺乏工具和库，DRL 方法在主流解决方案中仍然难以应用。就在最近，DeepMind 发布了一系列新的开源技术，包

luchi00 0喜欢 / 0评论 2019-09-20

DeepMind向星际玩家们下了战书！你的对手可能是AI，而你毫不知情

欧洲的星际争霸玩家们即日将有机会和Deepmind AI打场比赛了！出战的AI是由DeepMind和暴雪联合培养的，经过了“特别的训练方式”，在星际争霸界 II 早有过赫赫战绩，连续在10场比赛中击败了人类职业选手。另外10场比赛，代表人类出战的是职业选手

引力空间万物互联 0喜欢 / 0评论 2019-07-11

这部关于 AI 的纪录片，还是值得一看的

纪录片《 AlphaGo 》，是由 Google 与 DeepMind 团队出品，纪录片导演 Greg Kohs 和团队精心制作完成。讲述了 DeepMind 团队带领 AlphaGo 与人类顶尖棋手展开对决的几场关键性比赛。这部纪录片在去年自各个影展上小

ZLXiong 0喜欢 / 0评论 2019-06-28

Reddit热议！DeepMind最新研究解决灾难性遗忘难题

当遇到序列任务时，神经网络会遭受灾难性遗忘。DeepMind研究人员通过在函数空间中引入贝叶斯推理，使用诱导点稀疏GP方法和优化排练数据点来克服这个问题。今天和大家分享这篇Reddit高赞论文。该方法被称为用于持续学习的函数正则化，通过在底层任务特定功能上

panrenlong 0喜欢 / 0评论 2019-06-23

超越BigGAN，DeepMind提出「史上最强非GAN生成器」VQ-VAE-2

能生成逼真图像的不只有 GAN。去年 9 月，BigGAN 横空出世，被誉为「史上最强 GAN 生成器」，其逼真程度众多研究者高呼「鹅妹子嘤」！相关论文也被 ICLR 2019 接收为 Oral 论文。今年 2 月，BigGAN 的一作又发布了更新版论文，

xmdxcsj 0喜欢 / 0评论 2019-06-05

DeepMind游戏AI登上Science:雷神之锤多智能体合作，超越人类玩家

去年年中，DeepMind 介绍了其在游戏智能体方面的新进展，聚焦于雷神之锤 III 竞技场的夺旗模式。当时，DeepMind 设计的为 FTW 智能，达到了人类水平，能够与其它智能体或人类相互合作。今年，DeepMind 继续发力，提出基于 self-p

wesay 0喜欢 / 0评论 2019-06-03

结合符号主义和DL:DeepMind提出端到端神经网络架构PrediNet

DeepMind 最近的一项研究将符号人工智能和深度学习结合起来，提出了一种新型端到端神经网络架构 PrediNet。符号主义和连接主义是人工智能领域中的两大流派。连接主义，又称为仿生学派或生理学派，其主要原理为神经网络及神经网络间的连接机制与学习

hexianhao 0喜欢 / 0评论 2019-05-29

DeepMind论文：深度压缩感知，新框架提升GAN性能（附链接）

本文介绍一种将压缩感知和GAN联系起来的创新框架。[ 导读 ] DeepMind提出一种全新的“深度压缩感知”框架，将压缩感知与深度学习相结合，显著提高了信号恢复的性能和速度，并提出一种改进GAN的新方法。压缩感知是一种优雅的框架，用于从压缩信号中恢复稀疏

刀刀鱼 0喜欢 / 0评论 2019-06-01

DeepMind揭秘雷神之锤3背后AI真相：碾压人类只是个开始

虽然人类已经无望在电子竞技中打败AI多智能体，但DeepMind的研究仍在继续往前推进。最近他们公布了在强化学习方面的最新进展，并对未来进行了展望。AI智能体的能力还会继续提高吗？DeepMind的科学家也想知道。他们最近更新了博客，以雷神之锤为例，为我们

zourzh 0喜欢 / 0评论 2019-05-31

DeepMind论文：深度压缩感知，新框架提升GAN性能

DeepMind提出一种全新的“深度压缩感知”框架，将压缩感知与深度学习相结合，显著提高了信号恢复的性能和速度，并提出一种改进GAN的新方法。例如，CS可以利用自然图像的结构，仅从少量的随机测量中恢复图像。CS具有灵活性和数据效率高的优点，但由于其稀疏性和

tryhl 0喜欢 / 0评论 2019-05-23

没有地图也能导航？DeepMind用街景来认路

在童年记忆中，你是如何沿着路线去朋友家、学校或者商店的？那时候没有地图，只是简单的记住街景和沿途转向。因此，导航是一种很重要的认知任务，人类或者动物不需要地图就能够在复杂的世界中进行远距离穿越。请注意，这项研究适用于一般导航而不是汽车驾驶，在这里，我们既没

hello小工 0喜欢 / 0评论 2018-04-08

DeepMind科学家：AI对战《星际争霸》胜算几何？

AI科技大本营1月29日消息，在《麻省理工科技评论》与深科技举办的新兴科技峰会上，谷歌DeepMind科学家Oriol Vinyals在会上发表了主题为《AI对战星际争霸胜算几何？》的演讲。在加入谷歌AI团队之后，Oriol Vinyals参与了机器翻译、

yuyin 0喜欢 / 0评论 2018-01-29

学术 | DeepMind最新研究：使用更简单的环境就能检测AI是否安全

随着人工智能系统在现实生活中变得通用和实用，确保系统的安全运行变得越来越重要。迄今为止，大部分技术人工智能安全研究都集中在，对不安全行为的性质和原因的理论学习上。这九个环境被称为gridworlds。每一个都由一个类似棋盘的二维网格组成。除了标准的激励函数

coverse 0喜欢 / 0评论 2017-11-29

城会玩！DeepMind新AI竟然自己学会跑酷了

DeepMind在通用人工智能的道路上越走越远。最近，他们通过电脑动画和生物力学，让人工智能自己学会了如何在动画环境中运动，包括步行、跑动、跳跃、攀爬。另外，为了抗衡Google在通用人工智能方面的影响力，微软研究院在其雷德蒙总部成立了全新的人工智能实验室

脑极体 0喜欢 / 0评论 2017-07-13

神经网络也能解数学题，DeepMind发布千万数学题海数据集

从中学数学到高数微积分，我们需要做大量数学题。知识点看懂了并不算懂，能解题才是王道。那么神经网络是不是也能理解数学题，并解出这些题目呢？因为从数据上来说，数学题也就是一个序列而已，神经网络说不定能将这个序列映射到正确的答案。为了促进这方面的研究，DeepM

yanaoyong 0喜欢 / 0评论 2019-04-04

被收购满五年，与谷歌拉锯已久的Deepmind站在了十字路口

这个时间点放出这篇文章，多少有点意味深长。3 月本来是 Google 收购 DeepMind 五周年，随着 DeepMind 来到 Google 的 75 名早期员工，包括 DeepMind CEO 自己都可以自行决定去留。但有消息放出，Alphabet

sffwul 0喜欢 / 0评论 2019-03-18

DeepMind AlphaStar星际争霸2首秀：Demo很强大，但现场比赛输了

机器之心报道，参与：李泽南、李亚洲。两年前，DeepMind 曾宣布开始研究打即时战略游戏《星际争霸 2》的人工智能，今天，AlphaStar 终于首次亮相在世人眼前。在几场展示 AI 实力的 Replay 铺垫之后，AlphaStar 现场比赛却输了。两

allians 0喜欢 / 0评论 2019-01-25

DeepMind星际争霸2 AI首秀即将上演，旭东老仙奶一口？

2016 年 11 月，DeepMind 与著名游戏公司暴雪宣布将在即时战略游戏《星际争霸 2》上合作，这家隶属谷歌的公司将在游戏平台中进行人工智能研究。近两年来，DeepMind 的研究进度时有透露，但距离「人机对战」似乎还有很长一段距离。刚刚，Deep

liujainq 0喜欢 / 0评论 2019-01-24

DeepMind开源图网络库，一种结合图和神经网络的新方法

选自GitHub，作者：pbattaglia ，机器之心编译，机器之心编辑部。今年 6 月份，Deepmind 发表了一篇论文，将图与深度神经网络相结合，由此提出了一种新型图网络。由于图网络主要采用神经网络的方式对图进行操作，因此它又可以称为图神经网络。D

WhiteHacker 0喜欢 / 0评论 2018-10-19

机器学习为核心，DeepMind助力谷歌开发的安卓9Pie今日上线

选自android-developers，作者：Dave Burke，机器之心编译。今日，谷歌开发者博客宣布，经过 1 年多的开发和数月的测试，安卓 9 Pie 将正式面世。本文中，我们将介绍安卓新版本的所有新特点。今年 5 月份，谷歌 I/O 大会宣布推

Leslie心蓝 0喜欢 / 0评论 2018-08-07

神经网络碰上高斯过程，DeepMind连发两篇论文开启深度学习新方向

神经网络目前是最强大的函数近似器，而高斯过程是另一种非常强大的近似方法。DeepMind 刚刚提出了两篇结合高斯过程与神经网络的研究，这种模型能获得神经网络训练上的高效性，与高斯过程在推断时的灵活性。DeepMind 分别称这两种模型为神经过程与条件神经过

寸先生的AI道路 0喜欢 / 0评论 2018-07-06

DeepMind首次披露旗下AI专利申请情况，引发热议

谷歌旗下的人工智能研究公司 DeepMind 近年来提交了一系列国际专利申请，这些申请现已首次公布。这些申请涉及现代机器学习的一些基本方面，因此对任何从事商业化人工智能领域的人都具有潜在的意义。此消息一经公开，就在 reddit 网站上引发热议。DeepM

AI启蒙研究院 0喜欢 / 0评论 2018-06-09

DeepMind提出关系性深度强化学习：星际争霸2任务中获得最优水平

自去年 7 月与暴雪共同开放人工智能研究环境 SC2LE 以来，DeepMind 一直没有发表有关星际争霸人工智能的进一步研究。近日，这家公司提出了一种「关系性深度强化学习」方法，并在星际争霸 2 中进行了测试。在星际争霸 II 学习环境中，DeepMin

atbjss 0喜欢 / 0评论 2018-06-08

DeepMind元梯度强化学习算法，提高大规模深度强化学习应用的性能

近日，来自 DeepMind 的研究者 David Silver 等人发布论文，提出一种基于梯度的元学习算法，可以在线调整元参数，使得回报既能适应具体问题，又能随着时间动态调整以适应不断变化的学习环境。一般通过预测和控制相结合的方法来实现这一目标。预测的子

ynsshzwxhzyx 0喜欢 / 0评论 2018-05-31

DeepMind发表Nature子刊新论文：连接多巴胺与元强化学习的新方法

上周，DeepMind在 Nature 发表论文，用 AI 复现大脑的导航功能。今天，DeepMind 在 Nature Neuroscience 发表新论文，该研究中他们根据神经科学中的多巴胺学习模型的局限，强调了多巴胺在大脑最重要的智能区域即前额叶皮质

AsiaLee 0喜欢 / 0评论 2018-05-15

AI复现大脑导航功能：DeepMind重大研究突破再次登上Nature

今天，DeepMind 在《Nature》上新发表的一篇论文引起了业内极大的关注，他们使用深度学习技术来训练一只老鼠，在虚拟环境中追踪其位置，模拟人类大脑的空间导航能力。据文章介绍，该研究能够协助传统的神经科学研究来测试大脑工作原理。该项目让科学家们吃惊的

遇见人工智能 0喜欢 / 0评论 2018-05-10

谷歌I/O 2018的AI亮点：从TPU3.0到DeepMind支持的Android P

2018 年 5 月 8 日，一年一度的谷歌 I/O 开发者大会在美国加州山景城开幕。2016 年谷歌从移动优先到人工智能优先，两年来我们从谷歌 I/O 看到了谷歌如何践行这一战略。在今日刚刚结束的 Keynote 中，机器学习依旧是整个大会的主旋律：谷歌

woniuxyy 0喜欢 / 0评论 2018-05-09

没有地图也能导航：DeepMind展示全新AI导航技术

当前的无人驾驶汽车高度依赖于精确的地图进行导航，尽管各家科技公司已经构建了接近完美的 3D 地图，但这种方式仍然存在一些弊端。近日，DeepMind 提出了一种端到端深度强化学习寻路方法，其训练的神经网络可以帮助汽车在没有地图的情况下正确前往目的地，这一研

yangz 0喜欢 / 0评论 2018-04-04

DeepMind提出神经元删除法：通过理解每个神经元来理解深度学习

近日，DeepMind 发表博客介绍其对神经网络可解释性的最新研究成果。受神经科学启发，他们通过删除神经元来探索其对网络性能的影响。研究发现，和过去的经验直觉相反，选择性神经元对于网络的泛化能力并不重要。而某些行为难以理解的非选择性神经元却是不可或缺的。此

zhonghua 0喜欢 / 0评论 2018-03-23

让机器思考与互相理解：DeepMind提出机器心智理论神经网络

AI 不仅需要判断，也需要具备思考问题的能力。真正的人工智能应该和人类一样，可以理解自己以及周围智能体的心理状态，这些状态包括情绪、新年、意图、欲望、假装与知识等。DeepMind 近日提出的「机器心智理论」神经网络 ToMnet 让计算机拥有了这种能力，

寸先生的AI道路 0喜欢 / 0评论 2018-02-24

DeepMind新一代围棋程序AlphaGo Zero再次登上Nature

在今年五月击败柯洁之后，AlphaGo 并没有停止自己的发展。昨天，DeepMind 在《自然》杂志上发表了一篇论文，正式推出 AlphaGo Zero——人工智能围棋程序的最新版本。据称，这一版本的 AlphaGo 无需任何人类知识标注，在历时三天，数百

hexianhao 0喜欢 / 0评论 2017-10-19

DeepMind首推商业化算法产品！30秒诊断眼疾，准确率达到专家水平

据金融时报报道，DeepMind已打造出一款能够实时诊断复杂眼疾的设备。虽然产品只是原型，但这是Deepmind作为Alphabet旗下公司布局医疗设备战略的重要一步。在上周二的2019有线健康会议上，DeepMind对一名患者进行了视网膜扫描，并对该女性

草堂 0喜欢 / 0评论 2019-04-02

DeepMind轻松战胜柯洁打败星际职业选手，做数学题却输给高中生

做数学题一直令多数人头疼不已的事情。近期，DeepMind团队最新研究了利用AI来解数学题，但结果令人大跌眼镜——水平不及高中生。数学可能是大多数人在求学过程中最头疼的一门科目。近日，DeepMind团队便对“AI做数学题”进行了研究，结果大跌眼镜：“万能

luozaifei 0喜欢 / 0评论 2019-04-06

OpenAI 联手 DeepMind，找到「驯化」AI 新办

通过数小时数据分析进行自我训练的系统，可能出现意料之外甚至危害的行为。虽然我们还不清楚其中原因，但是，OpenAI 的 Amodei 和同事 Paul Christiano 正在研究一种解决问题的数学方法，他们认为，融合了人类和机器指导的算法有利于增加自动

AI启蒙研究院 0喜欢 / 0评论 2017-08-16

DeepMind结合逻辑和神经网络从噪声数据中提取规则

人工智能研究员佩德罗·多明戈斯在其著作《主算法》一书中探讨了单一算法的概念，该算法可以结合机器学习的主要流派。去年，谷歌发布了一篇研究论文“One Model to Learn Them All”，它将异构学习技术结合在一个机器学习模型中。去年，Alpha

玉来愈宏的随笔 0喜欢 / 0评论 2019-03-01

官方：DeepMind与暴雪开源星际争霸2人工智能研究环境

在去年 11 月，DeepMind 曾在 Blizzcon 上宣布与著名游戏公司暴雪达成协议，在《星际争霸》系列游戏中进行合作，这家隶属谷歌的公司将在游戏平台中引入机器学习方法，进行人工智能研究。昨天，DeepMind 与暴雪终于共同发布了这一计划的第一个

AI启蒙研究院 0喜欢 / 0评论 2017-08-10

DeepMind：把人工智能和神经科学结合起来，实现良性循环

人工智能发展早期的许多启发来自于神经科学，神经科学也从人工智能研究者的理论和模型中受益良多。将二者结合起来，互相学习，互相汲取灵感，形成良性循环，或对二者的持续发展产生积极影响。人工智能的最新进展引人注目。人工系统在 Atari 视频游戏、古老的棋类游戏围

AI启蒙研究院 0喜欢 / 0评论 2017-08-03

《经济学人》长文揭秘：谷歌与DeepMind的控制权之战，刚刚开始

DeepMind和谷歌的关系可能并不像看上去那么美好。DeepMind缺乏持续稳定的营收能力，而谷歌毕竟不是做慈善的。双方之间争夺“独立自主权“的控制与反控制的战争已经开始！《经济学人》发表万字长文：带你了解DeepMind的前世今生，深度洞察其与谷歌的人

yunfuwu 0喜欢 / 0评论 2019-03-18

DeepMind ICML 2017论文：超越传统强化学习的价值分布方法

设想一个每天乘坐列车来回跋涉的通勤者。大多数早上列车准时运行，她可以轻松愉快地参加第一个早会。具体来说，贝尔曼方程将我们当前的平均预测结果与未来的平均预测结果联系起来。贝尔曼方程使得每一次预测按顺序进行，并在新信息的基础上更新预测结果。在新论文中，我们表示

87133658 0喜欢 / 0评论 2017-07-25

微软创立全新人工智能实验室，将与 DeepMind、OpenAI 同台竞技

近期微软正在创立其全新的人工智能实验室，该实验室由来自自然语言处理等多个 AI 子领域的科研人员共同组成，组成人员将超过 100 人，旨在推进通用人工智能的发展。微软正在建立一个专注于人工智能的全新的研究实验室，以期创建更多通用的学习系统。人工智能研究的新

88327668 0喜欢 / 0评论 2017-07-13

使用认知心理学解释深度神经网络：DeepMind新研究破解AI黑箱问题

近日，DeepMind在其官方博客上发表了一篇题为《Interpreting Deep Neural Networks using Cognitive Psychology》的文章，试图通过认知心理学来解决深度神经网络中的「黑箱问题」，随着神经网络被广泛应

xdq0 0喜欢 / 0评论 2017-06-29

OpenAI联合DeepMind发布全新研究：根据人类反馈进行强化学习

DeepMind 和 OpenAI 是现在人工智能研究界最重要的两大研究机构，当其联手时，我们能看到什么样的成果诞生呢？近日，一篇题为《Deep reinforcement learning from human preferences》的论文让我们看到这

勿于浮沙筑高台 0喜欢 / 0评论 2017-06-14

让天下三子，DeepMind官方解读新AlphaGo强大实力

5 月 23 日，乌镇围棋峰会第一场人机大战以柯洁落败而结束，DeepMind 和谷歌在今天的人工智能高峰论坛中详细回顾了昨天的比赛，并解读了 AlphaGo 背后的强大实力。第一天比赛结束，DeepMind 创始人 Hassabis 表示，比赛进入了数子

yangz 0喜欢 / 0评论 2017-05-24