Google Brain工程师演讲实录：TensorFlow与深度学习

WeiXiaoyu 2017-11-03

Google Brain工程师演讲实录：TensorFlow与深度学习

本文是Google Brain工程师周h枫在QCon上海2017和DevFest 2017上的演讲实录，由GDG整理和发布。

我的名字叫做周h枫，我是 Google Brain 的工程师，我现在做 TensorFlow 和 TensorFlow 分布式的开发以及使用机器学习来优化 TensorFlow 的研究项目。

今天首先跟大家分享深度深入学习的例子，然后再跟大家简单介绍一下什么是 TensorFlow ，以及 TensorFlow 一些最新特性，包括即将公开甚至还没有完成一些的特性，如果有时间的话，我会花一些篇幅着重介绍新的特性。最后的时间我会简要介绍一下 Google Brain 两个研究项目。

Machine Learning

今天，我们看到机器学习已经改变了我们的世界，机器科学家用深度学习的方法来检测糖尿病和视网膜病变，其中检测视网膜病变达能到 95% 的准确率，甚至超过眼科专家 91% 的准确率。机器学习实现了机器和人类专家相媲美的准确率。

Google Brain工程师演讲实录：TensorFlow与深度学习

同时机器学习也可以用在自动驾驶方向，可以让交通更加安全和高效。

Google Brain工程师演讲实录：TensorFlow与深度学习

其次，机器学习能够跨越语言的障碍，实现更加便捷的沟通和交流，我们知道传统的机器翻译系统需要把不同语言词组对应起来，通过一些复杂的甚至手写的规则，把一种语言转换为一种语言，这种系统非常庞大且不利于维护，而且准确度不够高，所以最近兴起了一种基于神经网络的方法，我们将其用 TensorFlow 实现出来，用这种方法来缩小机器和人类翻译的差距，能够使翻译更加准确和自然。

Google Brain工程师演讲实录：TensorFlow与深度学习

同样的，机器学习还可以给人类带来愉悦，可以实现自动修改照片、突出人物的前景、背景虚化等功能，我们很快可以在手机上看到这个功能。

Google Brain工程师演讲实录：TensorFlow与深度学习

接下来看看机器学习在工业界的应用，第一个例子是 INSTACART ，它是做杂货当天送货服务的，顾客通过网络应用程序从当地许多零售商选出想要的商品并且购买杂货。这个软件的客户非常多。客户在购买时面临一个问题，就是从数百万计零售商店或者商品中选出自己想要的物品，所以 INSTACART 为了让购物者更快地找出想要的商品，用 TensorFlow 建立了一套深度学习模型用来最有效地排序商品列表，这种方法能大大省下购物者寻找商品的时间。

Google Brain工程师演讲实录：TensorFlow与深度学习

第二个例子就是 UBER ，UBER 用 TensorFlow 和基于 TensorFlow 的开源项目来构建一个叫做“米开朗基罗”的系统，这是一个内部使用的机器学习平台，谷歌希望利用这个平台让内部使用 AI 就像他们请求乘车一样的方便。这个系统涵盖了从数据管理、数据获取和模型训练、评估、部署等方面，而且这个系统不但支持 TensorFlow 深度学习，还支持其他机器学习的模型。

第三个例子是 KEWPIE ，它用 TensorFlow 搭建了人工智能系统用来改善婴儿食品的质量，对食物产品进行人工智能分析，这样可以识别出产品中可以接受的成分并且剔除产品中不能接受的成分，这样保证了婴儿食品的质量。

Google Brain工程师演讲实录：TensorFlow与深度学习

What Is TensorFlow

而实现上述这一切所有的基础框架就是 TensorFlow.

我们在 2015 年末开源了 TensorFlow ，希望把它做成能够服务所有人的机器学习平台。我们想要将它做成一个快速灵活的、生产环境就绪的框架。它可以很方便可以做研究，也可以很快部署到生产环境当中。TensorFlow 本质上是一个大规模的运算框架，它的运算被抽象成一张运算矢量图。就像在这边看到一张运算图一样，上面的节点代表运算或者状态。当我们完成了一些运算或者结束了一些状态的时候，我们的数据就从一个节点流到另外一个节点。这个图可以用任何语言来构建，当这张图构建完之后，我们把它传到 TensorFlow 核心当中进行编译，进行优化然后来执行。

Google Brain工程师演讲实录：TensorFlow与深度学习

TensorFlow 也支持很多硬件平台，从最初的 CPU、GPU ，到即将发布 CLOUD CPU ，还有对安卓、 iOS 的支持，甚至对嵌入式设备的支持。

Google Brain工程师演讲实录：TensorFlow与深度学习

我们将 TensorFlow 开源到 Github 上面后，过去两年兴起了许多围绕 TensorFlow 活跃的开源社区，现在我们有 67,000 多个 star ，有 17,000 多个 Github 项目名字当中包括 TensorFlow. TensorFlow 不断出现在各种大学课程和在线课程里面，很多大学也正在开发基于 TensorFlow 的课程，除此之外我们也发布了 TensorFlow 中文网站，大家把它可以当做入门 TensorFlow 的初级教程，叫做 https://tensorflow.google.cn.

New Feature of TensorFlow

现在我们看一下 TensorFlow 的最新特性。首先是 Eager Execution ，Eager Execution 是一种新的编程模式，我在之前一张幻灯片中展示了一个基于 TensorFlow 的静态图。

Google Brain工程师演讲实录：TensorFlow与深度学习

Eager Execution 解决了静态图中一些问题，解决了什么问题呢?首先它可以少写很多代码，就像上图一样。其次，通过 Eager Execution 写代码可以立刻发现它的错误，相对之前来说可以大大提高编写代码查错的效率。第三是可以用 Tensor 来编写控制流，就不需要用 TF 来做循环甚至做判断。最重要一点是如果用其他语言编写这张图的话，再把这图传到 TensorFlow 核心中相当于编写了另外一种代码。看到这个幻灯片就是简单的例子，充分说了 Eager Execution 的简单之处。

今年的 Google I/O 大会宣布了第二代 TPU，我们第二代 TPU 既可以做推理也可以作训练。一个 TPU 可以实现很高的词典运算。我们甚至可以把很多代 TPU 联合起来成为一个就像超级计算机一样的计算核心。在第二代 TPU 的帮助下，我们可以在 20 小时内全部训练出 RESNET-50 的模型，以前如果只做一个 TPU 的训练，可能要花一周的时间来训练这个模型。今天第二代 TPU 即将发布到 Google Cloud，并且推出供大家使用。

Google Brain工程师演讲实录：TensorFlow与深度学习

下面讲一下 TensorFlow 上层 API，除了神经网络训练速度，大家还关注如何更加方便实现用 TensorFlow 上层 API 来创建神经网络。Keras 是其中一个 API ，它支持很多的后端。相信很多观众都用过 Keras ，从本质上来讲 Keras 更加像一种 API 开发规范。TensorFlow 有一个 TF 就是 Keras ，但是它只是 API 规范实现的一种方式，使用的是一个自定义 TensorFlow 后端，有了这个后端，我们可以让 Keras 与 Estimators 或者 Secving 整合起来，这样会对分布式提供更好的支持。

Google Brain工程师演讲实录：TensorFlow与深度学习

还有一个在 TensorFlow 里面介绍的概念，叫做 Estimators ，这是一个比较轻量化，并且在谷歌内部生产环境中广泛使用的 API ，其中 Estimators 提供了很多模型供大家使用，叫做 Canned Estimator ，他们的关系是这样的：Estimators 和 tf.keras 上层封装了一个 Canned Estimator ，可以用其来封装成各种模型。

Google Brain工程师演讲实录：TensorFlow与深度学习

Google Brain工程师演讲实录：TensorFlow与深度学习

如果你们习惯于 Keras 的接口的话，我们提供了一个上层 API 转换的工具，叫做 model_to_estimator ，一旦你有一个编译好的 Keras 模型就可以调用这个 model_to_estimator 来获取一个 Estimator，从而将 Keras 转换成了 Estimator。

Google Brain工程师演讲实录：TensorFlow与深度学习

Estimator 还提供了分布式训练的接口，如果你用 TensorFlow 来做分布式训练的话，你就可能熟悉我们的分布式模式。我们的 Estimator 很好地提供了对分布式训练的支持，只要写一份单机的代码，它就可以帮你构建好在不同机器上的执行的程序，训练的程序只要调用 Estimator.train 就能完成这一执行过程，只要调用它的 Estimator.evaluate ，整个集群就可以开始训练了。

Google Brain工程师演讲实录：TensorFlow与深度学习

大家可以看一下这些 API 的文档：TF, KERAS, TFLAYERS 等等，我们还发布了一个改进过的程序员指南在官网上，希望大家去看一下。

Google Brain工程师演讲实录：TensorFlow与深度学习

下一个特性是 TensorFlow Lite ，TensorFlow Lite 是跑在移动设备上的 TensorFlow 的一个子集。现在移动设备无处不在，并且越来越重要。在移动设备上，我们可以在野外判断这个狗是什么品种或者判断这个植物有没有病害，利用人工智能都可以在移动设备做一些应用，所以我们推出了 TensorFlow Lite.

为什么很多时候要在移动设备上做?除了刚才说的那些应用场景，为什么要做移动设备的推理?这是因为我们时常需要在一些特殊环境下做一系列的推理，很多时候，尤其在野外，我们的网络带宽非常的低，网络延迟非常大。如果每次推理都向远程服务器发送请求，那对移动设备的电池能力要求很高。虽然现在市面上对移动设备能够完成推理有迫切的需求，但是其中存在很多的挑战，最主要的挑战是因为移动设备的内存、计算资源以及带宽等等受到了限制。从编程角度来讲，因为平台抑制性很高，开发越来越复杂，比如说在安卓上，我们可以使用 CPU 或者指令等方式编写底层代码，在 IOS 上又有自己一些平台和工具，这种不同平台的工具让我们的硬件以及 API 的开发，甚至存在不同的 API 让我们的开发变得更复杂，所以我们设计了 TensorFlow Lite.

Google Brain工程师演讲实录：TensorFlow与深度学习

相比 TensorFlow Lite 的话, TensorFlow 主要关注一些大型的设备。TensorFlow Lite 让小型的设备应用更加效率，现在我们通过一个小的例子看 TensorFlow Lite 如何工作的。

Google Brain工程师演讲实录：TensorFlow与深度学习

这个是 TensorFlow Lite 生命周期，首先我们以标准方式来运行 TensorFlow，运行结束之后，我们得到 Graphdef 和 Checkpoint，我们通过 TensorFlow Lite 提供一个转换器，把它转换成 TensorFlow Lite 的模型格式。有了这个 TensorFlow Lite 格式的模型之后，我们就可以把它转移到移动设备当中。接入 TensorFlow Lite 显示器就能够在移动设备加载这个模型。如果我们的显示器直接调度 NeonKerels ，如果是在其他设备上，还可以利用硬件加速器接口来定义自己对自己硬件的一些优化。

下一个特性就是 Input Pipeline ，不管是初学者还是专家都会对 Input Pipeline 感兴趣，因为 Input Pipeline 使用起来非常痛苦。

Google Brain工程师演讲实录：TensorFlow与深度学习

它主要有两种模式，一种是 Feeding，它优点是可以用 python 灵活处理零距，但是性能很差。而且单线程跑，每一步训练都要等待数据处理的完成，这个对 GPU 来说效率非常低。另外一种方式效率高一点，就是把数据处理变成一系列的操作，这使用一个 Queues 作为数据存放的临时空间，我们把预处理好的数据和一些中间预处理数据放在 Queues 里面，通过 python 来控制 Queues 的输入和控制。但是有一个问题，这个 python 有一个权值解释器的锁，所以它让这个 Queues 输入性能受到很大的限制。

Google Brain工程师演讲实录：TensorFlow与深度学习

还有一个问题就是，我们写的数据处理模块没有办法得到常用，也没有办法在训练的时候更改输入数据。所以我们了开发了一套 Input Pipeline，因为种种原因，所以把它设计成惰性的列表。因为我们的数据很多长得类似，而且数据量可以比较大，所以可以把它定义成 LAZY，我们把它定义成惰性列表之后，可以很自然用函数编程语言中的 map 和 filter 来定义预处理管道，我们在很多语言当中都可以看到 map 和 filter 的操作。现在我们看一下它的接口，我们还有第二个接口叫做 Iterator，可以方便把 edements 数据取出来。就像很多一般的编程语言里面的 Iterator 一样，我们可以对这个 Iterator 配置不同的数据，PPT 上这就是一个例子，大家可以看一下。 Google Brain工程师演讲实录：TensorFlow与深度学习

Learn To Learn

在神经网络解决问题的时候，神经网络也会给我们带来一些新的问题，就是我们设计神经网络架构需要投入大量的专业知识和时间投资，比如这个就是谷歌图象分类的一个 .NET 的架构，这个神经网络架构设计从最初的卷积的架构到现在复杂的架构，经过研究人员多年的实验不断重复、完善，才得以达到这么复杂的模型。

Google Brain工程师演讲实录：TensorFlow与深度学习

我们与其让科研人员不断在电脑面前，为什么不用强大计算资源，让机器自动寻找好的神经网络架构?在谷歌我们用一种方法，就是用 RNN 循环神经网络来生成一个子网络，这个想法的来源是因为我们可以把一个神经网络对应成一个训练化的一个个序列，RNN 非常擅长解决这类问题，所以我们用 RNN 来生成一个子网络，我们把这个子网络用真实数据进行训练。通过训练准确度的好坏来更新 RNN 的控制器。在它下一次迭代当中，RNN 就会输出更高精度的子网络。这是 RNN 转接架构的例子，这个例子看上去错综复杂，其实也不难理解。

Google Brain工程师演讲实录：TensorFlow与深度学习

我们也尝试用同样的方法来生成优化函数，然后把生成的优化函数和常用的函数来进行对比，从这张表可以看到生成的函数超过了现有函数的精度，但是这些生成的函数非常的不直观，所以我们就开始想，有没有更加直观的方法来处理 learn 2 learn 这个问题，于是我们想到了进化的算法，或者说遗传算法。既然一个简单单细胞生物都可以进化到非常复杂的、有独立思考多细胞生物，那么我们可以不可以把同样理论用到模型的构建上来，于是我们就设计了这样一种算法，在每个时间的开始，我们建立了含有一千个训练好模型的种群，每一步进化从一千个模型中随机选两个，比较他们的准确率，准确率低的模型就会被扔掉，准确率高的模型会留下来，而且模型会繁殖，他们繁殖的方式就是给模型创建一个副本，并且简单修改这个模型，看上去像基因变异一样，我们会训练这个变异的副本然后放在种群当中。

Google Brain工程师演讲实录：TensorFlow与深度学习

这个是分布式训练的细节。模型变异有很多种，我们刚才提到结构的一些变化，甚至也有一些会保持不变，但是我们会对它多训练一下，或者重新训练一下，因为初始化变异非常重要。变异化的选择是均匀分布概率的模型。

我们看一下进化时间的最新进展，图中横轴代表的是时间，纵轴是准确率，里面每个点代表种群当中一个模型，灰色点是被淘汰的模型。右上方蓝色的点是存活下来的模型，训练三天之后就在这个位置。训练三天之后就可以得到一个比较高的准确率。在训练十天之后，可以看到准确度达到停止期，也就是我们找到了个比较理想的模型。

Device Placement

我们看一下另外一个研究项目叫做 Device placement ，他是用强化学习的方法来做 Device Placement ，当前机器学习使用了非常多的模型，也使用非常多的数据，这个要求我们必须有很多的设备共同训练这个模型。

Google Brain工程师演讲实录：TensorFlow与深度学习

比如说看到这个翻译的模型就非常大。我们通常使用 128 个 GPU 来训练，我们先简单介绍一下 Device placement ，Device placement 就是把计算和设备对应起来，目前我们都是用一些人工的方法，甚至简单的算法。我们设置算法需要我们对设备有充分的了解，而且对模型有充分的了解，这个算法并不是简单从一个模型推广到另外一个模型。但是目前非常时髦的做法，都是将基于这些规则的系统转化为，变成基于机器学习的系统，所以我们也用了类似的方法。我们用强化学习的方法来解决这个 Device placement 的模型，我们受 learn 2 learn 方法的启发来创建一个类似的模型。

我们有一个网络，这个网络以神经网络作为输入，同时告诉一个网络有多少计算资源，这个网络就会告诉我们 Neural Model ，我们跑一下这个放置好的 Neural Model ，根据运行的时间来调整一下神经网络，我们用类似的机器翻译的架构。因为模型比较大，比较慢，我们采用了数据并行方式来做训练。

Google Brain工程师演讲实录：TensorFlow与深度学习

Google Brain工程师演讲实录：TensorFlow与深度学习

之后我们看一下训练出来的结果，这是在一个神经翻译系统 Device placement 的结果，上面白色的点代表是在 CPU ，在 CPU 运行的节点，下面彩色点代表在不同 GPU 运行的节点，尽管取得了 20% 左右的提高，但是还是非常不利于理解。现阶段这个在输入端采用了 CPU ，到后面都是采用了 GPU 。

Google Brain工程师演讲实录：TensorFlow与深度学习

Google Brain工程师演讲实录：TensorFlow与深度学习

最后两张图表示我们在神经翻译系统上，每个 GPU 运算非常平衡，而右边人类专家设计的运算非常不平衡，在 GPU2 花了非常长的时间，在其他 GPU 花了很少的时间，但是这个也是可以理解，因为专家设计一般只考虑到一部分。在 Inception V3 我们的结果不是非常平衡。但是可能是因为 Inception V3 当中有一些过分的依赖，我们的结果仍然在 Inception V3 有总体的运行时间上的提高。后来我们做一些分析发现因为在数据拷贝期间，我们花了更少的时间。所以总体对它有一个运行时间的提高。

: WeiXiaoyu

相关推荐

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 0喜欢 / 0评论 2020-11-19

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 0喜欢 / 0评论 2020-11-19

机器学习新风暴：如何用ML模型预测房价？

从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过去的数据预测未来的数据。机器学习大致分为两大类：监督学习和无监督学习。对此可以使

81510295 0喜欢 / 0评论 2020-11-17

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 0喜欢 / 0评论 2020-11-17

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 0喜欢 / 0评论 2020-11-16

LinkedIn开源Dagli，发布Java机器学习函数库

近年来，越来越多的优秀的机器学习工具不断涌现，如 TensorFlow、 PyTorch、 Caffee 和 CNTK、用于大规模数据的 Spark 和 Kubeflow，以及用于各种通用模型的 scikit-learn、 ML.NET 和最近的 Trip

lgblove 0喜欢 / 0评论 2020-11-16

关于机器学习算法的16个技巧

您可能听说过瑞士军刀。如果没有，请看下面的图片。它包含许多刀片和工具。每个人都专门从事一项特定的任务。在某些情况下，不同的刀片可以完成相同的任务，但性能不同。我将机器学习算法视为瑞士军刀。性能可能会根据任务和数据的特征而变化。例如，对数损失是与所有分类算法

Pokemogo 0喜欢 / 0评论 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 0喜欢 / 0评论 2020-11-16

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 0喜欢 / 0评论 2020-11-13

需要知识的后深度学习时代，如何高效自动构建知识图谱

前沿的知识图谱自动构建技术有哪些？这篇文章将逐一解答这些问题。二者展示的信息量是差不多的，但右边这种看起来更加直观。而且，随着文本篇幅的增长，这种优势会体现得更加明显。其中，图的节点代表现实世界中存在的“实体”，图的边则代表实体之间的“关系”。基于知识图谱

lizhengjava 0喜欢 / 0评论 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 0喜欢 / 0评论 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 0喜欢 / 0评论 2020-11-13

24个提高知识和技能极限的机器学习项目

数据科学项目为你提供了一种有前途的方式来启动你在该领域的职业。你不仅可以通过应用它来学习数据科学，还可以在自己的简历上展示一些项目！这是大多数人挣扎和错过的地方。另外，我们确保所有数据集都是开放的并且可以自由访问。它由中型和大型数据集组成，需要一些认真的模

EchoYY 0喜欢 / 0评论 2020-11-12

IT自动化和人工智能将在2021年走向何方？

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

CSDN人工智能头条 0喜欢 / 0评论 2020-11-11

无监督机器学习的重要指南

人们如今正处在数字化转型时代，只有一个不变的因素——进化。而组织采用的高科技解决方案正在引入数字化转型。因此，毫不奇怪的是，技术进步已完全取代了平凡的业务。因此，人们需要了解无监督机器学习在各行业中的广泛应用。如果用户标记了可以作为示例的训练数据，人们将其

mogigo00 0喜欢 / 0评论 2020-11-11

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

在数据领域，很多人都在说机器学习，但是只有很少的人能说清楚怎么回事。网上关于机器学习的文章，大多都是充斥各种定理的厚重学术三部曲，或是关于人工智能、数据科学魔法以及未来工作的天花乱坠的故事。尽管数据分析实际工作中用到机器学习的机会真的不多，但我觉得它仍是数

jaybeat 0喜欢 / 0评论 2020-11-10

理解AI：为什么要在人工智能系统中寻求可解释性呢？

本文转载自公众号“读芯术”。或许这是你第一次听到人工智能前面加“可解释的”这个形容词，但其实它的涵义你一定能理解。可解释的人工智能是指构建AI应用程序的技术和方法，人们借此以理解它们做出特定决策的原因。换句话说，如果我们可以从AI系统获得有关其内部逻辑的解

白飞飞Alan 0喜欢 / 0评论 2020-11-11

机器学习的未来就在这里：高斯过程和神经网络是等价的

高斯进程已经存在了一段时间，但它只是在过去5-10年，有一个大的复苏，其兴趣。部分原因是求解的计算复杂：由于他们的模型需要矩阵反转，复杂性是 O，很难更快地获得。高斯过程最酷的特征之一是它们非常非常相似的神经网络。中央极限定理可以统一明显复杂的现象，在这

lemonade 0喜欢 / 0评论 2020-11-10

Python 用5行代码学机器学习—线性回归

我准备使用scikit-learn给大家介绍一些模型的基础知识，今天就来讲讲线性回归模型。开始之前，你要确保Python和pip已经成功安装在电脑上噢，如果没有，请访问这篇文章：超详细Python安装指南进行安装。如果你用Python的目的是数据分析，

机器学习之家 0喜欢 / 0评论 2020-11-10

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 0喜欢 / 0评论 2020-11-09

IT自动化和人工智能将在2021年走向何方?

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

EastCarFxxBlog 0喜欢 / 0评论 2020-11-09

数据科学面试中应了解的十种机器学习概念

如您本文转载自公众号“读芯术”。如您所知，数据科学和机器学习必须提供无穷无尽的信息和知识。话虽如此，大多数公司都只测试少数核心思想。这是因为这十个概念是更复杂的思想和概念的基础。您可能想知道为什么我什至不愿意将其放入，因为它是如此的基础。换句话说，更加重视

luyong0 0喜欢 / 0评论 2020-11-08

一文读懂机器学习“数据中毒”

在人类的眼中，下面的三张图片分别展示了三样不同的东西：一只鸟、一只狗和一匹马。但对于机器学习算法来说，这三者或许表示同样的东西:一个有黑边的白色小方框。这个例子说明机器学习模型有一个十分危险的特性，可以利用这一特性使其对数据进行错误分类。因此，恶意行为者可

sayhaha 0喜欢 / 0评论 2020-11-08

强化学习到底是什么，它如何运作？

强化学习是一种行为学习模型，由算法提供数据分析反馈，引导用户逐步获取最佳结果。不同于使用样本数据集训练机器模型的各类监督学习，强化学习尝试通过反复试验掌握个中诀窍。强化学习与人类在婴幼儿时期的学习过程非常相似。这是一种基于经验的学习流程，机器会不断尝试、不

83153251 0喜欢 / 0评论 2020-11-06

选择困难终结者：不同问题之下的机器学习算法

刚开始学习数据科学时，笔者经常面临这样一个问题：遇到具体问题，选择何种算法才合适。也许你也和我一样，搜了很多有关机器学习算法的文章，会看到许多详细的描述，却并没有减少让抉择的难度。问题陈述2：深挖客户统计数据用以识别模式。问题陈述12：根据车辆特性预估车辆

lwnylslwnyls 0喜欢 / 0评论 2020-11-06

自动驾驶汽车深度学习如何应对挑战?

在自动驾驶汽车中使用深度学习可以帮助克服各种挑战，例如了解行人的行为，找到最短的路线以及对人和物体进行准确检测。根据一份报告，2018年约有80%的道路交通事故是由于人为错误造成的。因此，将自动驾驶汽车纳入主流的主要目标之一是消除对人类驾驶员的需求并减少道

86377811 0喜欢 / 0评论 2020-11-06

机器学习技术之什么是集成学习？

什么是集成学习?简而言之，集成学习是训练多个机器学习模型并将其输出组合在一起的过程。组织以不同的模型为基础，致力构建一个最优的预测模型。组合各种不同的机器学习模型可以提高整体模型的稳定性，从而获得更准确的预测结果。集成学习模型通常比单个模型更可靠，因此，它

chenyuping 0喜欢 / 0评论 2020-11-06

数字营销：AI如何“看透”人类行为模式？

人工智能在市场营销领域取得的成功，揭示了人类的一些思维和行为模式，这些模式可以转化为其他应用程序。市场营销业已成为AI创新的试水之地，尤其是在人类行为建模和AI与人类交互探究层面更具实验价值。目前AI的局限性阻碍了机器使用溯因推理或创造性思维的能力。AI已

lizhengjava 0喜欢 / 0评论 2020-11-05

如果不能用Python执行机器学习，那该用什么呢？

长期学习数据科学的人一定知道如何用Python、R和Julia这些语言执行机器学习任务。然而，如果速度很关键，但硬件很有限，或者所在公司仅使用SQL进行预测分析，又该怎么办呢?答案就是——数据库内的机器学习。下面将使用Oracle机器学习在著名的Iris数

mori 0喜欢 / 0评论 2020-11-06

研究员准备让智能设备用AI来判断你的声音来自哪里

虽然这个想法让隐私保护主义者感到害怕，但智能音箱的开发者们正在努力让他们的设备在没有听到用户唤醒词的情况下也能启动。我们知道谷歌已经在研究这项技术，但现在，卡内基梅隆大学那边的人也在跟进，研究人员已经开发出了一种机器学习模型，利用人工智能的力量精确判断某人

机器之心 0喜欢 / 0评论 2020-11-06

87%的机器学习项目失败的十大原因

如今人们总是能听到有关机器学习的新闻，而机器学习技术确实有更多发展潜力。调研机构Gartner公司预测，对于很多组织来说，80%的人工智能项目仍是一种难以获得成功的炼金术。根据VentureBeat公司发布的“Transform2019”研究报告，87%的

randy0 0喜欢 / 0评论 2020-11-05

为什么企业应该了解聊天机器人中的自然语言处理？

自然语言处理使聊天机器人能够理解我们的会话信息并相应地作出响应。企业应该对聊天机器人中的自然语言处理有所了解，因为它可以确定用户意图，评估其情绪并了解其行为。聊天机器人已经成为企业在当今竞争激烈的市场中获得认可的当务之急。利用聊天机器人提供的前所未有的客户

saluzirobot 0喜欢 / 0评论 2020-11-05

不要上手就学深度学习！超详细的人工智能专家路线图，GitHub数天获2.1k星

反过头来看，这些方法可能作用并不是很大，却消耗了大量的时间和金钱。如果你想成为数据科学家、机器学习或者 AI 专家，而又苦于找不到合适的学习方法，本文将提供一组思路清晰、简单易懂的人工智能专家路线图。这是一家德国软件公司 AMAI GmbH 近期发布的 G

Niteowl 0喜欢 / 0评论 2020-11-05

微型机器学习：下一次AI革命

本文转自雷锋网，如需转载请至雷锋网官网申请授权。由美国宇航局推动开始的电子产品小型化成为整个消费品行业（的趋势）。现在我们把贝多芬的完整作品带在领章上使用耳机听。— 哈佛大学副教授 Vijay Janapa Reddi. 这是关于微型机器学习系列文章的第一

人工智能 0喜欢 / 0评论 2020-11-04

TinyML：下一轮人工智能革命

人工智能的一个趋势是正快速从“云端”走向“边缘”。TinyML 是在海量的物联网设备端微控制器上实现的人工智能，有望在未来几年内，成为人工智能在工业领域的重要新应用。边缘设备往往计算资源和电量受限，对功耗极为敏感。本文是 TinyML 系列文章中的第一篇，

mogigo00 0喜欢 / 0评论 2020-11-04

AlphaGo原来是这样运行的，一文详解多智能体强化学习

在这篇综述性文章中，作者详尽地介绍了多智能强化学习的理论基础，并阐述了解决各类多智能问题的经典算法。此外，作者还以 AlphaGo、AlphaStar为例，概述了多智能体强化学习的实际应用。近年来，随着强化学习在多个应用领域取得了令人瞩目的成果，并且考虑到

87133658 0喜欢 / 0评论 2020-11-04

DJL 如何正确打开 [ 深度学习 ]

本文转载自微信公众号「小明菜市场」，作者小明菜市场。很长时间，Java都是一个相当受欢迎的企业编程语言，其框架丰富，生态完善。为了减少Java开发者学习深度学习的成本，AWS构建了一个Deep Java Library，一个为Java开发者定制的开源深度

ohbxiaoxin 0喜欢 / 0评论 2020-11-04

揭开AI、机器学习和深度学习的神秘面纱

深度学习、机器学习、人工智能——这些流行词皆代表了分析学的未来。在这篇文章中，我们将通过一些真实世界的案例来解释什么是机器学习和深度学习。这样做的目的不是要把你变成一个数据科学家，而是让你更好地理解你可以用机器学习做什么。开发人员能越来越容易地使用机器学习

bigquant 0喜欢 / 0评论 2020-11-03

边缘AI新方法TinyML，超低功耗，在边缘设备进行机器学习

人工智能 AI 正在加快速度从云端走向边缘，进入到越来越小的物联网设备中。而这些物联网设备往往体积很小，面临着许多挑战，例如功耗、延时以及精度等问题，传统的机器学习模型无法满足要求，那么微型机器学习又如何呢？在 NASA 的推动下，小型化的电子产品成为了一

junjie0000 0喜欢 / 0评论 2020-11-03

模型数据出现偏差怎么办？一文了解机器学习中的7种数据偏差类型

机器学习中的数据偏差是一种错误，其中数据集的某些元素的权重和/或表示程度高于其他元素。偏置数据集不能准确表示模型的用例，从而导致结果偏斜、精度低和分析错误。通常，机器学习项目的培训数据必须代表现实世界。数据偏差可能发生在一系列领域，从人类报告和选择偏差到算

gyunwh 0喜欢 / 0评论 2020-11-02

这里有你需要的5个机器学习必备技能

机器学习，听起来很酷。这名字不禁令人以为是一排机器人坐着学习知识的样子，但其实是让机器人拥有像人一样的学习能力的高端技术，这样就能高效快捷地从数据中找出有用的东西。云计算服务支持构建和部署AI及机器学习应用程序的种种功能。除了专业外，作为IT团队成员一定要

jaybeat 0喜欢 / 0评论 2020-11-02

用Python构建和可视化决策树

决策树是当今最强大的监督学习方法的组成部分。决策树基本上是一个二叉树的流程图，其中每个节点根据某个特征变量将一组观测值拆分。决策树的目标是将数据分成多个组，这样一个组中的每个元素都属于同一个类别。在这种情况下，树将进行拆分，使每个组的均方误差最小。决策树的

赶路人儿 0喜欢 / 0评论 2020-11-02

用 Java 训练深度学习模型，原来可以这么简单！

HelloGitHub 推出的《讲解开源项目》系列。这一期是由亚马逊工程师：Keerthan Vasist，为我们讲解 DJL系列的第 4 篇。很长时间以来，Java 都是一个很受企业欢迎的编程语言。得益于丰富的生态以及完善维护的包和框架，Java 拥有着

PandaJiong 0喜欢 / 0评论 2020-11-02

Forrester预测：2021年，人工智能将大放异彩

随着新冠病毒在全球蔓延，越来越多的公司正面临着很多与之前不同的新问题。比如，如何保持公司对于客户需求变化的适应？如何适应行业的下一个增长曲线？用好人工智能十分关键。因此，人工智能的未来也成为了越来越多公司关注的焦点。人工智能是神秘的，同时也是变革性的。人工

AI智能 0喜欢 / 0评论 2020-11-02

人工智能和机器学习：金融科技行业的新蓝图

企业并没有充分利用人工智能和机器学习。毫无疑问，人工智能和机器学习正在成为金融科技行业的热门话题。显然，人工智能和机器学习是金融科技行业赖以运作的蓝图。确实，有四分之三的高管认为，如果他们在未来五年内不扩大人工智能的规模，那么他们就有可能关门大吉。同样，有

ZLXiong 0喜欢 / 0评论 2020-11-02

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 0喜欢 / 0评论 2020-11-02

在云端你需要的5个机器学习技能

机器学习和AI继续深入IT服务中，并补充软件工程师开发的应用程序。如果IT团队想跟上这种步伐，必须提高他们的机器学习技能。云计算服务支持构建和部署AI及机器学习应用程序的各种功能。在很多方面，AI系统的管理与IT专业人员在云端熟悉的其他软件非常相似。但是，

changyuanchn 0喜欢 / 0评论 2020-11-01

如何最大化机器学习服务器的利用率和可扩展性？

本文转载自公众号“读芯术”。汤普森表示在最近的一些演讲和论文中表示，从事大型和前沿人工智能项目的研究人员开始抱怨，因为成本太高，他们无法测试多个算法设计，或者重新进行实验。2020年5月，DeepCube发布了基于软件的推理加速器，大大提高了所有现有硬件上

clong 0喜欢 / 0评论 2020-10-31

机器学习中处理缺失值的9种方法

它是任何数据科学或机器学习项目的关键。在大多数情况下，当我们从不同的资源收集数据或从某处下载数据时，几乎有95%的可能性我们的数据中包含缺失的值。我们不能对包含缺失值的数据进行分析或训练机器学习模型。这就是为什么我们90%的时间都花在数据预处理上的主要原因

EchoYY 0喜欢 / 0评论 2020-10-31

人工智能和机器学习如何从物联网数据中提取关键见解

过去几年，围绕物联网的大部分讨论都集中在连网设备本身——它们是什么、有多少以及如何保护它们。虽然所有这些小端点都很重要，但在物联网中更重要的是这些设备所生成的大量数据，以及通过分析可以从中获得的业务见解。这些缺点在物联网环境中更加严重，在物联网环境中，大量

dingyahui 0喜欢 / 0评论 2020-10-30