算法、数据、机器学习能力…… AI创业企业的护城河是什么？

mtzhujun0 2017-10-26

算法、数据、机器学习能力…… AI创业企业的护城河是什么？

投资者最关注的事情之一就是创业者是否找到了自己的护城河。以及，在未来岁月里，你的护城河是否越挖越深。

在AI时代，一家希望在AI领域创业成功的公司的护城河是什么?不是算法，不是数据，而是数据的平方。

这对初创企业来说颇有难度，因为现有的数据都掌握在已成巍峨之势的大公司手里。本文正是为解答这一难题而来：小公司如何获得数据优势，上演大卫战胜歌利亚的逆袭故事?或者至少能够与强者共存?

不再剧透，请阅主文。

投资无非就是要找到“护城河”，也就是某行业领域内一家公司独有的优势和强项。因为：

未来的预期现金流预示了公司的估值;
盈利的能力预示了未来的预期现金流;
而护城河则预示了盈利的能力。

为什么护城河预示了盈利的能力?很简单，因为护城河增强了一家公司与其供应商和顾客的议价能力，帮助公司提高产品价格、降低成本，以此获得更多利润。各个市场里现有的网络效应就是护城河的一个绝佳例子。以Airbnb来说，如果有越多的房出租，就越有可能吸引更多的房东自己找上门来，在Airbnb上发布房源。这样就形成了闭环，其他平台就很难进入这个市场了。

这种机制产生了一种“赢家通吃”的态势，最大最强的那家公司常常会比它的竞争对手们大出几个数量级。这也是为什么投资者喜欢这类独角兽的原因。

AI为何如此特别?

现在，AI浪潮引起人们关注的是，它带来了一种新型网络效应，有人将其称为“数据网络效应”。机器学习的算法需要数据来支撑。虽然算法和数据之间并不存在线性关系，但机器学习的算法在接受了大量的数据后，处理预测/分类性任务的准确性变得更高了。

还有以下这种机制也值得注意：一家公司，随着其用户增多，会收集到越来越多的数据来训练和优化自己的算法，预测顾客喜好的精准度就越高，产品的总体质量也随之提升，这就会吸引更多的新顾客来购买产品，为公司提供更多数据。这样又形成一个闭环。

这就出现另一种自我增强型反馈环路，我们称之为“人才吸引环路”。一家公司拥有越多数据，它就越能吸引到数据研究者来该公司工作，就有更大的机会吸引到业内大神，打造出完美的机器学习产品。

但问题是，一家初创公司起初一点数据都没有(或只有一点数据)，只能依靠一小群有才华的人(通常就是创始人)来维持运作。正如市场需要时间和资源来形成网络效应，AI公司也需要初始数据来开始形成自己的增强环路。

而谁拥有这样的数据?

现有的大公司。

这就是为什么现有公司会凭着既有优势，有失公平地站在了人工智能这场浪潮的浪尖上。

不过，好消息是，现有的大公司也不是那么容易地就可以驾驭这股潮流。

歌利亚可以战胜：

分析现有公司优势的框架

算法、数据、机器学习能力…… AI创业企业的护城河是什么？

以下这个公式可能可以用来解释AI公司成功的部分原因：

AI企业成功=数据+机器学习能力+算法

也就是，成功的、有市场竞争防御能力的AI公司有着足够多的数据让其机器学习可以用来创造出最佳的算法。

要想看清AI领域现有公司的优势，一个很有用的方法便是观察这个2×2矩阵，其中一条轴是每个用例里可用的数据总量，另一条轴则是这个用例里的公司的本质。

在大型科技公司的用例里，每个潜在的客户都拥有大量的数据，如果我们看这些用例，就会发现现有公司的优势十分明显。除了那些典型的优势外(如客源更广、更有能力去投资和承受损失)，大型科技公司就像坐吃山不空，依靠的是多年积累的数据。

它们也从自己的品牌和强大的财力资源中获益，有能力去聘请最优秀的机器学习人才，让他们研发出最强大的算法。现有公司的得分：3/3。

初创公司在这种情况下不应该跟现有科技公司硬碰硬。

但现有公司在矩阵的这一块并没有很大优势，这就是右下方这一领域。这一块是非技术公司的主场，而且它们的每一位潜在客户都已经拥有了大量数据。想一想管理高速公路的运营商，它们就拥有着多年以来的收费站数据。

历史已经证明，数据可能比算法更有价值，尤其是在深度学习登场后。

此外，大型技术公司正不断地将最新的机器学习包开源出来，让算法变成了商品，尤其是在物体识别、自然语言处理领域——我们称为广义机器学习。有了广义机器学习，那些拥有大量数据集的非技术公司在使用开源数据包后得以获得相关的有用结果，而这些数据包先前都是用科技公司的数据集来训练的。

总的来说，一家大公司，无论它是不是科技公司，也不管内部有没有顶尖的机器学习专家，都可以比一家拥有顶尖机器学习专家的小公司创造出更优质的人工智能产品，因为它比小型初创公司拥有更多数据，就这么简单。

这样一来，我们就应该在方程式里更注重数据而不是机器学习的能力，所以，之前的公式应该修正为：

AI企业成功=数据×数据+机器学习能力+算法

对初创公司来说，这可能意味着大量机遇。尤其是如果初创公司能：

整合大型技术公司缺乏的多种信息源，或者：
产生额外的专有数据。

这个矩阵里剩下的左下角这一块，可能就存在着最大的机遇：技术公司没有参与进来，而客户也没有途径接触到足够庞大的数据集来让广义机器学习发挥作用。农业和医护的某些领域就是很好的例子，这些领域里还没有大型技术公司占据市场，而每个客户也只有少量数据。

初创公司如何深挖护城河?

上述新公式意味着，当数据一开始只有很少量的时候，它的影响就没有公式修正之前时那么大，机器学习能力和算法的权重就显得更大。在这种情况下，现有公司的优势就没有之前那么明显了。

这样计算的直接结果就是，当市场里数据稀少时，初创公司有机会凭借关键的机器学习能力和创新性的算法成为市场赢家。

以下三种相互关联的方法，可以解决数据稀少情况下如何启动创业的问题。

方法1：从众多顾客身上收集数据

虽然凭一家公司之力可能无法获得足够多的数据集来打造出一款高级AI产品，但如果一家AI初创公司从其主要客户中不断收集数据，形成自己的数据池，那它就有可能成为唯一一家产品能让顾客满意的公司。在这个过程中，所有相关方都需要贡献出自己获得的数据，让算法能够在更庞大的数据基础上得以训练，进而从中受益。

方法2: (多个)智能系统

如果我们再深入一点探究大数据集难以获得的其他原因，就会发现这些数据集不仅存在于不同客户之间，还存在于不同的SaaS工具里。

坐拥这两类数据集的AI初创公司就有非常大的可能做出最精准的预测，成为一种智能系统。

你可以把数据集看作是价值链上的互补性资产。刚成立的、看上去人畜无害的AI初创公司，可以与现有公司不屑于合作的客户合作，从而建立起互补性资产，在与现有公司的竞争中存活下来。

这种观点的逆反命题就是，任何一家依赖于单一、非专有数据的公司，其市场竞争抵御能力比那些结合多种数据来源的公司要低。

最后，我们回到了这个问题上：“谁在用我的数据赚钱?”——是那家产生数据的公司吗?是储存数据的公司吗?还是那家打造出了最佳机器学习产品的公司?

方法3：获得特有用户生成的数据集

如果一家公司无法从多方客户或多种SaaS工具里收集到数据，或者这些数据不足以让公司做出精准模型，那么它可以尝试从其对外提供的SaaS服务里产生额外的数据。这种独特的方式可以让公司获得专有的数据集，而其他现有公司无法获得。

只需少量的时间、投入和金钱就可以获得足够多的数据来满足客户的期待，因此公司的防御能力相对有限。这种情况尤其适用于所使用的数据可以公开获得的案例。

客户很有可能不会贡献他们的数据，而数据网络效应也需要经过漫长时期才能显现，所以公司的防御能力会越来越强。

: mtzhujun0

相关推荐

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 0喜欢 / 0评论 2020-11-19

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 0喜欢 / 5评论 2020-11-19

机器学习新风暴：如何用ML模型预测房价？

从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过去的数据预测未来的数据。机器学习大致分为两大类：监督学习和无监督学习。对此可以使

81510295 0喜欢 / 0评论 2020-11-17

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 0喜欢 / 5评论 2020-11-17

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 0喜欢 / 12评论 2020-11-16

LinkedIn开源Dagli，发布Java机器学习函数库

近年来，越来越多的优秀的机器学习工具不断涌现，如 TensorFlow、 PyTorch、 Caffee 和 CNTK、用于大规模数据的 Spark 和 Kubeflow，以及用于各种通用模型的 scikit-learn、 ML.NET 和最近的 Trip

lgblove 0喜欢 / 0评论 2020-11-16

关于机器学习算法的16个技巧

您可能听说过瑞士军刀。如果没有，请看下面的图片。它包含许多刀片和工具。每个人都专门从事一项特定的任务。在某些情况下，不同的刀片可以完成相同的任务，但性能不同。我将机器学习算法视为瑞士军刀。性能可能会根据任务和数据的特征而变化。例如，对数损失是与所有分类算法

Pokemogo 0喜欢 / 8评论 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 0喜欢 / 12评论 2020-11-16

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 0喜欢 / 12评论 2020-11-13

需要知识的后深度学习时代，如何高效自动构建知识图谱

前沿的知识图谱自动构建技术有哪些？这篇文章将逐一解答这些问题。二者展示的信息量是差不多的，但右边这种看起来更加直观。而且，随着文本篇幅的增长，这种优势会体现得更加明显。其中，图的节点代表现实世界中存在的“实体”，图的边则代表实体之间的“关系”。基于知识图谱

lizhengjava 0喜欢 / 12评论 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 0喜欢 / 6评论 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 0喜欢 / 8评论 2020-11-13

24个提高知识和技能极限的机器学习项目

数据科学项目为你提供了一种有前途的方式来启动你在该领域的职业。你不仅可以通过应用它来学习数据科学，还可以在自己的简历上展示一些项目！这是大多数人挣扎和错过的地方。另外，我们确保所有数据集都是开放的并且可以自由访问。它由中型和大型数据集组成，需要一些认真的模

EchoYY 0喜欢 / 12评论 2020-11-12

IT自动化和人工智能将在2021年走向何方？

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

CSDN人工智能头条 0喜欢 / 5评论 2020-11-11

无监督机器学习的重要指南

人们如今正处在数字化转型时代，只有一个不变的因素——进化。而组织采用的高科技解决方案正在引入数字化转型。因此，毫不奇怪的是，技术进步已完全取代了平凡的业务。因此，人们需要了解无监督机器学习在各行业中的广泛应用。如果用户标记了可以作为示例的训练数据，人们将其

mogigo00 0喜欢 / 5评论 2020-11-11

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

在数据领域，很多人都在说机器学习，但是只有很少的人能说清楚怎么回事。网上关于机器学习的文章，大多都是充斥各种定理的厚重学术三部曲，或是关于人工智能、数据科学魔法以及未来工作的天花乱坠的故事。尽管数据分析实际工作中用到机器学习的机会真的不多，但我觉得它仍是数

jaybeat 0喜欢 / 8评论 2020-11-10

理解AI：为什么要在人工智能系统中寻求可解释性呢？

本文转载自公众号“读芯术”。或许这是你第一次听到人工智能前面加“可解释的”这个形容词，但其实它的涵义你一定能理解。可解释的人工智能是指构建AI应用程序的技术和方法，人们借此以理解它们做出特定决策的原因。换句话说，如果我们可以从AI系统获得有关其内部逻辑的解

白飞飞Alan 0喜欢 / 0评论 2020-11-11

机器学习的未来就在这里：高斯过程和神经网络是等价的

高斯进程已经存在了一段时间，但它只是在过去5-10年，有一个大的复苏，其兴趣。部分原因是求解的计算复杂：由于他们的模型需要矩阵反转，复杂性是 O，很难更快地获得。高斯过程最酷的特征之一是它们非常非常相似的神经网络。中央极限定理可以统一明显复杂的现象，在这

lemonade 0喜欢 / 12评论 2020-11-10

Python 用5行代码学机器学习—线性回归

我准备使用scikit-learn给大家介绍一些模型的基础知识，今天就来讲讲线性回归模型。开始之前，你要确保Python和pip已经成功安装在电脑上噢，如果没有，请访问这篇文章：超详细Python安装指南进行安装。如果你用Python的目的是数据分析，

机器学习之家 0喜欢 / 0评论 2020-11-10

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 0喜欢 / 15评论 2020-11-09

IT自动化和人工智能将在2021年走向何方?

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

EastCarFxxBlog 0喜欢 / 10评论 2020-11-09

数据科学面试中应了解的十种机器学习概念

如您本文转载自公众号“读芯术”。如您所知，数据科学和机器学习必须提供无穷无尽的信息和知识。话虽如此，大多数公司都只测试少数核心思想。这是因为这十个概念是更复杂的思想和概念的基础。您可能想知道为什么我什至不愿意将其放入，因为它是如此的基础。换句话说，更加重视

luyong0 0喜欢 / 12评论 2020-11-08

一文读懂机器学习“数据中毒”

在人类的眼中，下面的三张图片分别展示了三样不同的东西：一只鸟、一只狗和一匹马。但对于机器学习算法来说，这三者或许表示同样的东西:一个有黑边的白色小方框。这个例子说明机器学习模型有一个十分危险的特性，可以利用这一特性使其对数据进行错误分类。因此，恶意行为者可

sayhaha 0喜欢 / 15评论 2020-11-08

强化学习到底是什么，它如何运作？

强化学习是一种行为学习模型，由算法提供数据分析反馈，引导用户逐步获取最佳结果。不同于使用样本数据集训练机器模型的各类监督学习，强化学习尝试通过反复试验掌握个中诀窍。强化学习与人类在婴幼儿时期的学习过程非常相似。这是一种基于经验的学习流程，机器会不断尝试、不

83153251 0喜欢 / 10评论 2020-11-06

选择困难终结者：不同问题之下的机器学习算法

刚开始学习数据科学时，笔者经常面临这样一个问题：遇到具体问题，选择何种算法才合适。也许你也和我一样，搜了很多有关机器学习算法的文章，会看到许多详细的描述，却并没有减少让抉择的难度。问题陈述2：深挖客户统计数据用以识别模式。问题陈述12：根据车辆特性预估车辆

lwnylslwnyls 0喜欢 / 0评论 2020-11-06

自动驾驶汽车深度学习如何应对挑战?

在自动驾驶汽车中使用深度学习可以帮助克服各种挑战，例如了解行人的行为，找到最短的路线以及对人和物体进行准确检测。根据一份报告，2018年约有80%的道路交通事故是由于人为错误造成的。因此，将自动驾驶汽车纳入主流的主要目标之一是消除对人类驾驶员的需求并减少道

86377811 0喜欢 / 0评论 2020-11-06

机器学习技术之什么是集成学习？

什么是集成学习?简而言之，集成学习是训练多个机器学习模型并将其输出组合在一起的过程。组织以不同的模型为基础，致力构建一个最优的预测模型。组合各种不同的机器学习模型可以提高整体模型的稳定性，从而获得更准确的预测结果。集成学习模型通常比单个模型更可靠，因此，它

chenyuping 0喜欢 / 0评论 2020-11-06

数字营销：AI如何“看透”人类行为模式？

人工智能在市场营销领域取得的成功，揭示了人类的一些思维和行为模式，这些模式可以转化为其他应用程序。市场营销业已成为AI创新的试水之地，尤其是在人类行为建模和AI与人类交互探究层面更具实验价值。目前AI的局限性阻碍了机器使用溯因推理或创造性思维的能力。AI已

lizhengjava 0喜欢 / 3评论 2020-11-05

如果不能用Python执行机器学习，那该用什么呢？

长期学习数据科学的人一定知道如何用Python、R和Julia这些语言执行机器学习任务。然而，如果速度很关键，但硬件很有限，或者所在公司仅使用SQL进行预测分析，又该怎么办呢?答案就是——数据库内的机器学习。下面将使用Oracle机器学习在著名的Iris数

mori 0喜欢 / 0评论 2020-11-06

研究员准备让智能设备用AI来判断你的声音来自哪里

虽然这个想法让隐私保护主义者感到害怕，但智能音箱的开发者们正在努力让他们的设备在没有听到用户唤醒词的情况下也能启动。我们知道谷歌已经在研究这项技术，但现在，卡内基梅隆大学那边的人也在跟进，研究人员已经开发出了一种机器学习模型，利用人工智能的力量精确判断某人

机器之心 0喜欢 / 0评论 2020-11-06

87%的机器学习项目失败的十大原因

如今人们总是能听到有关机器学习的新闻，而机器学习技术确实有更多发展潜力。调研机构Gartner公司预测，对于很多组织来说，80%的人工智能项目仍是一种难以获得成功的炼金术。根据VentureBeat公司发布的“Transform2019”研究报告，87%的

randy0 0喜欢 / 0评论 2020-11-05

为什么企业应该了解聊天机器人中的自然语言处理？

自然语言处理使聊天机器人能够理解我们的会话信息并相应地作出响应。企业应该对聊天机器人中的自然语言处理有所了解，因为它可以确定用户意图，评估其情绪并了解其行为。聊天机器人已经成为企业在当今竞争激烈的市场中获得认可的当务之急。利用聊天机器人提供的前所未有的客户

saluzirobot 0喜欢 / 0评论 2020-11-05

不要上手就学深度学习！超详细的人工智能专家路线图，GitHub数天获2.1k星

反过头来看，这些方法可能作用并不是很大，却消耗了大量的时间和金钱。如果你想成为数据科学家、机器学习或者 AI 专家，而又苦于找不到合适的学习方法，本文将提供一组思路清晰、简单易懂的人工智能专家路线图。这是一家德国软件公司 AMAI GmbH 近期发布的 G

Niteowl 0喜欢 / 0评论 2020-11-05

微型机器学习：下一次AI革命

本文转自雷锋网，如需转载请至雷锋网官网申请授权。由美国宇航局推动开始的电子产品小型化成为整个消费品行业（的趋势）。现在我们把贝多芬的完整作品带在领章上使用耳机听。— 哈佛大学副教授 Vijay Janapa Reddi. 这是关于微型机器学习系列文章的第一

人工智能 0喜欢 / 11评论 2020-11-04

TinyML：下一轮人工智能革命

人工智能的一个趋势是正快速从“云端”走向“边缘”。TinyML 是在海量的物联网设备端微控制器上实现的人工智能，有望在未来几年内，成为人工智能在工业领域的重要新应用。边缘设备往往计算资源和电量受限，对功耗极为敏感。本文是 TinyML 系列文章中的第一篇，

mogigo00 0喜欢 / 0评论 2020-11-04

AlphaGo原来是这样运行的，一文详解多智能体强化学习

在这篇综述性文章中，作者详尽地介绍了多智能强化学习的理论基础，并阐述了解决各类多智能问题的经典算法。此外，作者还以 AlphaGo、AlphaStar为例，概述了多智能体强化学习的实际应用。近年来，随着强化学习在多个应用领域取得了令人瞩目的成果，并且考虑到

87133658 0喜欢 / 15评论 2020-11-04

DJL 如何正确打开 [ 深度学习 ]

本文转载自微信公众号「小明菜市场」，作者小明菜市场。很长时间，Java都是一个相当受欢迎的企业编程语言，其框架丰富，生态完善。为了减少Java开发者学习深度学习的成本，AWS构建了一个Deep Java Library，一个为Java开发者定制的开源深度

ohbxiaoxin 0喜欢 / 0评论 2020-11-04

揭开AI、机器学习和深度学习的神秘面纱

深度学习、机器学习、人工智能——这些流行词皆代表了分析学的未来。在这篇文章中，我们将通过一些真实世界的案例来解释什么是机器学习和深度学习。这样做的目的不是要把你变成一个数据科学家，而是让你更好地理解你可以用机器学习做什么。开发人员能越来越容易地使用机器学习

bigquant 0喜欢 / 11评论 2020-11-03

边缘AI新方法TinyML，超低功耗，在边缘设备进行机器学习

人工智能 AI 正在加快速度从云端走向边缘，进入到越来越小的物联网设备中。而这些物联网设备往往体积很小，面临着许多挑战，例如功耗、延时以及精度等问题，传统的机器学习模型无法满足要求，那么微型机器学习又如何呢？在 NASA 的推动下，小型化的电子产品成为了一

junjie0000 0喜欢 / 0评论 2020-11-03

模型数据出现偏差怎么办？一文了解机器学习中的7种数据偏差类型

机器学习中的数据偏差是一种错误，其中数据集的某些元素的权重和/或表示程度高于其他元素。偏置数据集不能准确表示模型的用例，从而导致结果偏斜、精度低和分析错误。通常，机器学习项目的培训数据必须代表现实世界。数据偏差可能发生在一系列领域，从人类报告和选择偏差到算

gyunwh 0喜欢 / 0评论 2020-11-02

这里有你需要的5个机器学习必备技能

机器学习，听起来很酷。这名字不禁令人以为是一排机器人坐着学习知识的样子，但其实是让机器人拥有像人一样的学习能力的高端技术，这样就能高效快捷地从数据中找出有用的东西。云计算服务支持构建和部署AI及机器学习应用程序的种种功能。除了专业外，作为IT团队成员一定要

jaybeat 0喜欢 / 15评论 2020-11-02

用Python构建和可视化决策树

决策树是当今最强大的监督学习方法的组成部分。决策树基本上是一个二叉树的流程图，其中每个节点根据某个特征变量将一组观测值拆分。决策树的目标是将数据分成多个组，这样一个组中的每个元素都属于同一个类别。在这种情况下，树将进行拆分，使每个组的均方误差最小。决策树的

赶路人儿 0喜欢 / 0评论 2020-11-02

用 Java 训练深度学习模型，原来可以这么简单！

HelloGitHub 推出的《讲解开源项目》系列。这一期是由亚马逊工程师：Keerthan Vasist，为我们讲解 DJL系列的第 4 篇。很长时间以来，Java 都是一个很受企业欢迎的编程语言。得益于丰富的生态以及完善维护的包和框架，Java 拥有着

PandaJiong 0喜欢 / 13评论 2020-11-02

Forrester预测：2021年，人工智能将大放异彩

随着新冠病毒在全球蔓延，越来越多的公司正面临着很多与之前不同的新问题。比如，如何保持公司对于客户需求变化的适应？如何适应行业的下一个增长曲线？用好人工智能十分关键。因此，人工智能的未来也成为了越来越多公司关注的焦点。人工智能是神秘的，同时也是变革性的。人工

AI智能 0喜欢 / 0评论 2020-11-02

人工智能和机器学习：金融科技行业的新蓝图

企业并没有充分利用人工智能和机器学习。毫无疑问，人工智能和机器学习正在成为金融科技行业的热门话题。显然，人工智能和机器学习是金融科技行业赖以运作的蓝图。确实，有四分之三的高管认为，如果他们在未来五年内不扩大人工智能的规模，那么他们就有可能关门大吉。同样，有

ZLXiong 0喜欢 / 15评论 2020-11-02

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 0喜欢 / 14评论 2020-11-02

在云端你需要的5个机器学习技能

机器学习和AI继续深入IT服务中，并补充软件工程师开发的应用程序。如果IT团队想跟上这种步伐，必须提高他们的机器学习技能。云计算服务支持构建和部署AI及机器学习应用程序的各种功能。在很多方面，AI系统的管理与IT专业人员在云端熟悉的其他软件非常相似。但是，

changyuanchn 0喜欢 / 14评论 2020-11-01

如何最大化机器学习服务器的利用率和可扩展性？

本文转载自公众号“读芯术”。汤普森表示在最近的一些演讲和论文中表示，从事大型和前沿人工智能项目的研究人员开始抱怨，因为成本太高，他们无法测试多个算法设计，或者重新进行实验。2020年5月，DeepCube发布了基于软件的推理加速器，大大提高了所有现有硬件上

clong 0喜欢 / 0评论 2020-10-31

机器学习中处理缺失值的9种方法

它是任何数据科学或机器学习项目的关键。在大多数情况下，当我们从不同的资源收集数据或从某处下载数据时，几乎有95%的可能性我们的数据中包含缺失的值。我们不能对包含缺失值的数据进行分析或训练机器学习模型。这就是为什么我们90%的时间都花在数据预处理上的主要原因

EchoYY 0喜欢 / 14评论 2020-10-31

人工智能和机器学习如何从物联网数据中提取关键见解

过去几年，围绕物联网的大部分讨论都集中在连网设备本身——它们是什么、有多少以及如何保护它们。虽然所有这些小端点都很重要，但在物联网中更重要的是这些设备所生成的大量数据，以及通过分析可以从中获得的业务见解。这些缺点在物联网环境中更加严重，在物联网环境中，大量

dingyahui 0喜欢 / 14评论 2020-10-30