验证集与测试集的区别

woxxoole 2020-01-03

验证集与测试集的区别

验证集 —— 是模型训练过程中单独留出的样本集，它可以用于调整模型的超参数和用于对模型的能力进行初步评估。

测试集 —— 用来评估模最终模型的泛化能力。但不能作为调参、选择特征等算法相关的选择的依据。

验证集与测试集的区别

一个形象的比喻：

训练集-----------学生的课本；学生根据课本里的内容来掌握知识。

验证集------------作业，通过作业可以知道不同学生学习情况、进步的速度快慢。

测试集-----------考试，考的题是平常都没有见过，考察学生举一反三的能力。

　　传统上，一般三者切分的比例是：6：2：2，验证集并不是必须的。

　　那么为什么要测试集呢？

　　　　a)训练集直接参与了模型调参的过程，显然不能用来反映模型真实的能力（防止课本死记硬背的学生拥有最好的成绩，即防止过拟合)。

　　　　b)验证集参与了人工调参(超参数)的过程，也不能用来最终评判一个模型（刷题库的学生不能算是学习好的学生）。

　　　　c)所以要通过最终的考试(测试集)来考察一个学(模)生(型)真正的能力（期末考试）。

　　但是仅凭一次考试就对模型的好坏进行评判显然是不合理的，所以就要使用交叉验证法。交叉验证法的作用就是尝试利用不同的训练集/验证集划分来对模型做多组不同的训练/验证，来应对单独测试结果过于片面以及训练数据不足的问题。（就像通过多次考试，才得知哪些学生是比较厉害的）

: woxxoole

相关推荐

ML Ops：数据质量是关键

ML Ops 是 AI 领域中一个相对较新的概念，可解释为「机器学习操作」。如何更好地管理数据科学家和操作人员，以便有效地开发、部署和监视模型?其中数据质量至关重要。本文将介绍 ML Ops，并强调数据质量在 ML Ops 工作流中的关键作用。ML Op

bingdata 0喜欢 / 10评论 2020-10-15

建神经网络模型，哪种优化算法更好？35000次测试告诉你

想要优化自己的神经网络，却不知道哪种优化器更适合自己？又或者，想知道深度学习中梯度下降的算法到底都有哪些？现在，最全面的优化算法分析来了。它整理了自1964年以来，几乎所有的优化方法，将它们进行了分类。此外，它还给出了几种基准测试方法，并用它分析了1344

WhiteHacker 0喜欢 / 0评论 2020-10-14

一行代码不用写，就可以训练、测试、使用模型，这个star量1.5k的项目帮你做到

一行代码不用写，就可以训练、测试和使用模型，还有这样的好事?最近，软件工程师 Nidhal Baccouri 就在 GitHub 上开源了一个这样的机器学习工具——igel，并登上了 GitHub 热榜。目前，该项目 star 量已有 1.5k。该项目旨在

chenyuping 0喜欢 / 11评论 2020-10-06

测试模型V模型和W模型

　　W模型上表明开发和测试团队在一定程度上来说是并行工作的，但是测试是依赖开发团队做出的内容，所有有一定的滞后性。

加油奋斗吧 0喜欢 / 0评论 2020-06-13

Alink漫谈(七) : 如何划分训练数据集和测试数据集

Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台，是业界首个同时支持批式算法、流式算法的机器学习平台。本文将为大家展现Alink如何划分训练数据集和测试数据集。一般做预测分析时，会将数据分为两大部分。一部分是训练数据，用于构

老道长的测试生活 0喜欢 / 0评论 2020-06-12

软件测试基础

　　在软件测试方面，V模型是最广为人知的模型，尽管很多富有实际经验的测试人员还是不太熟悉V模型，或者其它的模型。V模型已存在了很长时间，和瀑布开发模型有着一些共同的特性，由此也和瀑布模型一样地受到了批评和质疑。V模型中的过程从左到右，描述了基本的开发过程

goodby 0喜欢 / 0评论 2020-06-11

测试基础与模型

软件是计算机系统中的程序和相关文件或文档的总称。– V模型一大缺点正是它自身的顺序性所导致的。

Testingba工作室 0喜欢 / 0评论 2020-06-09

测试模型

　　在软件测试方面，V模型是最广为人知的模型，尽管很多富有实际经验的测试人员还是不太熟悉V模型，或者其它的模型。V模型已存在了很长时间，和瀑布开发模型有着一些共同的特性，由此也和瀑布模型一样地受到了批评和质疑。V模型中的过程从左到右，描述了基本的开发过程

Henryztong 0喜欢 / 0评论 2020-06-09

字符识别--模型的训练与验证

在机器学习模型的训练过程中，模型是非常容易过拟合的。深度学习模型在不断的训练过程中训练误差会逐渐降低，但测试误差的走势则不一定。在模型的训练过程中，模型只能利用训练数据来进行训练，但不能接触测试集上的数据。因此当模型在训练集上得到非常不错的下效果，但在测试

ITstudied 0喜欢 / 0评论 2020-05-30

测试模型

软件测试工程师称为“QA”，质量保证者——这是入门的第一点要学习的。

RocketJ 0喜欢 / 0评论 2020-04-14

第 5 章自动化测试模型 - Selenium3 自动化测试

在介绍自动化测试模型之前，我们先来了解库、框架和工具之间的区别。因为它的主要任务就是帮助我们完成测试工作，所以通常称它为测试框架。

RocketJ 0喜欢 / 0评论 2020-03-07

突破迁移学习局限！谷歌提出“T5”新NLP模型，多基准测试达SOTA

过去几年间，迁移学习给 NLP 领域带来了丰硕的成果，掀起了新一波的发展浪潮。迁移学习在2018年出现的GPT、ULMFiT、ELMo以及 BERT等成果上初露锋芒，之后又在2019年大显身手，推动了领域内多种新方法的发展，其中就包括XLNet、RoBER

yyhhlancelot 0喜欢 / 0评论 2020-02-25

机器学习（ML）七之模型选择、欠拟合和过拟合

需要区分训练误差和泛化误差。前者指模型在训练数据集上表现出的误差，后者指模型在任意一个测试数据样本上表现出的误差的期望，并常常通过测试数据集上的误差来近似。计算训练误差和泛化误差可以使用之前介绍过的损失函数，例如线性回归用到的平方损失函数和softmax回

CYJ0go 0喜欢 / 0评论 2020-02-15

软件生存周期模型之V模型

RAD模型是软件开发过程中的一个重要模型，通过开发和测试同时进行的方式来缩短开发周期，提高开发效率。其形状像一个字母V，故称为V模型。又称软件测试的V模型。V模型是一个著名的、以测试为驱动的开发模型，该模型强调开发过程中测试贯穿始终，是瀑布模型的一个变体。

Henryztong 0喜欢 / 0评论 2020-02-02

开发模型、测试模型

特点：迭代开发：将产品的开发分解为若干个小sprint（迭代），周期1-4周不等。参与团队成员5-9人。基本流程：1）产品负责人整理user story。2）发布计划会议。6）回顾会议敏捷中的测试：挑战1：轻文档。

chichichi0 0喜欢 / 0评论 2020-01-12

现代化前端测试

　　金字塔模型自下而上分为单元测试、集成测试、UI 测试, 之所以是金字塔结构是因为单元测试的成本最低, 与之相对, UI 测试的成本最高。所以单元测试写的数量最多, UI 测试写的数量最少。

jszy 0喜欢 / 0评论 2020-01-09

程序员的修炼之道（六）

要将应用的各种技术选择实现为配置选项，而不是通过集成或工程方法实现。Yii框架的组件便是这一思想的最佳实践。要根据模型和视图设计你的应用，从而以低廉的代码获取灵活性。最近的nodejs好火，前后端分离是必然趋势，纯粹的模型测试起来也是非常方便。这已经是最后

abdstime 0喜欢 / 0评论 2020-01-01

验证集和测试集的区别

训练集用于模型参数，测试集用于估计模型对样本的泛化误差，验证集用于“训练”模型的超参数。这些超参数不能由模型本身训练得到，是因为模型会倾向把参数训练的过大或者过小，从而极容易导致过拟合。一个很自然的想法是我们可以选择不同的超参数值，然后跑在同一个训练集上再

abdstime 0喜欢 / 0评论 2019-12-23

吴裕雄--天生自然 pythonTensorFlow自然语言处理：Attention模型--测试

# 读取checkpoint的路径。9000表示是训练程序在第9000步保存的checkpoint。必须与训练时的模型参数保持一致。HIDDEN_SIZE = 1024 # LSTM的隐藏层规模。DECOD

Henryztong 0喜欢 / 0评论 2019-12-19

软件测试理论基础总结(七) --21个故障模型

　　　　　　--防止不正确的输入进入被测软件。过滤掉不正确的输入，只允许合法输入通过界面；　　　　　　--允许不正确的输入进入系统并进行处理，软件失效时调用异常处理程序，显示一些错误信息；　　　　　　--输入类型：键入无效的类型常会产生错误信息；

xiaoyezihanghui 0喜欢 / 0评论 2019-12-19

理论知识复习要点

软件测试是利用测试工具按照测试方案和测试流程对软件产品进行功能和性能测试。配置测试环境，编写测试计划，设计测试用例，执行软件测试，提交软件缺陷，编写缺陷报告，验证修正缺陷，编写测试报告

mohanzb 0喜欢 / 0评论 2019-12-05

【NCTS峰会回顾】融360艾辉：AI模型测试探秘

2019年10月26日，由Testin主办的第二届NCTS中国云测试行业峰会在京召开，此次峰会以“AI+未来”为主题，汇聚来自国内外测试领域的知名专家学者、领先企业决策者、高层技术管理者、媒体从业者等，共同探讨高端云测试技术，帮助测试从业者了解最前沿行业趋

huangjie0 0喜欢 / 0评论 2019-11-26

动手深度学习12- 模型选择，欠拟合和过拟合

前几节给予Fashion_MNIST数据集的实验中，我们评价了机器学习模型在训练集合测试集上的表现。通常得到的结果都是训练数据集上更准确时，它在测试集上表现不一定更好，这就涉及到了模型的选择以及拟合程度的选择。这部分数据被称为验证数据集。为了解释模型复杂度

dxmkkk 0喜欢 / 0评论 2019-11-08

自动化测试最佳实践（一）：从纺锤模型到金字塔模型

开篇我们先简要介绍一些近几年在企业开发中出现的重要概念，以便引入持续测试的主旨。这些概念中最重要的两个便是DevOps和微服务。两者都是目前软件开发中的最佳实践和方法论，旨在为企业提供更高的灵活性，提升运营效率。随着DevOps和敏捷热度的不断提升，无论是

冰晶云梦 0喜欢 / 0评论 2019-11-08

React 现代化测试

测试用例的书写是一个风险驱动的行为, 每当收到 Bug 报告时, 先写一个单元测试来暴露这个 Bug, 在日后的代码提交中, 若该测试用例是通过的, 开发者就能更为自信地确保程序不会再次出现此 bug。金字塔模型自下而上分为单元测试、集成测试、UI 测试,

冰晶云梦 0喜欢 / 0评论 2019-11-04

测试基础知识

W模型：补充了V模型中忽略的内容，强调了测试计划等工作的先行和对系统需求和系统设计的测试；与V模型相同，没有对软件测试的流程进行说明；H模型：强调测试是独立的，只要测试准备完成，就可以执行测试。

mohanzb 0喜欢 / 0评论 2019-10-29

谷歌发布端到端AI平台让开发者构建自己的模型

谷歌发布了一系列人工智能工具，所有这些新工具和服务的核心是公司计划通过预先构建的模型和便捷服务实现分布式的人工智能和机器学习，同时为更高级的开发者提供服务，使其能够构建自己的定制模型。谷歌的重点是发布该公司的测试版人工智能平台。其想法是为开发者和数据科学家

guohailiang 0喜欢 / 0评论 2019-04-11

软件测试模型汇总

内容并非本人原创，只是为了方便学习和记忆。V模型中的过程从左到右，描述了基本的开发过程和测试行为。V模型的价值在于它非常明确地标明了测试过程中存在的不同级别，并且清楚地描述了这些测试阶段和开发过程期间各阶段的对应关系。　　X模型也是对V模型的改进,X模型提

Dipa 0喜欢 / 0评论 2013-05-29

UML用户需求建模

例如，在“订餐”用例的详细说明中，您可能会编写;降低响应需求更改所需的工作量。使用模型作为系统测试的基础，并在测试和需求之间建立一种明确的关系。在需求发生更改时，这种关系有助于您准确地更新测试。这样可确保系统满足新的需求。

naivor 0喜欢 / 0评论 2010-06-11

净室软件认证

的统计方法首先由 Harlan Mills和他 IBM. Musa所用的术语虽有细微的差别，但它们都是运用成熟的工程准则对产品进行测试和验证的科学方法。在工业界，典型地采用一组产品抽检协议。最终，通过一定标准。的产品才被认为是合格产品。量度量，并判断测试的

sharpljc 0喜欢 / 0评论 2010-05-16

蹒跚前进中的项目-Vol 1.开发模型及项目管理

断断续续工作块有二十四个月，可以说刚入门了。经历了三四个完整的项目流程：做过开发，做过调研，做过测试管理，做过咨询，做过维护。工作很杂所以看到的东西也不少。工作实践中，不乏很多问题，引发很多思考。希望在将来的某一天可以回过头来，重新总结和点评这些事儿。与客

phpboy 0喜欢 / 0评论 2010-04-11

在项目开发过程中使用wiki作为知识共享的讨论

有多少兄弟姐妹在项目中使用wiki作为知识共享库的？甚至一些资源都可以上传到wiki上贡献下载，而且支持强大的搜索功能。通过wiki可以保留大家曾经的想法，设计，理念；即使是大家换了项目组，这些东西依然保留了下来，是一个知识共享的很好的方式。

zxuanzi 0喜欢 / 0评论 2007-04-10

架构师能力模型，架构师应该掌握那些东西？

←←←←←←←←←←←← 快！架构师在很多人眼中是一个非常高大上的职业, 就像武侠小说中的绝世高手一样, 关键时刻可以起到扭转乾坤的作用, 是团队中的灵魂人物. 回想我自己做一线架构师的过程中, 也没有经历过比较系统的培训, 都是摸着石头过河. 近期在培养

JAVA飘香 0喜欢 / 0评论 2019-07-01

机器学习基础：(Python)训练集测试集分割与交叉验证

在上一篇关于Python中的线性回归的文章之后，我想再写一篇关于训练测试分割和交叉验证的文章。在数据科学和数据分析领域中，这两个概念经常被用作防止或最小化过度拟合的工具。我会解释当使用统计模型时，通常将模型拟合在训练集上，以便对未被训练的数据进行预测。这种

lovetheme 0喜欢 / 0评论 2019-06-29

软件测试的流程

还有一个开发流属于连接规范流和测试流两个中间的桥梁。规范流规范流分为用户需求，需求分析与需求设计，概要设计，详细设计。测试流测试流属于单元测试，集成测试，安装软件，运营软件，绩效等内容。W模型W模型是对V模型的发展和总结强调规范流和测试流同步进行。

冰晶云梦 0喜欢 / 0评论 2019-06-28

如何交付机器学习项目：一份机器学习工程开发流程指南

随着机器学习成为每个行业的重要组成部分，对机器学习工程师的需求急剧增长。MLE需要将机器学习技能与软件工程专业知识相结合，为特定应用程序找到高性能的模型，并应对出现的实施挑战——从构建训练基础架构到准备部署模型。

五小郎的学习笔记 0喜欢 / 0评论 2019-06-28

机器学习在启动耗时测试中的应用及模型调优（一）

WeTest 导读启动耗时自动化方案在关键帧识别时，常规的图像对比准确率很低。本文详细介绍了采用scikit-learn图片分类算法在启动耗时应用下的模型调优过程。在之后的续篇中将采用TensorFlow CNN、迁移学习等算法，给出对比识别效果。由于视频

五小郎的学习笔记 0喜欢 / 0评论 2019-06-27

Hibernate第06课：多对一表关联映射

述User类和Group类,User类中的多个实例是属于Group中的某个实例.这个模型就表现多对一.这种关联我们称为many2one.因为是多个用户属于一个组,那肯定这个用户知道自己是哪个组的,所以,这个用户就应该持有这个组.先建立Group这个对象.因

旺旺CTO 0喜欢 / 0评论 2009-04-02

你的猫是什么猫？一起用TensorFlow机器学习测试猫品种！

本文将介绍如何使用迁移学习使用TensorFlow机器学习平台对图像进行分类。在机器学习环境中，迁移学习是一种技术，使我们能够重用已经训练的模型并将其用于另一个任务。CNN由多个层组成，这些层中的每一个都负责学习和识别特定特征。最终图层确定图像类别。机器学

ximingri 0喜欢 / 0评论 2019-05-16

机器学习weka，java api调用随机森林及保存模型

工作需要，了解了一下weka的java api，主要是随机森林这一块，刚开始学习，记录下。Instances instancesTrain = atf.getDataSet(); // 读入训练文件。Instances instancesTest = at

蓝白云 0喜欢 / 0评论 2018-11-16

10亿级数据规模半监督图像分类模型，Imagenet测试精度高达81.2％

译者 | linstancy作者| I. Zeki Yanlniz, Herve Jegou, Kan Chen, Manohar Paluri, Dhruv Mahajan编辑 | 蓝色琥珀鱼，Rachel出品 | AI科技大本营本文提出了一种十亿级数据

bingdata 0喜欢 / 0评论 2019-05-08

你还在过度测试吗？一个模型和两张checklist教你用测试策略做刚刚好的测试！

是测试用例设计？作者认为测试的核心是“测试策略”。本案例将阐述如何在“当前状态下，找到最适合产品的测试技术”，用测试策略进行刚刚好的测试。本案例包含一套方法，一个模型和两张checklist。再具体一点来说，“测试策略”就是要在产品测试中答好下面六大问题：

today0 0喜欢 / 0评论 2017-06-15

训练集、验证集、测试集以及交验验证的理解

在人工智能机器学习中，很容易将“验证集”与“测试集”，“交叉验证”混淆。在普通的机器学习中常用的交叉验证就是把训练数据集本身再细分成不同的验证数据集去训练模型。测试集 —— 用来评估模最终模型的泛化能力。但不能作为调参、选择特征等算法相关的选择的依据。

旺旺CTO 0喜欢 / 0评论 2018-08-12

ImageNet分类器可以泛化到ImageNet上吗？

当前的分类模型泛化到新数据时总会有不同程度的准确率下降，传统观点认为这种下降与模型的适应性相关。但本文通过实验证明，准确率下降的原因是模型无法泛化到比原始测试集中更难分类的图像上。机器学习的首要目标是生成泛化模型。我们常通过测量模型在测试集上的性能来量化模

MaggieMiaoMiao 0喜欢 / 0评论 2019-02-23

机器学习基础：(Python)训练集测试集分割与交叉验证

在上一篇关于Python中的线性回归的文章之后，我想再写一篇关于训练测试分割和交叉验证的文章。在数据科学和数据分析领域中，这两个概念经常被用作防止或最小化过度拟合的工具。我会解释当使用统计模型时，通常将模型拟合在训练集上，以便对未被训练的数据进行预测。当做

卖小孩的咖啡 0喜欢 / 0评论 2018-11-23

AI在闲鱼测试实践：如何应用AI技术通过图片找bug

3.模型重训练——提高模型识别准确率初始模型在训练时样本有限，但随着app不停更新迭代，图片检测样本数量的逐渐增多，会出现某些新页面被错误分类，要解决这类误报问题，亟需加入模型重训练。

allians 0喜欢 / 0评论 2018-11-01

常用测试集带来过拟合？你真的能控制自己不根据测试集调参吗

在验证集上调优模型已经是机器学习社区通用的做法，虽然理论上验证集调优后不论测试集有什么样的效果都不能再调整模型，但实际上模型的超参配置或多或少都会受到测试集性能的影响。因此研究社区可能设计出只在特定测试集上性能良好，但无法泛化至新数据的模型。本论文通过创建

自动化测试 0喜欢 / 0评论 2018-06-06

如何交付机器学习项目：一份机器学习工程开发流程指南

随着机器学习成为每个行业的重要组成部分，对机器学习工程师的需求急剧增长。MLE需要将机器学习技能与软件工程专业知识相结合，为特定应用程序找到高性能的模型，并应对出现的实施挑战——从构建训练基础架构到准备部署模型。MLE同样可以遵循类似的框架来应对不确定性并

YBsisterchang 0喜欢 / 0评论 2018-10-06

回归块：模块化的方法，用最少的编码来测试和调整多个回归算法

介绍在我们进行项目时，最好是测试不同的模型，以确定最佳机器学习模型，该机器学习模型可根据手头的问题在准确性、复杂性和执行效率之间取得良好的平衡。一些软件，如RapidMiner，提供了这种功能。然而，为此目的使用软件产品会导致在调优模型和探索一些复杂性方面

ipioneer 0喜欢 / 0评论 2019-01-27