深度学习入门比赛——街景字符识别（四）

这是比赛的第四阶段，模型的相关训练与验证

选好模型之后，需要建立训练集与验证集进行模型的效果验证，保证模型的预测结果正确符合，以及不过拟合训练与验证主要有以下几种方法：

交叉验证法

交叉验证法的作用就是尝试利用不同的训练集/测试集划分来对模型做多组不同的训练/测试，来应对单词测试结果过于片面以及训练数据不足的问题。交叉验证的做法就是将数据集粗略地分为比较均等不相交的k份，即然后取其中的一份进行测试，另外的k-1份进行训练，然后求得error的平均值作为最终的评价，具体算法流程西瓜书中的插图如下：

深度学习入门比赛——街景字符识别（四）

主要代码：

train_loader = torch.utils.data.DataLoader(
    train_dataset,
    batch_size=10, 
    shuffle=True, 
    num_workers=10, 
)
    
val_loader = torch.utils.data.DataLoader(
    val_dataset,
    batch_size=10, 
    shuffle=False, 
    num_workers=10, 
)

model = SVHN_Model1()
criterion = nn.CrossEntropyLoss (size_average=False)
optimizer = torch.optim.Adam(model.parameters(), 0.001)
best_loss = 1000.0
for epoch in range(20):
    print(‘Epoch: ‘, epoch)

    train(train_loader, model, criterion, optimizer, epoch)
    val_loss = validate(val_loader, model, criterion)
    
    # 记录下验证集精度
    if val_loss < best_loss:
        best_loss = val_loss
        torch.save(model.state_dict(), ‘./model.pt‘)

参考资料：
https://zhuanlan.zhihu.com/p/35394638

深度学习入门比赛——街景字符识别（四）

交叉验证法

playoffs

相关推荐

数据科学面试中应了解的十种机器学习概念

深度度量学习的这十三年，难道是错付了吗？

MachineLearning入门-11（算法评估）

论人工智能之二

千锋扣丁学堂Python培训之实现K折交叉验证方法步骤

Kaggle冠军经验分享丨如何用15个月冲到排行榜的首位

机器学习基础：(Python)训练集测试集分割与交叉验证

三招提升数据不平衡模型的性能（附python代码）

机器学习系列15：学习曲线

训练集、验证集、测试集以及交验验证的理解

机器学习基础：(Python)训练集测试集分割与交叉验证

资源 | 神经网络告诉我，谁是世界上最「美」的人？

机器学习模型评估指标示例

机器学习模型评估和超参数调优实践

七招教你处理非平衡数据——避免得到一个“假”模型

教你如何在机器学习竞赛中更胜一筹（上）

您应该在数据科学项目中使用交叉验证的5个理由

机器学习中交叉验证的两点介绍

通过交叉验证构建可靠的机器学习模型

在Python中训练/测试分割和交叉验证

调整机器学习模型

如何处理基于KNN算法的交叉验证，基于朴素贝叶斯算法计算AUC ?

处理非平衡数据的七个技巧

Python sklearn KFold 生成交叉验证数据集的方法

如何解决机器学习中的数据不平衡问题？

机器学习基本概念笔记

几种交叉验证（cross validation）方式的比较

《Python机器学习》笔记（六）

交叉验证

sklearn交叉验证3-【老鱼学sklearn】

sklearn交叉验证-【老鱼学sklearn】

机器学习：以分析红酒口感为例说明交叉验证的套索模型