[深度学习] Pytorch（三）—— 多/单GPU、CPU，训练保存、加载模型参数问题

dxmkkk 2019-10-20

[深度学习] Pytorch（三）—— 多/单GPU、CPU，训练保存、加载预测模型问题

上一篇实践学习中，遇到了在多/单个GPU、GPU与CPU的不同环境下训练保存、加载使用使用模型的问题，如果保存、加载的上述三类环境不同，加载时会出错。就去研究了一下，做了实验，得出以下结论：

多/单GPU训练保存模型参数、CPU加载使用模型

#保存
PATH = 'cifar_net.pth'
torch.save(net.module.state_dict(), PATH)

#加载
net = Net()
net.load_state_dict(torch.load(PATH))

多GPU训练模型、单GPU加载使用模型

#保存
PATH = 'cifar_net.pth'
torch.save(net.state_dict(), PATH)

#加载
net = Net()
net = nn.DataParallel(net)  #保存多GPU的，在加载时需要把网络也转成DataParallel的
net.to(device)  #放到GPU上
net.load_state_dict(torch.load(PATH))

# 然后测试数据也需要放到GPU上
images, labels = images.to(device), labels.to(device)

多GPU训练保存模型参数、多GPU加载使用模型

#保存
PATH = 'cifar_net.pth'
torch.save(net.state_dict(), PATH)

#加载
net = Net()
net = nn.DataParallel(net)  #保存多GPU的，在加载时需要把网络也转成DataParallel的
net.to(device)  #放到GPU上
net.load_state_dict(torch.load(PATH))

# 然后测试数据也需要放到GPU上
images, labels = images.to(device), labels.to(device)

可以看到，单GPU和多GPU加载数据的方法其实是一样的，经运行验证，只要按上述代码写，有多个GPU就调用多个，只有一个就调用一个。

另外，保存、加载网络模型还有三种不同的做法

1.保存整个网络模型
2.只保存模型参数（我们用的就是这种）
3.自定义保存

详细方法，请参考：https://blog.csdn.net/Code_Mart/article/details/88254444

: dxmkkk

相关推荐

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 0喜欢 / 15评论 2020-11-09

自动驾驶汽车深度学习如何应对挑战?

在自动驾驶汽车中使用深度学习可以帮助克服各种挑战，例如了解行人的行为，找到最短的路线以及对人和物体进行准确检测。根据一份报告，2018年约有80%的道路交通事故是由于人为错误造成的。因此，将自动驾驶汽车纳入主流的主要目标之一是消除对人类驾驶员的需求并减少道

86377811 0喜欢 / 0评论 2020-11-06

不要上手就学深度学习！超详细的人工智能专家路线图，GitHub数天获2.1k星

反过头来看，这些方法可能作用并不是很大，却消耗了大量的时间和金钱。如果你想成为数据科学家、机器学习或者 AI 专家，而又苦于找不到合适的学习方法，本文将提供一组思路清晰、简单易懂的人工智能专家路线图。这是一家德国软件公司 AMAI GmbH 近期发布的 G

Niteowl 0喜欢 / 0评论 2020-11-05

DJL 如何正确打开 [ 深度学习 ]

本文转载自微信公众号「小明菜市场」，作者小明菜市场。很长时间，Java都是一个相当受欢迎的企业编程语言，其框架丰富，生态完善。为了减少Java开发者学习深度学习的成本，AWS构建了一个Deep Java Library，一个为Java开发者定制的开源深度

ohbxiaoxin 0喜欢 / 0评论 2020-11-04

揭开AI、机器学习和深度学习的神秘面纱

深度学习、机器学习、人工智能——这些流行词皆代表了分析学的未来。在这篇文章中，我们将通过一些真实世界的案例来解释什么是机器学习和深度学习。这样做的目的不是要把你变成一个数据科学家，而是让你更好地理解你可以用机器学习做什么。开发人员能越来越容易地使用机器学习

bigquant 0喜欢 / 11评论 2020-11-03

用 Java 训练深度学习模型，原来可以这么简单！

HelloGitHub 推出的《讲解开源项目》系列。这一期是由亚马逊工程师：Keerthan Vasist，为我们讲解 DJL系列的第 4 篇。很长时间以来，Java 都是一个很受企业欢迎的编程语言。得益于丰富的生态以及完善维护的包和框架，Java 拥有着

PandaJiong 0喜欢 / 13评论 2020-11-02

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 0喜欢 / 14评论 2020-11-02

如何在PyTorch和TensorFlow中训练图像分类模型

图像分类是计算机视觉的最重要应用之一。它的应用范围包括从自动驾驶汽车中的物体分类到医疗行业中的血细胞识别，从制造业中的缺陷物品识别到建立可以对戴口罩与否的人进行分类的系统。他们是如何做到的呢？你必须已阅读很多有关不同深度学习框架之间差异的信息。Tensor

xjtukuixing 0喜欢 / 11评论 2020-10-27

详解深度学习感知机原理

我们之前的机器学习专题已经结束了，我们把机器学习领域当中常用的算法、模型以及它们的原理以及实现都过了一遍。虽然还有一些技术，比如马尔科夫、隐马尔科夫、条件随机场等等没有涉及到。但是这些内容相比来说要弱一些，使用频率并不是非常高，我们就不一一叙述了，感兴趣的

深度学习大讲堂 0喜欢 / 0评论 2020-10-14

用Windows电脑训练深度学习模型？超详细配置教程来了

虽然大多数深度学习模型都是在 Linux 系统上训练的，但 Windows 也是一个非常重要的系统，也可能是很多机器学习初学者更为熟悉的系统。Kaggle Master 及机器学习实践者 Abhinand 立足于自己的实践，给出了一种简单易行的 Windo

Trent 0喜欢 / 10评论 2020-10-13

深度学习未来发展的三种学习范式：混合学习，成分学习和简化学习

本文转自雷锋网，如需转载请至雷锋网官网申请授权。深度学习是一个很大的领域，其核心是一个神经网络的算法，神经网络的尺寸由数百万甚至数十亿个不断改变的参数决定。似乎每隔几天就有大量的新方法提出。然而，一般来说，现在的深度学习算法可以分为三个基础的学习范式。每一

qijiqiguai 0喜欢 / 10评论 2020-10-09

深度学习之后会是啥？

我们被困住了，或者说至少我们已经停滞不前了。有谁还记得上一次一年没有在算法、芯片或数据处理方面取得重大显著进展是什么时候?几周前去参加Strata San Jose会议，却没有看到任何吸引眼球的新进展，这太不寻常了。我不是唯一一个注意到这些的人。例如，这

mpkno 0喜欢 / 0评论 2020-09-26

深入了解目标检测深度学习算法的技术细节

本文转载自公众号“读芯术”。本文将讨论目标检测的基本方法，并尝试理解每个模型的技术细节。为了让经验水平各不相同的读者都能够理解，文章不会使用任何公式来进行讲解。目标检测(或识别)基于图像分类。IoU是一个度量，用预测的框和真值框的重叠面积除以它们的并集面积

ustbfym 0喜欢 / 0评论 2020-09-21

理解卷积神经网络中的自注意力机制

计算机视觉中的编解码结构的局限性以及提升方法。卷积神经网络广泛应用于深度学习和计算机视觉算法中。虽然很多基于CNN的算法符合行业标准，可以嵌入到商业产品中，但是标准的CNN算法仍然有局限性，在很多方面还可以改进。由于其简单和准确，该体系结构被广泛使用。顾名

sunxinyu 0喜欢 / 0评论 2020-09-17

分析深度学习背后的数学思想

深度神经网络本质上是通过具有多个连接的感知器而形成的，其中感知器是单个神经元。可以将人工神经网络视为一个系统，其中包含沿加权路径馈入的一组输入。然后处理这些输入，并产生输出以执行某些任务。随着时间的流逝，ANN“学习”了，并且开发了不同的路径。各种路径可能

walkpower 0喜欢 / 0评论 2020-09-16

Keras创始人：过去6个月，深度学习岗位已崩溃

深度学习岗位在这6个月以来已经崩溃。对于那些投资深度学习的小企业来说，目前的情形已经很清楚了：深度学习岗位不是必须的，随着疫情的到来，它们将可能被裁撤。需要澄清一下，我个人认为这只是一个疫情期间经济衰退的现象，而不是又一个AI寒冬。知情网友在针对这场话题的

davidsmith 0喜欢 / 0评论 2020-09-04

TensorFlow Lattice：灵活、可控、可解释的机器学习

本文转自雷锋网，如需转载请至雷锋网官网申请授权。大多数的机器学习实践者都曾遇到过训练数据和实际运行时用以评估模型的样本差别很大的情况。因此，相对灵活的机器学习解决方案，如DNN和随机森林等，仅依赖于训练数据的模型，在训练数据集和验证数据集没有覆盖的输入空间

Icevivian 0喜欢 / 0评论 2020-08-25

在30分钟内创建你的深度学习服务器

每当我开始一个新的项目时，我发现自己一次又一次地创建一个深度学习机器。从安装Anaconda开始，最后为Pytorch和Tensorflow创建不同的环境，这样它们就不会相互干扰。而在这中间，你不可避免地会搞砸，从头开始。这种情况经常发生多次。这不仅是对时

QFYJTL 0喜欢 / 0评论 2020-08-23

浅谈人工神经网络与BP算法

如今，深度学习技术，也叫机器学习技术日益火热，运用深度学习技术的领域也愈来愈广泛，这些领域包括图像识别、语音识别、自然语言处理以及游戏、机器人之类的。由于本人是电子信息专业，在大学期间接触了一过一些机器学习的知识，并且在毕业后顺利进入一家世界500强的互联

ohbxiaoxin 0喜欢 / 0评论 2020-08-20

TensorFlow 2入门指南，初学者必备！

TensorFlow是谷歌推出的深度学习框架，于2019年发布了第二版。它是世界上最著名的深度学习框架之一，被行业专家和研究人员广泛使用。Tensorflow v1难以使用和理解，因为它的Pythonic较少，但是随着Keras发行的v2现在与Tenso

comwayLi 0喜欢 / 0评论 2020-08-16

Facebook AI 用深度学习实现编程语言转换，代码库迁移不再困难！

从旧式编程语言到现代语言的代码库迁移是一项艰巨的任务，需要源语言和目标语言方面的专业知识。Facebook AI开发了Transcoder，可以使代码迁移变得更加轻松和高效。在Facebook AI的评估中，该模型正确地将90％以上的Java函数转换为C

Chenpengbogood 0喜欢 / 0评论 2020-07-24

人工智能迁移学习如何工作在AI模型和培训过程起到那些作用

如今，人工智能程序可以识别照片和视频中的面部和物体，实时转录音频，提前数年通过X射线扫描检测癌症，并在某些最复杂的游戏中与人类竞争。幸运的是，转移学习是一种使用从一种训练有素的AI模型获得的知识到另一种知识的学科，可以帮助解决这些问题。例如，基本模型可能无

AI启蒙研究院 0喜欢 / 0评论 2020-07-23

人工智能迁移学习如何工作在AI模型和培训过程起到那些作用

如今，人工智能程序可以识别照片和视频中的面部和物体，实时转录音频，提前数年通过X射线扫描检测癌症，并在某些最复杂的游戏中与人类竞争。幸运的是，转移学习是一种使用从一种训练有素的AI模型获得的知识到另一种知识的学科，可以帮助解决这些问题。例如，基本模型可能无

gscienty 0喜欢 / 0评论 2020-07-22

MIT警告深度学习正在逼近计算极限，网友：放缓不失为一件好事

MIT 的一项研究认为，深度学习正在逼近算力极限。深度学习需要大量数据和算力，这二者的发展是促进这一次人工智能浪潮的重要因素。这项研究由 MIT、MIT-IBM Watson AI 实验室、延世大学安德伍德国际学院和巴西利亚大学的研究人员开展，他们发现深度

lizhengjava 0喜欢 / 0评论 2020-07-21

卷积神经网络中的参数共享/权重复制

参数共享或权重复制是深度学习中经常被忽略的领域。但是了解这个简单的概念有助于更广泛地理解卷积神经网络的内部。卷积神经网络能够使那些通过网络馈送的图像在进行仿射变换时具有不变性。这个特点提供了识别偏移图案、识别倾斜或轻微扭曲的图像的能力。仿射不变性的这些特征

fengzhimohan 0喜欢 / 0评论 2020-07-23

宝德深度学习产品助华人运通自动驾驶

华人运通技术有限公司是一家从事新能源汽车、智能网联及共享交通系统技术研发及生产的高科技创新公司，拥有汽车全产业链包括新能源、自动驾驶和车联网等前沿领域多年深厚经验，致力于创领新能源汽车及智能交通领域核心部件和关键系统的技术突破，推动人类未来智能交通出行方式

zjjoy0 0喜欢 / 0评论 2020-07-17

运行在浏览器中的深度学习框架，开源了

百度近期开源了国内首个以JavaScript实现的Web端推理引擎 Paddle.js。Paddle.js用于帮助前端工程师更加简单地将智能化因素引入网页中，让Web前端可以实现更多的能力。通过浏览器来访问网页应用浏览内容具有更低的门槛和更广泛的传播度，能

grandPang 0喜欢 / 0评论 2020-07-03

深度学习框架大PK：TNN决战MNN，ncnn依旧经典

近年来，开发者社区中，「开源」成了新流行趋势。尤其是深度学习框架，自腾讯2017年将ncnn开源之后，各大AI实验室都「慷慨」的将自己的框架开源，以实现较为快速的创新。今年6月10日，腾讯又宣布基于ncnn设计的深度学习推理框架TNN也将开源。TNN设计之

EastCarFxxBlog 0喜欢 / 0评论 2020-07-03

深度学习先驱Yann LeCun被骂退推特：你们都很懂，从此我不说话了

在长达两周的「骂战」之后，图灵奖得主、Facebook 首席 AI 科学家 Yann Lecun 宣布，自己将退出推特。「我请求社交网络上的所有人不要再互相攻击了，特别是对于 Timnit Gebru 的攻击，以及对于我之前一些言论的攻击。」Yann Le

lizhengjava 0喜欢 / 0评论 2020-06-29

使用PARL与Gym仿真环境进行深度Q学习（DQL）

强化学习是一种允许你创造能从环境中交互学习的AI agent 的机器学习算法。如上图所示，大脑代表AI agent并在环境中活动。反馈包括回报和环境的下个状态。如果类比人类学习自行车，我们会将车从起始点到当前位置的距离定义为回报。2013年，在DeepMi

dxmkkk 0喜欢 / 0评论 2020-06-26

深度学习模型并非“越大越好”，它可能引起气候变化问题

本月早些时候，OpenAI宣布已经建成史上最大的人工智能模型，该模型规模惊人，被命名为“GPT-3”，是一项令人印象深刻的技术成就。然而，它却凸显了人工智能领域的一个隐患。现代人工智能模型需要消耗大量能量，并且这些能量需求正以惊人的速度增长。而“GPT-3

yoohsummer 0喜欢 / 0评论 2020-06-23

深度学习的发展，与由此引发的气候变化问题

人脑是一种效率极高的智能来源，但目前的AI还达不到这样的水平。本月早些时候，OpenAI宣布已经构建起有史以来规模最大的AI模型。这套惊人的模型名为GPT-3，已经成为令人印象深刻的伟大技术成就。现代AI模型需要消耗大量电力，而且对电力的需求正以惊人的速度

mpkno 0喜欢 / 0评论 2020-06-23

深度学习技术邂逅人群计数

如今，人工智能研究日益火热，机器学习技术也得到了迅速发展。随着国家城镇化的不断推进，城市人群密集场景越来越多，继而带来的恐怖事件、踩踏事件也日益增多。但是，由于在监控时，计数收到场景内和场景间变化视角的干扰、图像受到闭塞、透视扭曲和缩放等问题，使得人群计数

laagyzz 0喜欢 / 0评论 2020-06-18

优步Ludwig是一种面向低代码机器学习的开源框架！

训练和测试深度学习模型是个困难的过程，需要对机器学习和数据基础架构有深入了解。简化这部分有助于简化深度学习技术的采用。解决该问题的最完整解决方案之一来自优步AI实验室。最近，优步发布了Ludwig的第二版，包括功能上的重要改进，以便为机器学习开发人员提供主

Jony0 0喜欢 / 0评论 2020-06-18

PyTorch深度学习2简单函数使用

接下来介绍pytorch中的神经网络部分。PyTorch中所有的神经网络都来自于autograd包。首先我们来简要的看一下，之后我们将训练我们第一个的神经网络。autograd 包提供Tensor所有操作的自动求导方法。以这些例子来讲，让我们用更简单的术语

啸林 0喜欢 / 0评论 2020-06-12

深度学习-神经网络

机器学习是人工智能的核心，而深度学习又是机器学习的核心。三者关系可用如下图来表示。神经网络仿照人脑的神经元结构之间的联系，当某个神经元的轴突电信号强度达到一定程度时，就会触发将信号传递到下一个神经元。相比于其他神经网络结构，卷积神经网络需要的参数相对较少，

georgesale 0喜欢 / 0评论 2020-06-11

14 深度学习-卷积（改）

例如，此前Google DeepMind的AlphaGo打败了韩国的围棋大师李世乭九段。在媒体描述DeepMind胜利的时候，就曾将人工智能、机器学习和深度学习都提到了。这三者在AlphaGo击败李世乭的过程中都起了作用，但它们说的并不是一回事

jewsNLP 0喜欢 / 0评论 2020-06-07

14卷积

　　机器学习是人工智能的一种途径或子集，它强调“学习”而不是计算机程序。通过机器学习，一个系统可以从自身的错误中学习来提高它的模式识别能力。深度学习使得机器学习能够实现众多的应用，并拓展了人工智能的领域范围。以digit0为例，进行手工演算。

walegahaha 0喜欢 / 0评论 2020-06-07

14 深度学习-卷积

要解释这三者之间的关系和应用，最简单的方法就是画一个同心圆，人工智能是最早出现的，也是最大、最外侧的同心圆；其次是机器学习，稍晚一点；最内侧，是深度学习，也是当今人工智能大爆炸的核心驱动。机器学习最基本的做法，是使用算法来解析数据、从中学习，然后对真实世界

阳光非宅男 0喜欢 / 0评论 2020-06-07

14 深度学习-卷积

人工智能是最早出现的，也是最大、最外侧的同心圆；其次是机器学习，稍晚一点；最内侧，是深度学习，当今人工智能大爆炸的核心驱动。卷积神经网络也是通过一层一层的节点组织起来的。而对于卷积神经网络，相邻两层之间只有部分节点相连，为了展示每一层神经元的维度，一般会将

zhaorui0 0喜欢 / 0评论 2020-06-07

机器学习——14 深度学习-卷积

深度学习是机器学习领域中一个新的研究方向，它被引入机器学习使其更接近于最初的目标——人工智能。而对于卷积神经网络，相邻两层之间只有部分节点相连，为了展示每一层神经元的维度，一般会将每一层卷积层的节点组织成一个三维矩阵。全连接神经网络和卷积神经网络的唯一区别

lanzhichen 0喜欢 / 0评论 2020-06-07

14 深度学习-卷积

　　机器学习是人工智能的一种途径或子集，它强调“学习”而不是计算机程序。通过机器学习，一个系统可以从自身的错误中学习来提高它的模式识别能力。深度学习使得机器学习能够实现众多的应用，并拓展了人工智能的领域范围。以digit0为例，进行手工演算。

kingzone 0喜欢 / 0评论 2020-06-06

14 深度学习-卷积

人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括语音识别、图像识别、机器人、自然语言处理、智能搜索和专家系统等。卷积神经网络也是通过一层一层的节点组织起来的。而对于卷积神经网络

cherry0 0喜欢 / 0评论 2020-06-06

基于深度卷积神经网络的图像风格迁移与神经涂鸦系统的设计与实现

本文中设计并实现了一款基于卷积神经网络的图像风格迁移系统，可以通过神经表示来分离和重组任意图像的内容与风格，为艺术图像的创建提供了新的算法与算法框架；本文中还实现了神经涂鸦系统作为风格迁移功能的补充，神经涂鸦系统通过使用语义注释及手动创建像素标签的方法提高

hnyzyty 0喜欢 / 0评论 2020-06-05

14 深度学习-卷积

他们的关系不是互相独立，而是一环套着一环。以digit0为例，进行手工演算。以下矩阵为卷积核进行卷积操作；显示卷积之后的图像，观察提取到什么特征。

wenxuegeng 0喜欢 / 0评论 2020-06-03

14深度学习-卷积

机器学习：一种实现人工智能的方法；机器学习都可以被精准地定义为：1、任务2、训练过程3、模型表现。　　全连接神经网络与卷积神经网络都是通过一层一层的节点组织起来的，和全连接神经网络一样，卷积神经网络中的每一个节点就是一个神经元；

hnyzyty 0喜欢 / 0评论 2020-06-03

机器学习12卷积神经网络

而对于卷积神经网络，相邻两层之间只有部分节点相连，为了展示每一层神经元的维度，一般会将每一层卷积层的节点组织成一个三维矩阵。因此，全连接神经网络和卷积神经网络的唯一区别就是神经网络相邻两层的连接方式。以digit0为例，进行手工演算。

wenxuegeng 0喜欢 / 0评论 2020-06-03

14 深度学习-卷积

人工智能是最早出现的，也是最大、最外侧的同心圆；其次是机器学习，稍晚一点；最内侧，是深度学习，当今人工智能大爆炸的核心驱动。而对于卷积神经网络，相邻两层之间只有部分节点相连，为了展示每一层神经元的维度，一般会将每一层卷积层的节点组织成一个三维矩阵。

walegahaha 0喜欢 / 0评论 2020-06-03

13.深度学习-卷积

它使得机器学习实现众多应用，拓展了人工智能的领域范畴，给人工智能能以璀璨未来。而对于卷积神经网络，相邻两层之间只有部分节点相连，为了展示每一层神经元的维度，一般会将每一层卷积层的节点组织成一个三维矩阵。类似的，全连接神经网络的损失函数以及参数的优化过

cherry0 0喜欢 / 0评论 2020-06-03

14深度学习-卷积

以digit0为例，进行手工演算。

georgesale 0喜欢 / 0评论 2020-06-02