起因

最近在修改上一个同事加载和预处理数据的代码，原版的代码使用tf1.4.1写的，数据加载也是完全就是for循环读取+预处理，每读入并预处理好一个batch就返回丢给模型训练，如此往复，我觉得速度实在太慢了，而且我新写的代码都是基于pytorch，虽然预处理的过程很复杂，我还是下决心自己改写。

用pytorch加载预处理数据，最常用的就是torch.utils.data.Dataset和torch.utils.data.DataLoader组合起来，把数据预处理都在Dataset里写好，再在DataLoader里设定batch_size, shuffle等参数去加载数据，网上的教程非常多，这里我就不展开讲了。

过程

现在我已经获得了train_loader和test_loader，可以从它们里面每次读取一个batch出来训练，可照理说加载Dataset时占用了大量内存是正常的，因为数据都预加载好了，就只需要用DataLoader读取就行了，但在训练的过程中，内存不应该随着训练而逐渐增加。我眼睁睁看着内存占用从8、9个g，逐渐涨到了25个g，程序最终因为占满内存而崩溃。检查了半天自己的代码都没找出问题所在，后来用memory_profiler查看内存占用情况，发现问题主要出现在这一行代码：actual_labels += list(correctness)，correctness的类型是torch.FloatTensor，actual_labels是python原生的list。

pred和correctness是同类型同长度的tensor，在将其转换为list再添加到已有的list中时，占用的内存相差了约5个Mb，于是我将上面代码改写为：

问题解决了！

为什么下面的代码就没事，上面直接将Tensor转为list就会发生这种奇怪的现象？我去github和知乎看到了遇到类似问题的issue与文章，下面是链接

https://github.com/pytorch/pytorch/issues/13246
https://zhuanlan.zhihu.com/p/86286137
https://github.com/pytorch/pytorch/issues/17499

结论

目前得到的结论大概是python list的design有问题，导致了这种情况发生，pytorch团队虽然竭力修复，但他们表示因为这是python设计的缺陷，超出了他们的能力范围，上面第一个issue主要是针对DataLoader里num_workers>0时会导致内存泄漏，里面也提到了list与tensor互转亦会发生内存泄漏，这个issue已经一年多了还没能close。

因此，在使用pytorch时，应该尽力避免list的使用，一定不能让tensor和list直接互相转换，如果一定要做，应该将tensor从cuda转到cpu上，转为numpy.array，最后转为list，反之亦然。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

代码

代码

+关注

关注
30

文章
4787

浏览量
68589
for循环

for循环

+关注

关注
0

文章
61

浏览量
2502
pytorch

pytorch

+关注

关注
2

文章
808

浏览量
13221

Pytorch模型训练实用PDF教程【中文】

？模型部分？还是优化器？只有这样不断的通过可视化诊断你的模型，不断的对症下药，才能训练出一个较满意的模型。本教程内容及结构：本教程内容主要为在 PyTorch 中训练一个模型所可能涉及到的方法及函数，并且

发表于 12-21 09:18

Pytorch自动求导示例

Pytorch自动微分的几个例子

发表于 08-09 11:56

Pytorch入门之的基本操作

Pytorch入门之基本操作

发表于 05-22 17:15

PyTorch如何入门

PyTorch 入门实战（一）——Tensor

发表于 06-01 09:58

PyTorch10的基础教程

PyTorch 10 基础教程（4）：训练分类器

发表于 06-05 17:42

Pytorch AI语音助手

想做一个Pytorch AI语音助手，有没有好的思路呀？

发表于 03-06 13:00

如何安装TensorFlow2 Pytorch？

如何安装TensorFlow2 Pytorch？

发表于 03-07 07:32

如何往星光2板子里装pytorch？

如题,想先gpu版本的pytorch只安装cpu版本的pytorch,pytorch官网提供了基于conda和pip两种安装方式。因为咱是risc架构没对应的conda，而使用pip安装提示也没有

发表于 09-12 06:30

pytorch模型转换需要注意的事项有哪些？

什么是JIT（torch.jit）？答：JIT（Just-In-Time）是一组编译工具，用于弥合PyTorch研究与生产之间的差距。它允许创建可以在不依赖Python解释器的情况下运行的模型

发表于 09-18 08:05

基于PyTorch的深度学习入门教程之PyTorch简单知识

本文参考PyTorch官网的教程，分为五个基本模块来介绍PyTorch。为了避免文章过长，这五个模块分别在五篇博文中介绍。 Part1：PyTorch简单知识 Part2：PyTorch

发表于 02-16 15:20 •2258次阅读

PyTorch1.8和Tensorflow2.5该如何选择？

发布。而 PyTorch 则由 Facebook 的团队开发，并于 2017 年在 GitHub 上开源。为了充分发挥不同机器学习框架的优势，许多机器

发表于 07-09 10:33 •1511次阅读

那些年在pytorch上踩过的坑

今天又发现了一个pytorch的小坑，给大家分享一下。手上两份同一模型的代码，一份用tensorflow写的，另一份是我拿pytorch写的，模型架构一模一样，预处理数据的逻辑也一模一样，测试发现模型推理的速度也差不多。一份预处理代码是为

发表于 02-22 14:18 •1071次阅读

tensorflow和pytorch哪个更简单?

PyTorch更简单。选择TensorFlow还是PyTorch取决于您的具体需求和偏好。如果您需要一个易于使用、灵活且具有强大社区支持的框架，PyTorch可能是一个更好的选择。如果您需要一个在

发表于 07-05 09:45 •862次阅读

PCB板上过孔太多如何解决

PCB板上过孔太多是一个在电子设计中常见的问题，它可能由多种因素引起，如设计不合理、走线复杂、信号需求等。解决PCB板上过孔太多的问题，需要从设计、布局、走线以及与制造厂商的沟通等多个方面入手。

发表于 07-16 15:25 •3086次阅读

pytorch怎么在pycharm中运行

第一部分：PyTorch和PyCharm的安装 1.1 安装PyTorch PyTorch是一个开源的机器学习库，用于构建和训练神经网络。要在PyCharm中使用PyTorch，首先需

发表于 08-01 16:22 •1413次阅读

搜索历史

那些年在pytorch上过的当

起因

过程

结论

评论

Pytorch模型训练实用PDF教程【中文】

Pytorch自动求导示例

Pytorch入门之的基本操作

PyTorch如何入门

PyTorch10的基础教程

Pytorch AI语音助手

如何安装TensorFlow2 Pytorch？

如何往星光2板子里装pytorch？

pytorch模型转换需要注意的事项有哪些？

基于PyTorch的深度学习入门教程之PyTorch简单知识

PyTorch1.8和Tensorflow2.5该如何选择？

那些年在pytorch上踩过的坑

tensorflow和pytorch哪个更简单?

PCB板上过孔太多如何解决

pytorch怎么在pycharm中运行