资料介绍
软件简介
PatrickStar 是一款腾讯开发的分布式深度学习训练工具,它的设计目标是支持以 GPT、Bert 为代表的超大预训练模型训练。
用法
PatrickStar 基于 PyTorch,这使得迁移 pytorch 项目变得容易。以下是 PatrickStar 的示例:
from patrickstar.runtime import initialize_engine config = { "optimizer": { "type": "Adam", "params": { "lr": 0.001, "betas": (0.9, 0.999), "eps": 1e-6, "weight_decay": 0, "use_hybrid_adam": True, }, }, "fp16": { # loss scaler params "enabled": True, "loss_scale": 0, "initial_scale_power": 2 ** 3, "loss_scale_window": 1000, "hysteresis": 2, "min_loss_scale": 1, }, "default_chunk_size": 64 * 1024 * 1024, "release_after_init": True, "use_cpu_embedding": False, } def model_func(): # MyModel is a derived class for torch.nn.Module return MyModel(...) model, optimizer = initialize_engine(model_func=model_func, local_rank=0, config=config) ... for data in dataloader: optimizer.zero_grad() loss = model(data) model.backward(loss) optimizer.step()
使用与 DeepSpeed 配置 JSON 相同的config
格式,主要包括优化器、损失缩放器和一些 PatrickStar 特定配置的参数。
引用我们
@article{fang2021patrickstar,
title={PatrickStar: Parallel Training of Pre-trained Models via a Chunk-based Memory Management},
author={Fang, Jiarui and Yu, Yang and Zhu, Zilin and Li, Shenggui and You, Yang and Zhou, Jie},
journal={arXiv preprint arXiv:2108.05818},
year={2021}
}
下载该资料的人也在下载
下载该资料的人还在阅读
更多 >
- 深度学习在嵌入式设备上的应用
- 基于Simulink的电子对抗分布式仿真系统 26次下载
- 基于DSP的航空发动机分布式总线设计方案 14次下载
- 轻量级分布式机器学习系统及算法 16次下载
- 面向联邦学习的分布式与隐私安全性综述 3次下载
- 基于预训练模型和长短期记忆网络的深度学习模型 19次下载
- 一种优化的分布式二维卷积算法 1次下载
- 基于分布式数据Cache的实时动态迁移机制 20次下载
- 一种分布式网络扫描架构和任务调度算法 19次下载
- 深度学习是什么?了解深度学习难吗?让你快速了解深度学习的视频讲解 16次下载
- 基于虚拟化的多GPU深度神经网络训练框架 0次下载
- 小波域分布式深度图视频编码 1次下载
- 引入深度遍历机制的分布式数据结构插值算法 0次下载
- GL Studio的分布式虚拟训练系统关键技术 27次下载
- 分布式对象调试中的事件模型
- 深度学习模型训练过程详解 424次阅读
- Java手写分布式锁的实现 424次阅读
- tldb提供分布式锁使用方法 761次阅读
- 基于PyTorch的模型并行分布式训练Megatron解析 2284次阅读
- 视觉深度学习迁移学习训练框架Torchvision介绍 734次阅读
- 如何使用分布式存储系统促进AI模型训练 494次阅读
- 基于多智能体深度强化学习的体系任务分配方法 3370次阅读
- 鸿蒙分布式相机“踩坑”分享 1578次阅读
- 分布式锁的设计与实现 1563次阅读
- 分布式光纤传感器原理_分布式光纤传感器的应用 8424次阅读
- NVIDIA迁移学习工具包 :用于特定领域深度学习模型快速训练的高级SDK 3031次阅读
- 有多快?华为云刷新深度学习加速纪录 5134次阅读
- 浅谈分布式块存储的元数据服务设计 4871次阅读
- 如何借助分布式GPU环境来提升神经网络训练系统的浮点计算能力 5063次阅读
- 深度解读分布式存储技术之分布式剪枝系统 1773次阅读
下载排行
本周
- 1山景DSP芯片AP8248A2数据手册
- 1.06 MB | 532次下载 | 免费
- 2RK3399完整板原理图(支持平板,盒子VR)
- 3.28 MB | 339次下载 | 免费
- 3TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 4DFM软件使用教程
- 0.84 MB | 295次下载 | 免费
- 5元宇宙深度解析—未来的未来-风口还是泡沫
- 6.40 MB | 227次下载 | 免费
- 6迪文DGUS开发指南
- 31.67 MB | 194次下载 | 免费
- 7元宇宙底层硬件系列报告
- 13.42 MB | 182次下载 | 免费
- 8FP5207XR-G1中文应用手册
- 1.09 MB | 178次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33566次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21549次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6656次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537798次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420027次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191187次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183279次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多