[《PyTorch 2.5重磅更新:性能优化+新特性》]中的一个新特性就是:正式支持在英特尔^®^独立显卡上训练模型!
PyTorch 2.5 |
---|
独立显卡类型 |
Intel^®^数据中心GPU Max系列 |
Intel^®^Arc™系列 |
本文将在Intel^®^Core™ Ultra 7 155H自带的Arc™集成显卡上展示使用Pytorch2.5搭建并训练AI模型的全流程。
一 ,搭建开发环境
首先,请安装显卡驱动,参考指南:
https://dgpu-docs.intel.com/driver/client/overview.html
然后,**请下载并安装Anaconda,**链接↓↓
https://www.anaconda.com/download
并用下面的命令创建并激活名为pytorch_arc的虚拟环境:
conda create -n pytorch_arc python=3.11 #创建虚拟环境
conda activate pytorch_arc #激活虚拟环境
python -m pip install --upgrade pip #升级pip到最新版本
接着,安装Pytorch XPU版;
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/xpu
滑动查看更多
最后,执行命令,验证安装。看到返回结果为“True”,证明环境搭建成功!
>> > import torch
>> > torch.xpu.is_available()
二 ,训练ResNet模型
执行下载的训练代码,实现在Intel^®^ Arc™集成显卡上训练ResNet50模型。代码下载链接:
https://gitee.com/Pauntech/Pytorch-2.5
import torch
import torchvision
LR = 0.001
DOWNLOAD = True
DATA = "datasets/cifar10/"
transform = torchvision.transforms.Compose(
[
torchvision.transforms.Resize((224, 224)),
torchvision.transforms.ToTensor(),
torchvision.transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)),
]
)
train_dataset = torchvision.datasets.CIFAR10(
root=DATA,
train=True,
transform=transform,
download=DOWNLOAD,
)
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=128)
train_len = len(train_loader)
model = torchvision.models.resnet50()
criterion = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=LR, momentum=0.9)
model.train()
model = model.to("xpu")
criterion = criterion.to("xpu")
print(f"Initiating training")
for batch_idx, (data, target) in enumerate(train_loader):
data = data.to("xpu")
target = target.to("xpu")
optimizer.zero_grad()
output = model(data)
loss = criterion(output, target)
loss.backward()
optimizer.step()
if (batch_idx + 1) % 10 == 0:
iteration_loss = loss.item()
print(f"Iteration [{batch_idx+1}/{train_len}], Loss: {iteration_loss:.4f}")
torch.save(
{
"model_state_dict": model.state_dict(),
"optimizer_state_dict": optimizer.state_dict(),
},
"checkpoint.pth",
)
print("Execution finished")
三 ,总结
使用[PyTorch]在英特尔独立显卡上训练模型将为AI行业新增计算硬件选择!
审核编辑 黄宇
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
英特尔
+关注
关注
60文章
9860浏览量
171253 -
显卡
+关注
关注
16文章
2418浏览量
67375 -
pytorch
+关注
关注
2文章
802浏览量
13110
发布评论请先 登录
相关推荐
支持140亿参数AI模型,229TOPS!英特尔重磅发布第一代车载独立显卡
英特尔院士、英特尔公司副总裁、汽车事业部总经理Jack Weast指出,在今年的CES上,英特尔发布了第一代AI增强型软件定义车载SoC。8月8日,英特尔正式推出首款
英特尔发布第一代车载锐炫独立显卡
英特尔震撼发布其第一代车载英特尔锐炫独立显卡,标志着智能座舱技术迈入全新阶段。这款显卡平台算力高达229TOPS,不仅
从运动员到开发者: 英特尔以开放式AI系统应对多重挑战
打造的生成式AI(GenAI)检索增强生成(RAG)解决方案。该成果深度展示了英特尔如何通过基于英特尔®至强®处理器和英特尔® Gaudi AI加速器的开放式AI系统及平台,帮助开发者
网友成功在Arm架构平台运行英特尔锐炫A750显卡
值得注意的是,英特尔独立显卡源于核心显卡,因此在长期使用的“i915”Linux系统内核驱动中,积累了许多与x86架构紧密相关的特性。
华擎推出AI QuickSet软件,支持英特尔锐炫Arc A系列显卡
今日,华擎宣布将AI QuickSet软件工具扩展至英特尔锐炫Arc A系列显卡,使其能够便捷地安装Stable Diffusion web UI OpenVINO,结合英特尔OpenVINO套件,充分发挥Arc
英特尔下代锐炫ARC显卡明年或难问世?
据了解,英特尔 ARC 锐炫系列 DG3 独立显卡将使用 Xe2-HPG 架构,代号为 Battlemage,旨在替代 2022 年发布的 Alchemist 系列 DG2 独立
英特尔开发套件『哪吒』在Java环境实现ADAS道路识别演示 | 开发者实战
本文使用来自OpenModelZoo的预训练的road-segmentation-adas-0001模型。ADAS代表高级驾驶辅助服务。该模型识别四个类别:背景、道路、路缘和标记。硬件环境此文使用了英特尔开发套件家族里的『哪吒』
英特尔Battlemage显卡仅支持UHBR10模式,不再支持DisplayPort UHBR20
据报道,英特尔近日发布多项补丁,显示其Battlemage显卡(DG2/Alchemist的后续产品)最高支援到DisplayPort UHBR13.5。
英特尔面向AI PC软件开发者与硬件供应商新增助力计划
英特尔公司近日宣布“AI PC加速计划”再添两项人工智能(AI)新举措,即新增“AI PC开发者计划”,并吸纳独立硬件供应商(IHV)加入“AI PC加速计划”。
【转载】英特尔开发套件“哪吒”快速部署YoloV8 on Java | 开发者实战
OpenVINO 工具套件基于OneAPI开发,可以加快高性能计算机视觉和深度学习应用开发速度的工具套件,适用于从边缘到云的各种英特尔计算平台上,帮助用户更快地将更准确的真实世界数据的AI推理结果
基于英特尔哪吒开发者套件平台来快速部署OpenVINO Java实战
OpenVINO 工具套件基于OneAPI开发,可以加快高性能计算机视觉和深度学习应用开发速度的工具套件,适用于从边缘到云的各种英特尔计算平台上
评论