0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA GPU和联想助力学校部署应用基础架构

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-13 11:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

案例简介

• 江西师范大学数字产业学院,利用搭载了NVIDIA V100和 T4 Tensor Core GPU的联想ThinkSystem SR650和SR670服务器高性能计算集群,帮助学生和教师开展深度学习突破性研究。

• 本案例主要应用到NVIDIA Tesla V100 , NVIDIA T4 Tensor Core GPU ,NVIDIA RIVA平台、NVIDIA NEMO模型训练平台。

客户简介及应用背景

江西师范大学数字产业学院是江西省的第一所数字产业学院,学院于2021年成立,专注于计算机科学与技术、人工智能、大数据、物联网及动画等领域的教学和研究。

作为新成立的机构,江西师范大学数字产业学院计划从零开始构建一套行业顶尖的数字化基础架构,而这需要从设计并建立全新的数据中心开始。

客户挑战

“联想和NVIDIA在人工智能和传统高性能计算领域实力雄厚,在我们的评估中获得了最高的技术评分。”

——江西师范大学数字产业学院副院长

在为新的数据中心选择服务器和存储基础架构时,江西师范大学数字产业学院主要考虑两大需求。

首先,它需要一个强大的平台支持日常运营。该平台将运行学院的学生信息、图书馆、教室和校园系统,而且需要足够的灵活性和可扩展性,在学院不断发展壮大、招生人数增多的情况下实现快速扩展。

其次,它还需要一套强大的高性能计算基础架构,帮助教师和学生开展突破性科研工作。江西师范大学数字产业学院设立了多个和人工智能、深度学习相关的优势学科和科研项目。因此,找到一种不仅能够支持CPU密集型工作负载,同时还能支持GPU密集型工作负载的通用架构为教学和科研的必要的实验环境尤为重要。

由于学院可用于IT管理的资源非常有限,这两个平台都应当非常可靠且易于管理。此外,考虑到随着科研工作的逐步深入,数据量预计将迅速增加,强大的数据存储和数据保护功能必不可少。

应用方案

联想帮助江西师范大学数字产业学院设计并部署了一套基于两大主要解决方案的基础架构,这两套方案协同运行,能够对学院的运营系统和科研项目进行全面管理。“

首先,学院采用联想ThinkAgile AH超融合解决方案作为统一平台,支持日常行政管理、教学和科研管理等企业级应用。超融合的部署意味着学院可以根据需要随时添加计算和存储资源来支持业务增长。联想ThinkAgile AH还是为数不多能够支持异构设备扩容的超融合解决方案,以最大化的资源利用和灵活性充分保护学院的投资。

其次,利用联想ThinkSystem SR650和SR670服务器组成的高性能计算集群,学院搭建了一个可供各学科完成教学和科研工作的IT环境。这些服务器搭载了CPU和NVIDIA V100及T4 Tensor Core GPU。NVIDIA V100 GPU专门设计用于加速人工智能和高性能计算工作负载,可提供比传统CPU高32倍的训练吞吐量。

凭借4颗NVIDIA V100 GPU和18颗NVIDIA T4 Tensor Core GPU,联想高性能计算集群可交付出色的性能,满足深度学习和计算机视觉工作负载的苛刻要求。该系统可支持多种常见的深度学习框架(如Caffe和TensorFlow)以及容器技术。

与此同时,联想的LiCO 平台(Lenovo Intelligent Computing Orchestration)作为集群管理器,提供了一个简单且直观的操作界面,使集群资源对研究人员垂手可得,并帮助非技术用户消除复杂性。同时,联想LiCO平台能够实现细粒度资源监控,和CPU、GPU资源的灵活分配。

最后,学院通过联想ThinkSystem DM3000H和DE6000H存储系统以及DPA24000备份一体机,实现对核心数据的归档、备份和保护。这种并行文件系统还可帮助包括科研人员在内的所有用户进行统一的数据访问。

使用效果及影响

“我们的学生和导师非常期待使用联想和NVIDIA的高性能计算平台开展突破性科学研究。这将有助于我们推动城市的数字产业的发展,实现教育链、创新链、产业链的深度融合。”

——江西师范大学数字产业学院副院长

新平台就绪后,江西师范大学数字产业学院具备了所需的工具帮助教师和学生开展一流的科研工作。

通过轻松访问高性能计算工作负载所需的CPU和GPU资源,学院的学生和科研人员将能够有效地规划、实施和管理项目而不需要额外的技术帮助,进而减轻IT技术人员的负担。利用联想LiCO平台,只需简单点击鼠标就可以分配资源,部署深度学习应用和训练模型。技术和研究人员的时间和精力能够释放出来,帮助学院集中精力于学术工作,而不必被淹没在繁琐的部署、运营或系统维护任务中。

基于NVIDIA GPU的强大处理能力,可以很好的支持人工智能和深度学习研究项目。 用户友好的高性能计算集群管理,使学生和科研人员如虎添翼 。小维护工作量的基础架构,提供自动备份,可轻松扩展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 联想
    +关注

    关注

    3

    文章

    2757

    浏览量

    64749
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110095
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5258

    浏览量

    136039
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英飞凌携手NVIDIA,依托数字孪生技术加速部署安全可靠的机器人

    管理系统及安全领域的优势,以及 NVIDIA 的 AI、机器人和仿真平台,共同助力生态系统设计并推动人形机器人的部署
    发表于 03-19 16:52 1191次阅读
    英飞凌携手<b class='flag-5'>NVIDIA</b>,依托数字孪生技术加速<b class='flag-5'>部署</b>安全可靠的机器人

    NVIDIA推出BlueField-4 STX存储架构

    NVIDIA 今日宣布推出 NVIDIA BlueField-4® STX 模块化参考架构,该架构助力企业、云计算及 AI 服务商轻松
    的头像 发表于 03-18 14:40 260次阅读

    NVIDIA DRIVE AV软件平台与Halos架构助力梅赛德斯奔驰CLA车型获得最高安全评分

    NVIDIA DRIVE AV 软件平台与 NVIDIA Halos 架构助力 CLA 车型获得最高安全评分(top safety rating)。
    的头像 发表于 02-02 09:28 2220次阅读

    FPGA+GPU异构混合部署方案设计

    为满足对 “纳秒级实时响应” 与 “复杂数据深度运算” 的双重需求,“FPGA+GPU”异构混合部署方案通过硬件功能精准拆分与高速协同,突破单一硬件的性能瓶颈 ——FPGA聚焦低延迟实时交易链路,GPU承接高复杂度数据处理任务,
    的头像 发表于 01-13 15:20 468次阅读

    NVIDIA RTX PRO 5000 72GB Blackwell GPU现已全面上市

    NVIDIA RTX PRO 5000 72GB Blackwell GPU 现已全面上市,将基于 NVIDIA Blackwell 架构的强大代理式与生成式 AI 能力带到更多桌面和
    的头像 发表于 12-24 10:32 1073次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 72GB Blackwell <b class='flag-5'>GPU</b>现已全面上市

    NVIDIA Omniverse基于Container的部署推流方案

    为了让客户能够高效安装和部署 NVIDIA Omniverse 及 NVIDIA Isaac 平台,NVIDIA 现已推出简单便捷的容器化部署
    的头像 发表于 12-17 10:17 904次阅读
    <b class='flag-5'>NVIDIA</b> Omniverse基于Container的<b class='flag-5'>部署</b>推流方案

    在Python中借助NVIDIA CUDA Tile简化GPU编程

    兼容未来的 GPU 架构。借助 NVIDIA cuTile Python,开发者可以直接用 Python 编写 tile kernels。
    的头像 发表于 12-13 10:12 1384次阅读
    在Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile简化<b class='flag-5'>GPU</b>编程

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    Blackwell 架构 GPU 中的中端专业图形卡,高度仅为全高 GPU 的二分之一。如果您需要的是一块半高显卡,能适配小机箱,功耗不高,还要具备 AI 及光线追踪性能的话,那么 RTX PRO 2000 是很好的选择。
    的头像 发表于 11-28 09:39 6928次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能测试

    NVIDIA推出NVQLink高速互连架构

    NVIDIA 推出 NVIDIA NVQLink,这是一种开放式系统架构,可将 GPU 计算的极致性能与量子处理器紧密结合,以构建加速的量子超级计算机。
    的头像 发表于 11-03 14:53 873次阅读

    OpenAI和NVIDIA宣布达成合作,部署10吉瓦NVIDIA系统

    此次合作将助力 OpenAI 构建和部署至少 10 吉瓦(gigawatt)的 AI 数据中心,这些数据中心将采用 NVIDIA 系统,包含数百万块 NVIDIA
    的头像 发表于 09-23 14:37 1554次阅读
    OpenAI和<b class='flag-5'>NVIDIA</b>宣布达成合作,<b class='flag-5'>部署</b>10吉瓦<b class='flag-5'>NVIDIA</b>系统

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品
    的头像 发表于 08-28 11:02 4319次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 1621次阅读

    Arm方案 基于Arm架构的边缘侧设备(树莓派或 NVIDIA Jetson Nano)上部署PyTorch模型

    本文将为你展示如何在树莓派或 NVIDIA Jetson Nano 等基于 Arm 架构的边缘侧设备上部署 PyTorch 模型。
    的头像 发表于 07-28 11:50 3028次阅读

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    。。) 原理学习 在「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中,作者详解了从帕斯卡架构到40系的Hopper架构的技术演变进化,按照出版时间算是囊括了
    发表于 06-18 19:31

    GPU架构深度解析

    GPU架构深度解析从图形处理到通用计算的进化之路图形处理单元(GPU),作为现代计算机中不可或缺的一部分,已经从最初的图形渲染专用处理器,发展成为强大的并行计算引擎,广泛应用于人工智能、科学计算
    的头像 发表于 05-30 10:36 2007次阅读
    <b class='flag-5'>GPU</b><b class='flag-5'>架构</b>深度解析