0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GTC 2023看点:深度学习系统Colossal-AI试图解决什么问题

西西 来源:GTC 2023直播 作者:GTC 2023直播 2023-03-23 16:03 次阅读

在GTC 2023 | NVIDIA开发者大会上,加州伯克利数学与计算机科学的教授向我们介绍了关于深度学习系统Colossal-AI的相关内容。

深度学习系统Colossal-AI使用户能够以大幅降低成本的方式最大限度地提高AI训练和推理的效率。它集成了高效的多维并行、异构内存管理、自适应任务调度等先进技术。

Colossal-AI将更好地了解大型模型训练和推理背后的并行性和内存优化技术,学习深度学习系统的实际应用(包括自然语言处理、计算机视觉、生物信息学等),并能够为未来的大型 AI 模型时代做出贡献。

Colossal-AI系统试图解决什么问题呢?

pYYBAGQcCh-AK0ObAAJWHKaquW4641.png

主流AI模型大小增长的图表,它显示了AI模型在短短几年内增长的速度,每18个月增长40倍,这超过了摩尔定律在其具盛时期的最佳表现。

小型和中型企业( SMEs )在尽可能地在采用它们,Colossal-Al系统在2026年时可以帮你节省的成本的估计训练175B参数GPT-3模型,利用所有这些硬件特性和变化,估计训练成本从300降至73000美元,约为41倍。

强调大规模并行是必不可少的,使用单个A 100 GPU训练具有540B参数的Pal M语言模型的时间和成本,需要300年并且花费920万美元。

随着新数据的不断出现,他们需要反复的新训练以避免像2019年的GPT-2一样无法识别COVID-19等概念。

训练完成之后,仅使用模型进行推理也是项挑战,因为模型的大小需要并行技术,单个服务器的内存可能无法容纳大模型。除了设备成本之外,还有人力成本支付需要解决所有这些问题的专家团队,这就限制了一些公司特别是无法承受这些团队的中小企业使用这些大型模型。

因此Colossal-AI的作用出现了:

对特定底层硬件架构进行优化,左侧(硬件层)可以是CPU、 GPU、TPU或FPGAl,右侧是你的用于AI模型编写的框架,如TensorFlow、 Py Torch或其他框架。Colossal-AI可以高效地将大模型部署到目标架构,实现底部显示的所有目标,最小化运行时间,最小化通信(移动数据)在当前架构是最昂贵的操作,最小化用户需要改动代码的数量,即重构。使模型能够动态地适应机器的规模变化,并减少内存占用,一边能运行大模型。

Colossal-AI提供了三个层次:

高效的内存系统,可最大程度利用可用内存。

多维并行,即如何最好地将复杂的模型映射到可用的硬件上,以最大程度地使并行处理并最小化通信。

大规模优化,也就是如何自动调整影响准确度收敛的众多超参数,因为这些值通常取决子如何进行并行处理。

因此Colossal-AI的目标是将复杂且相互作用的决策从用户角度隐藏起来,并自动完成所有操作。

编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3640

    浏览量

    89888
  • 深度学习
    +关注

    关注

    73

    文章

    5422

    浏览量

    120602
  • gtc
    gtc
    +关注

    关注

    0

    文章

    73

    浏览量

    4399
收藏 人收藏

    评论

    相关推荐

    NVIDIA推出全新深度学习框架fVDB

    在 SIGGRAPH 上推出的全新深度学习框架可用于打造自动驾驶汽车、气候科学和智慧城市的 AI 就绪型虚拟表示。
    的头像 发表于 08-01 14:31 413次阅读

    深度学习中的时间序列分类方法

    时间序列分类(Time Series Classification, TSC)是机器学习深度学习领域的重要任务之一,广泛应用于人体活动识别、系统监测、金融预测、医疗诊断等多个领域。随
    的头像 发表于 07-09 15:54 395次阅读

    基于AI深度学习的缺陷检测系统

    在工业生产中,缺陷检测是确保产品质量的关键环节。传统的人工检测方法不仅效率低下,且易受人为因素影响,导致误检和漏检问题频发。随着人工智能技术的飞速发展,特别是深度学习技术的崛起,基于AI深度
    的头像 发表于 07-08 10:30 564次阅读

    人工智能、机器学习深度学习是什么

    在科技日新月异的今天,人工智能(Artificial Intelligence, AI)、机器学习(Machine Learning, ML)和深度学习(Deep Learning,
    的头像 发表于 07-03 18:22 685次阅读

    泰禾智能携AI智选深度学习系列新品亮相临沂花生展

    的使用体验,也为整个行业的发展注入了新的活力。   AI智选 赋能升级‍   泰禾AI智选深度学习色选机搭载AI
    的头像 发表于 06-29 14:19 610次阅读

    深度解析深度学习下的语义SLAM

    随着深度学习技术的兴起,计算机视觉的许多传统领域都取得了突破性进展,例如目标的检测、识别和分类等领域。近年来,研究人员开始在视觉SLAM算法中引入深度学习技术,使得
    发表于 04-23 17:18 1026次阅读
    <b class='flag-5'>深度</b>解析<b class='flag-5'>深度</b><b class='flag-5'>学习</b>下的语义SLAM

    与NVIDIA深度参与GTC,向量数据库大厂Zilliz与全球顶尖开发者共迎AI变革时刻

    近日,备受关注的 NVIDIA GTC 已拉开序幕。来自世界各地的顶尖 AI 开发者齐聚美国加州圣何塞会议中心,共同探索行业未来,全球领先的向量数据库公司 Zilliz 也不例外。作为去年被
    的头像 发表于 03-26 11:01 296次阅读

    FPGA在深度学习应用中或将取代GPU

    基础设施,人们仍然没有定论。如果 Mipsology 成功完成了研究实验,许多正受 GPU 折磨的 AI 开发者将从中受益。 GPU 深度学习面临的挑战 三维图形是 GPU 拥有如此大的内存和计算能力
    发表于 03-21 15:19

    英伟达GTC大会将开幕 黄仁勋将带你《见证AI的变革时刻》

    英伟达GTC大会将开幕 黄仁勋将带你《见证AI的变革时刻》 全球都在关注的英伟达GTC大会将开幕,作为“AI风向标”大家都在期待英伟达在GTC
    的头像 发表于 03-18 18:25 1248次阅读

    潞晨科技Colossal-AI与浪潮信息AIStation完成兼容性互认证

    近日,潞晨科技的Colossal-AI大模型开发工具和浪潮信息的AIStation智能业务创新生产平台成功完成了兼容性互认证。这一合作意味着用户可以在AIStation平台上便捷地部署与调度Colossal-AI系统,从而极大提
    的头像 发表于 03-06 10:18 595次阅读

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型开发效率提升10倍

    的潞晨科技Colossal-AI系统,用户可实现在本地算力平台一键训练、微调、推理、部署大模型,将大模型开发效率提升10倍以上,并将算力效率提升2-3倍,在最大化提升大模型开发效率的同时,降低大模型开发及应用的门槛和成本。 Coloss
    的头像 发表于 03-01 09:43 382次阅读
    潞晨科技<b class='flag-5'>Colossal-AI</b> + 浪潮信息AIStation,大模型开发效率提升10倍

    KITA2GTC3325VTRBSTOBO1开发板运行的是什么系统

    请告知KITA2GTC3325VTRBSTOBO1 开发板运行的是什么系统(RTOS 或·····)?开发板的整个Demo code从哪里可以得到?
    发表于 02-01 06:10

    深度学习在人工智能中的 8 种常见应用

    深度学习简介深度学习是人工智能(AI)的一个分支,它教神经网络学习和推理。近年来,它解决复杂问题
    的头像 发表于 12-01 08:27 2984次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>在人工智能中的 8 种常见应用

    深度学习技术与边缘学习技术的不同之处

    如今,AI技术的广泛应用已经成为推动制造和物流领域自动化的核心驱动力。康耐视所推出的深度学习和边缘学习技术,这两种基于AI的技术,在工业自动
    的头像 发表于 11-17 10:44 478次阅读

    深度学习在语音识别中的应用及挑战

    的挑战。 二、深度学习在语音识别中的应用 1.基于深度神经网络的语音识别:深度神经网络(DNN)和循环神经网络(RNN)是深度
    的头像 发表于 10-10 18:14 752次阅读