近日,elexcon 2023深圳国际电子展在深圳会展中心圆满落幕。沐曦集成电路(上海)有限公司(下称“沐曦”)携自主研发的全栈GPU芯片产品及解决方案亮相本次大会,沐曦AI解决方案总监虞新阳应邀出席并发表主题演讲。本次大会以“智能、创新、开源”为主题,汇聚近千家国内外优质企业和专家,涵盖从产品设计到应用落地的上下游产业,展示全球产业动态及未来技术趋势。
沐曦AI解决方案总监虞新阳发表主题演讲
在GPU技术与生态专题论坛中,沐曦AI解决方案总监虞新阳发表了题为“智能时代的GPU算力构建”的主题演讲。虞新阳表示,随着ChatGPT这一标志性产品的发布和发酵,人类迈向智能化时代。信息化革命使人类能够在数字世界中劳动并创造价值,智能化革命则能够将人本身从各种劳动创造中解放出来。以大模型为例,这一在特定应用场景具备超越人类能力的AI工具将彻底重构人类社会,为人类创造巨大的价值。从整体上来说,大模型越大效果越好,ChatGPT以Transformer结构为主干,包含了1750亿的参数,模型训练及推理都需要很大的算力系统做支撑。近几年来,语言大模型主体结构从Bert到T5转换到了GPT,预计接下来还会持续进化;语音图像的AIGC主要包含GAN、VAE、Flow和最近火热的Diffusion这4种生成方式,接下来也将继续迭代并相互融合。在智能化过程中,模型和算力展现了双螺旋协同和促进关系,大模型依赖海量的GPU算力进行迭代,另一方面GPU算力架构本身也需要随着模型而更新。沐曦千亿参数AI大模型训练及通用计算GPU曦云C500一方面包含了很强的计算性能和存储带宽,另一方面基于MetaXLink 2.0有很强的卡间通信能力。在芯片基础上,沐曦构建了强大的MXMACA软件栈,依托通用计算架构、先进的算子库和编译器能力,能够原生支持PyTorch、TensorFlow以及国内的飞桨、MindSpore等框架。曦云C500芯片回片短短2个多月内,已能流畅地运行Stable Diffusion,LLaMA 65B,LLaMA2 70B以及国内ChatGLM等模型。
在GPU应用圆桌论坛中,虞新阳与来自清华大学软件学院、中国科学院大学、清华大学集成电路学院、武汉理工大学、上海交通大学电子信息与电气工程学院、华南理工大学的专家学者一同探讨GPU算力芯片如何支撑国内大模型应用落地。虞新阳表示,国内上层应用市场已走在世界前列,国产GPU厂商要在布局及建立底层能力的同时,充分拥抱结合上层应用的发展并进行持续的迭代创新。沐曦的产品和解决方案能够全面兼容主流GPU生态,最小化存量用户迁移成本,为客户构建软硬件一体的全面生态解决方案。国产GPU生态的建设不仅需要本土GPU厂商的努力,还需要软件解决方案商等上下游合作伙伴携手共进。
审核编辑:彭菁
-
gpu
+关注
关注
28文章
4729浏览量
128902 -
AI
+关注
关注
87文章
30763浏览量
268913 -
软硬件
+关注
关注
1文章
295浏览量
19199 -
沐曦
+关注
关注
0文章
26浏览量
1152
原文标题:沐曦亮相elexcon 2023深圳国际电子展
文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论