近日,2023中国算力大会在宁夏银川举行,沐曦集成电路(上海)有限公司(下称“沐曦”)联合创始人、CTO兼首席硬件架构师彭莉受邀出席由中国信息通信研究院、中国互联网协会联合举办的智能计算论坛,并担任演讲嘉宾,探讨后GPT时代算力需求激增带来的挑战以及GPU如何突破算力供需瓶颈、推动人工智能产业普惠化发展。
在题为“后GPT时代的算力需求”的演讲中,彭莉预测大模型商业模式将分为通用计算市场和专用定制化市场两大类:在通用计算市场,大语言模型将终结多数NLP任务,NLP技术水平被强行拉平,通用大模型或被大厂“垄断”;而在专用定制化市场,开源大模型将呈现百花齐放的发展态势,可针对私有数据、敏感数据进行快速定制和领域对齐,大模型开发和部署能力将趋于普及化。
彭莉指出,区别于传统AI,生成式AI技术可以借助接入类ChatGPT应用发挥显著的技术优势,为大语言模型的开发降本增效,同时也对算力提出更高和更迫切的要求。由于大模型训练的一次性成本被大规模推理摊薄,大模型盈利的一大难点是降低推理成本。沐曦致力于打造高效通用的GPU芯片及软硬件一体的生态解决方案,通过GPU软件生态优势、硬件架构优势、先进封装等方面全面提升GPU算力,降低大模型训练和推理的算力成本,在产品路线和生态战略上均可满足大模型对算力基础设施的大规模需求,为推进智能产业可持续发展打造坚实的算力底座。
关于沐曦
沐曦致力于为异构计算提供安全可靠的GPU芯片及解决方案,打造全栈GPU芯片产品,推出曦思N系列GPU用于AI推理,曦云C系列GPU用于千亿参数AI大模型训练及通用计算,以及曦彩G系列GPU用于图形渲染,满足数据中心对“高能效”及“高通用性”的算力需求。沐曦产品均采用完全自主研发的GPU IP,拥有完全自主的指令集和架构,配以兼容主流GPU生态的完整软件栈(MXMACA),具备高能效和高通用性的天然优势,能够为客户构建软硬件一体的全面生态解决方案,是“双碳”背景下推动数据中心建设和产业数字化、智能化转
-
集成电路
+关注
关注
5375文章
11304浏览量
360306 -
gpu
+关注
关注
28文章
4673浏览量
128558 -
智能计算
+关注
关注
0文章
170浏览量
16449 -
沐曦
+关注
关注
0文章
26浏览量
1140
原文标题:沐曦彭莉:后GPT时代GPU如何降低算力门槛
文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论