0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

生成式AI的I/O瓶颈,或许可以用光子IC来突破

E4Life 来源:电子发烧友网 作者:周凯扬 2023-10-13 00:02 次阅读

电子发烧友网报道(文/周凯扬)从回答问题对话到写文章,ChatGPT这类应用已经帮我们展示了生成式AI带来的第一波震撼,从OpenAI的路线也可以看出,他们已经在努力把处理对象从单纯的文字,转换成图片、音频乃至视频了。但这也意味着待处理的数据大小以数量级提升,毕竟再长的文本和视频文件大小比起来还是相去甚远。

I/O瓶颈

要想进一步提升生成式AI的处理性能,我们就不得不看下背后为其提供动力的基础设备,也就是GPU、AI加速器、高带宽内存和光模块。AI模型发展的早期,只需单个GPU甚至是CPU就能处理简单的AI模型,而如今这些先进的AI模型,没有大型机柜组成的服务器和成千上万个GPU,是很难运行起来的。

比如特斯拉老版的自动驾驶训练超算,就是由720个节点的8x英伟达A100 GPU构成的,算力高达1.8 EFLOPS。小鹏于去年建成的智算中心扶摇算力规模高达600PFLOPS,预计也用到了上千块GPU。

尽管部署大量GPU是扩展算力的最直接途径,但与此同时传统的互联方案还是创造了巨大的I/O瓶颈,严重影响了GPU的性能利用率,导致更多的时间花在了等待数据而不是处理数据上。

为此,常用的方案变成了添加更多的GPU来弥补性能和计算效率上的损失,可这样的趋势已经在逐渐被淘汰,因为从减少碳足迹的角度来看,全球范围内各个国家都在开始考虑减少数据中心的能源损耗了。

光子IC

除此之外,另一解决方案就是利用光模块来解决速度慢的节点间电气连接,然而光模块成本较高、密度较低,所以需要更高速、端到端又能降低成本互联方案,即芯片到芯片之间的光学I/O。

利用更高带宽的光学连接取代诸多并行和高速串行I/O通道,这一愿景促使了行业对近封装光学和共封装光学的追求。相较外部可插拔的管模块,光子IC可将光学I/O集成到GPU封装内部,用来与其他的GPU节点进行直接通信,进一步提高了AI算力的扩展效率,满足了当下持续增长的AI需求。

近期,Sivers Semiconductors就在欧洲光通信展览会上展出了他们打造的八波长分布式反馈(DFB)激光器阵列,该阵列集成在了Ayar Labs的SuperNova多波长光源中,支持GPU之间最高4TB/s的数据传输。根据Ayar Labs提供的数据,新的光源配合它们的TeraPHY封装内光学I/O Chiplet,还提供了低上10倍的延迟和8倍的传输能效。

这样的表现无疑极大地提升GPU的性能利用效率,解决当下生成式AI在I/O性能瓶颈上的燃眉之急。尽管光子计算芯片目前尚不能替代传统的电子半导体器件,但从解决带宽和延迟需求上已经有了长足的进步。

写在最后

面对生成式AI模型大小的指数级上涨,以及逐渐庞大起来的推理数据量,传统的I/O性能必然会面临淘汰,而光子IC为高性能的AI芯片提供了一条更快更高效的通路。不过仍然需要注意的是,光子IC与传统IC还有设计与制造上的区别,比如需要特定的设计工具以及工艺等。因此要想发展光子IC跟上这一波趋势,就必须从EDA和晶圆代工厂开始抓起。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IC
    IC
    +关注

    关注

    36

    文章

    5950

    浏览量

    175594
收藏 人收藏

    评论

    相关推荐

    英伟达AI加速器新蓝图:集成硅光子I/O,3D垂直堆叠 DRAM 内存

    加速器设计的愿景。 英伟达认为未来整个 AI 加速器复合体将位于大面积先进封装基板之上,采用垂直供电,集成硅光子 I/O 器件,GPU 采用多模块设计,3D 垂直堆叠 DRAM 内存
    的头像 发表于 12-13 11:37 188次阅读
    英伟达<b class='flag-5'>AI</b>加速器新蓝图:集成硅<b class='flag-5'>光子</b><b class='flag-5'>I</b>/<b class='flag-5'>O</b>,3D垂直堆叠 DRAM 内存

    生成AI工具作用

    生成AI工具是指那些能够自动生成文本、图像、音频、视频等多种类型数据的人工智能技术。在此,petacloud.ai小编为您整理
    的头像 发表于 10-28 11:19 236次阅读

    谷歌Vertex AI助力企业生成AI应用

    过去的一段时间,我们看到了许多 Google Cloud 客户对生成 AI 和 agent 的精彩应用,令我们拍案叫绝。为了让企业能够更快推出功能强大的 AI agent,Googl
    的头像 发表于 09-09 15:59 506次阅读

    使用OpenVINO GenAI API的轻量级生成AI

    机器人的进步很快、变化不断,很难预测接下来会有什么突破,开发者应该关注什么。我们知道生成AI将继续存在,开发人员希望看到在本地开发、维护和部署 A
    的头像 发表于 07-24 15:08 602次阅读

    生成AI的基本原理和应用领域

    生成人工智能(Generative Artificial Intelligence,简称Generative AI)是一种利用机器学习算法和深度学习技术,通过模拟人类的创造性思维过程,生成
    的头像 发表于 07-04 11:50 1473次阅读

    原来这才是【生成AI】!!

    随着ChatGPT、文心一言等AI产品的火爆,生成AI已经成为了大家茶余饭后热议的话题。可是,为什么要在AI前面加上“
    的头像 发表于 06-05 08:04 290次阅读
    原来这才是【<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>】!!

    请问移动端生成AI如何在Arm CPU上运行呢?

    2023 年,生成人工智能 (Generative AI) 领域涌现出诸多用例。这一突破性的人工智能 (AI) 技术是 OpenAI 的
    的头像 发表于 05-21 17:07 875次阅读
    请问移动端<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>如何在Arm CPU上运行呢?

    生成AI的「七宗罪」!

    面对生成AI日渐增长的「罪恶」,我们该如何解决问题?
    的头像 发表于 05-07 16:34 1767次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的「七宗罪」!

    软件可配置模拟 I/O 的设计理念

    将这种荒谬变成了现实。如今,单一模拟集成电路 (IC) 就能实现多种角色。例如,[Analog Devices]的 [MAX22000] 工业 I/O 设备提供六个模拟输入和一个模拟输出,所有输入
    的头像 发表于 05-05 11:10 879次阅读
    软件可配置模拟 <b class='flag-5'>I</b>/<b class='flag-5'>O</b> 的设计理念

    生成AI触手可及 ——AirBox 正式开放预定

    生成AI触手可及 ——AirBox 正式开放预定
    的头像 发表于 04-26 08:34 905次阅读
    让<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>触手可及 ——AirBox 正式开放预定

    生成 AI 进入模型驱动时代

    人意识到,需要针对特定的应用对模型进行更广泛的训练。因此,只要说到“生成AI”这个词,我们很自然地就会联想到要使用经过训练的模型。但是,生成
    的头像 发表于 04-13 08:12 533次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 进入模型驱动时代

    生成 AI 制作动画:周期短、成本低!

    工作室和特效公司正广泛采用生成AI技术进行背景生成、角色创作和动作合成。这种技术的应用不仅提高了动画制作的效率,还使得动画作品在视觉效果和创意上有了更大的
    的头像 发表于 03-18 08:19 3635次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 制作动画:周期短、成本低!

    博世与微软合作开发生成AI产品

    全球知名科技公司博世与微软联合宣布,双方已建立合作关系,共同致力于开发先进的生成AI产品。这一合作的核心目标在于通过利用生成
    的头像 发表于 03-05 11:17 903次阅读

    FANUC外部I/O点数不够用了怎么办?可以扩展I/O点数吗?

    FANUC外部I/O点数不够用了怎么办?可以扩展I/O点数吗? 扩展FANUC的外部I/
    的头像 发表于 02-18 15:21 1910次阅读

    生成AI对智能家居的影响

    电子发烧友网站提供《生成AI对智能家居的影响.pdf》资料免费下载
    发表于 01-02 14:50 17次下载