0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI大模型这股东风,RISC-V该如何乘?

时光流逝最终成了回忆 来源:电子发烧友网 作者:吴子鹏 2023-12-04 06:53 次阅读

电子发烧友网报道(文/吴子鹏)说起AI大模型的训练和推理,很多人的第一想法肯定是英伟达芯片,那么背后也就是ARM架构。统计数据显示,在AI芯片领域,英伟达一家独占七成市场份额;如果单独看AI大模型训练芯片,正如花旗研究分析师Christopher Danely提到的,英伟达的市场占比超过九成。

实际上,即便是谷歌、亚马逊、Meta、IBM及其他一些企业提供的AI芯片,背后的架构也基本是ARM架构。那么,目前同样大火的RISC-V架构是否能够在AI大模型市场捕捉到机会呢?

RISC-V在AI大模型领域的尝试

当然,虽然在芯片性能方面还无法和ARM架构芯片正面抗衡,不过RISC-V架构阵营也没有坐以待毙,而是在积极探索进入AI大模型市场的机会,且已经有一些成果。

在今年的世界互联网大会乌镇峰会上,希姆计算联合国鑫发布基于RISC-V架构打造的大模型系列一体机,包括2U4卡、4U8卡机,支持部署6B、7B、13B参数规模的大模型。

这就是很好的联动,希姆计算成立于2019年4月,成立之初就确立了基于RISC-V指令集设计数据中心高性能芯片的技术路线、由专用计算(DSA,领域专用架构)向通用计算(CPU)逐步演进的发展战略。目前,该公司已经有一款加速卡产品——STCP920。

STCP920是希姆计算基于RISC-V架构打造的人工智能计算加速卡,混合支持FP16/INT8数据类型。算力表现为:半精度浮点运算速度(FP16)为128TFLOPS;整数运算速度(INT8)为256 TOPS。内存类型为LPDDR4X,内存带宽为119.4GB/S。

国鑫则是中国领先的服务器解决方案供应商,具有全产业链的自主研发能力和生产能力,是目前中国屈指可数的集研发、生产、销售、服务于一体的服务器和存储软硬件厂商之一。目前,该公司在智算中心方面的服务器主要还是基于英特尔AMD的芯片产品。

再看另一个案例,来自芯至科技。该公司今年才开始正式运营,不过却在助推RISC-V进入大模型运算方面做出了突出的成绩。根据该公司官网信息,芯至科技在今年发布了全球首款Risc-V based GPGPU SIMT核——焦山核(Turbocore)V100。

焦山核V100全面支持SIMT,支持RV32G指令集,支持Tensor扩展指令集,支持类CUDA编程模型,提供硬件任务调度,指令并行度为32Threads*128。可被用于GPGPU进行AI推理等多种场景,单核性能不低于16T Int8/GHz,预计采用12nm工艺流片,频率将不低于1.2GHZ。

芯至科技联合创始人、首席芯片架构师兼副总裁尹文此前表示,AI大模型落地到推理侧的新机会与RISC-V架构创新不谋而合,Scaler小标量+SIMT大算力的指令集/微架构融合将是未来RISC-V发力的重点,能以相对低的成本,为AI推理侧应用提供高效支持。

尹文这种“RISC-V可以做线程级并行AI计算”的想法,和英特尔是不谋而合的。英特尔Piuma是一个定制RISC内核的特殊芯片,它的特殊之处在虽然只有8个核心,但是却有528个线程,单核拥有66个线程。另外,Piuma芯片还具有非常恐怖的互联能力,最多可以实现131072个Piuma芯片互连,让一个芯片集群拥有1680万个核心,这会带来非常恐怖的数据并行能力。虽然英特尔没有说这是RISC-V内核,但是技术上是一脉相通的,给行业发展提供了一个全新的思路。

另外,我们看一下阿里平头哥,该公司最近连发了三颗RISC-V处理器内核——首次实现AI矩阵扩展的C907、满足Vector1.0标准的C920,以及实时处理器R910。其中,C920已经新增支持Transformer模型,C907首次实现了独立矩阵运算(Matrix)扩展,这些内核都表明商用RISC-V内核确实在向着AI大模型的核心战场进展,满足性能指标只会是时间问题。

除了上述提到的,另外国芯科技和上海清华国际创新中心、智绘微电子已经签署了关于开源RISC-V GPGPU合作开发的备忘录,这也是一种积极的探索。从理论上说,RISC-V的Vector扩展支持用GPGPU方式来执行,那么基于RISC-V实现GPGPU就有了可行性。

RISC-V在AI大模型领域的挑战

根据此前的报道,在一项专业基准测试中,专注高性能RISC-V芯片的Tenstorrent推出基于自有处理器内核的RISC-V CPU芯片,该芯片的评分领先于英特尔的Sapphire Rapids、英伟达的Grace和AMD的Zen4。这说明,在传统CPU方向上,RISC-V架构已经开始崭露头角,证明了RISC-V架构做高性能芯片的能力,那么在AI大模型方面会遇到哪些挑战呢?

在AI大模型这类型应用中,RISC-V架构第一大挑战肯定是内核本身。通过美国对于我国的AI芯片禁令就可以看出,AI芯片做大模型训练是有一定门槛的,低于这个门槛效果就会大打折扣,虽然RISC-V架构已经做了很多尝试,不过总体性能和长期深耕GPU领域的ARM架构肯定没法比。当然,英特尔和芯至科技这类尝试说明,RISC-V架构可以率先攻克大模型推理芯片市场以及终端一体机市场。

在性能背后就会牵扯出第二问题——专利。英伟达等芯片厂商以及Arm公司在高性能计算芯片领域储备了大量的专利,为了追求极致的运算性能,很多方式方法都已经被论证过了,并形成了专利,要绕开这些专利限制实现高性能计算芯片,进一步提升了相关厂商的研发难度。

第三个问题也是一个老生常谈的问题,那就是生态。AI大模型这类型的应用,无论是训练端还是推理端,都会是一个软硬件结合的系统,尤其是具体到某一个细分领域的推理应用,具有丰富的上层应用,也就需要更高效的软硬件融合。不过,目前对于RISC-V架构而言,很多生态还是荒漠,比如DDK、接口、中间件这些关键的生态工具,基本还没有。

小结

还记得之前平头哥的观点:RISC-V将成为AI时代的原生架构,各行业芯片都值得用RISC-V做一次。那么,应用于AI大模型的芯片也是如此。不过,目前应用于这一领域的芯片还在高速地发展,这给RISC-V架构增加了追赶的难度,且生态封闭的问题需要从业者有更大的勇气和决心。目前,RISC-V在AI大模型应用中已经有所尝试,接下来要做到的就是完善产品和生态,没有其他捷径可走。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    27637

    浏览量

    265233
  • RISC-V
    +关注

    关注

    42

    文章

    2022

    浏览量

    45397
  • AI芯片
    +关注

    关注

    17

    文章

    1761

    浏览量

    34538
  • 阿里平头哥
    +关注

    关注

    0

    文章

    9

    浏览量

    1825
  • 大模型
    +关注

    关注

    2

    文章

    1919

    浏览量

    1535
  • 芯至科技
    +关注

    关注

    0

    文章

    1

    浏览量

    53
  • AI大模型
    +关注

    关注

    0

    文章

    257

    浏览量

    162
收藏 人收藏

    评论

    相关推荐

    risc-v多核芯片在AI方面的应用

    RISC-V多核芯片在AI方面的应用主要体现在其低功耗、低成本、灵活可扩展以及能够更好地适应AI算法的不同需求等特点上。 首先,RISC-V适合用于高效设计实现,其内核面积更小,功耗更
    发表于 04-28 09:20

    解锁RISC-V技术力量丨曹英杰:RISC-V与大模型探索

    4月12日,第二期“大家来谈芯|解锁RISC-V技术力量”在上海临港新片区顶科永久会址举办,本期沙龙聚焦RISC-V技术,围绕AI时代的RISC-V市场机会、
    的头像 发表于 04-16 08:16 279次阅读
    解锁<b class='flag-5'>RISC-V</b>技术力量丨曹英杰:<b class='flag-5'>RISC-V</b>与大<b class='flag-5'>模型</b>探索

    RISC-V厂商正在AI领域积极布局!

    电子发烧友网报道(文/李弯弯)在AI大浪潮的席卷下,越来越多具备多模态能力的AI模型加速涌现,AI推理芯片逐渐成为市场焦点,以期支撑大模型
    的头像 发表于 04-09 00:13 3979次阅读
    <b class='flag-5'>RISC-V</b>厂商正在<b class='flag-5'>AI</b>领域积极布局!

    什么是RISC-VRISC-V的关键技术

    RISC-V不仅仅是一个流行语;它建立在坚实的技术基础之上,使其有别于其他指令集架构 (ISA)。RISC-V的核心是基于精简指令集计算(RISC)原则,强调效率和性能。
    发表于 03-26 09:34 2577次阅读

    什么是RISC-V

    siFive搞RISC-V 赛昉搞RISC-V 香山搞RISC-V 到底什么是RISC-V? 先不问有什么用,RISC-V目前的能力来说,工
    发表于 02-02 10:41

    RISC-V内核突破百亿颗 RVV1.0如何解锁端侧AI市场应用潜能

    ”(南湖)开源高性能RISC-V处理器内核,其性能已超过ARM A76;阿里平头哥发布的首个自研RISC-V AI平台,支持运行170余个主流AI
    发表于 12-01 13:17

    RISC-V mcu何时进军AI

    今天看了篇文章,讲述MCU界“六大天王”ST、NXP、Microchip、Renesas、TI、Infineon都在加大布局边缘AI,这也应该是RISC-V MCU 的一次机遇啊!
    发表于 11-04 09:58

    RISC-V强势崛起为芯片架构第三极

    全球首款RISC-V大小核处理器面市、全球首款RISC-V笔记本正式交付、全球首款开源万兆RISC-V网络交换机亮相、RISC-V融合服务器全球首发、平头哥推出首个
    发表于 08-30 13:53

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    转自https://m.ithome.com/html/714391.htm 2023 RISC-V 中国峰会8月23日在北京召开,平头哥在会上发布了首个自研 RISC-V AI 平台。 据介绍,
    发表于 08-26 14:14

    平头哥推出首个RISC-V AI平台,软硬协同较经典方案提升性能超8成

    平台,通过软硬件深度协同,较经典方案提升超8成性能,支持运行170余个主流AI模型,推动RISC-V进入高性能AI应用时代。 2023 RISC-V
    的头像 发表于 08-25 12:05 554次阅读
    平头哥推出首个<b class='flag-5'>RISC-V</b> <b class='flag-5'>AI</b>平台,软硬协同较经典方案提升性能超8成

    RISC-V 跑大模型(三):LLaMA中文扩展

    这是RISC-V跑大模型系列的第三篇文章,前面我们为大家介绍了如何在RISC-V下运行LLaMA,本篇我们将会介绍如何为LLaMA提供中文支持。
    的头像 发表于 07-17 17:15 627次阅读
    <b class='flag-5'>RISC-V</b> 跑大<b class='flag-5'>模型</b>(三):LLaMA中文扩展

    RISC-V 跑大模型(二):LLaMA零基础移植教程

    这是RISC-V跑大模型系列的第二篇文章,主要教大家如何将LLaMA移植到RISC-V环境里。
    的头像 发表于 07-17 16:16 1097次阅读
    <b class='flag-5'>RISC-V</b> 跑大<b class='flag-5'>模型</b>(二):LLaMA零基础移植教程

    RISC-VRISC-V AI的未来(特邀讲座)

    主题演讲:RISC-VRISC-V AI的未来(特邀讲座)ppt分享
    发表于 07-14 17:15 11次下载

    RISC-V设计支持工具,支持RISC-V技术的基础

    RISC-V设计支持工具,支持RISC-V技术的基础 ppt分享
    发表于 07-14 17:15 12次下载

    RISC-V跑大模型(二):LLaMA零基础移植教程

    这是RISC-V跑大模型系列的第二篇文章,主要教大家如何将LLaMA移植到RISC-V环境里。
    的头像 发表于 07-10 10:10 875次阅读
    <b class='flag-5'>RISC-V</b>跑大<b class='flag-5'>模型</b>(二):LLaMA零基础移植教程