0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT爆火,国内算力厂商如何把握机会?

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-03-02 01:12 次阅读
电子发烧友网报道(文/李弯弯)近段时间,由OpenAI推出的ChatGPT火遍全球,它几乎可以生成任何形式的文本,从写文章、编写代码,到回答复杂的数学问题。上线近两个月,ChatGPT的注册用户就达到1亿,成为史上用户破亿速度最快的软件之一。

ChatGPT的爆火给生成式AI的应用带来更多可能性,AI语言处理大模型也随之进入全球角逐的新阶段。在国内,百度、阿里等头部互联网企业都已经宣布有相关的研究。那么,国内在发展AI语言处理大模型方面是否具备相应的条件,国产厂商可以如何把握这个机会?

在AIGC大模型发展上,国内具备哪些条件

从目前的情况来看,国内在发展这类大模型上可以说已经具备一定的条件。比如在算法层面,国内的互联网公司以及一些研究院,已经具备研究语言大模型的基础;在算力层面,国内的AI大算力芯片,以及在算力集群方面,也已经取得长足进步;在部署和服务方面,国内的云服务厂商可以提供各种服务渠道,让基础设施能够便捷实用,使算法在大算力平台上很好的部署。

不足之处在于,第一,ChatGPT能够达到现在的水平,是因为它六七年长时间的产品迭代,从GPT-1到GPT-2再到ChatGPT期间有大量的用户使用,在数据集的标注、分拣、精炼上,也有很多创新的工程化步骤。对于中文大模型来说,差距在于如何获得更多、更有意义,更有价值的语义语料,如何在算法迭代、大量的用户使用之后,使能更大规模模型的推进。

第二,大模型的训练离不开大算力,燧原科技创始人兼COO张亚林在接受电子发烧友采访的时候表示,目前国际厂商的高算力芯片在中国仍然具有标杆效应。

第三,在生态建设上,无论是现在很火的ChatGPT,还是之前备受关注的生成式AI公司Stability、Runway,他们在基础模型、大模型的模型开发库,用户大量的应用上,都已经形成了可以触达终端用户的商业模式。而在国内,目前还没树立起这样全栈的生态和商业模式。

不过,虽然国内在发展这类大模型方面存在不足,整体而言这对于国内厂商来是个很好的机会。从算力方面来看,人工智能技术的发展和应用本身对算力的需求极大,目前全球大模型训练的算力基本以英伟达为主。

随着ChatGPT的爆火,国内各类生成式AI大模型的训练和部署将会加速,这对国内人工智能算力厂商来说无疑是个机会,国内厂商需要思考如何通过自身的算力发展,来持续推动中国本土大模型的进步。

ChatGPT爆火,算力厂商如何把握机会

那么AIGC大模型的训练和推理,对算力供应商有怎样的要求呢?对此,张亚林谈到了几点:首先是芯片,包括芯片的有效算力、架构的创新性、以及芯片的性价比等,这些将会决定算力集群是否具备足够的市场竞争力。

其次是集群系统,一个超大规模的集群系统,由几千张加速卡、几千颗芯片组成,还包括互联和存储。除了加速卡的性能之外,还要看整个系统的稳定性、集群的互联效率、存储的效率、以及分布式系统运行的稳定性。

第三是软件生态,它是否能够支持整个大模型的调试和开发。这要求企业不仅要能提供基础的软件栈,还要能够提供大模型能跑的分布式框架,让调试者和开发者能够更好的调试和开发这些大模型,就是说还需要具备一个整套的软件栈。

张亚林认为,从芯片设计,集群的稳定性,到整个软件栈的完备性,这对于初创公司来说还有一段很长的路要走,需要持续的产品迭代。

那么国内在AI大算力芯片或者GPGPU赛道的厂商,如何能够抓住ChatGPT这波浪潮带来的机会呢?首先,它需要做出高性价比的算力,现在来说这样的算力还太贵,以致于并不是所有人都能够玩得起这场游戏,企业需要能够推出高性价比的集群,让整个ChatGPT类大模型的开发更经济。

第二,最终呈现在用户侧的是整个的集群系统,就如上文所言,其中包括几千张加速卡,几千颗芯片,大量的互联和存储,很多服务器。因此,国内的AI大芯片厂商需要能够站到系统的角度去看问题,包括整个系统的设计、调动能力、让用户易用,这些跟芯片本身的设计和开发能力会不太一样。

第三,如何让用户在开发过程中做到高效和易用。训练本身是一个很复杂、很广阔的生态。今天的大模型,其实是把很广阔的需求浓缩到了一些比较确定的大模型上,这让整个训练从很广阔的发散状态,变成了有可能聚焦在某一些维度上就能够很好的支撑和优化的状态。

这给国内很多AI厂商提供了很好的思路,企业可以聚焦在比如大模型集群化的领域。国内厂商可以由此切入,谁能够在这样一个大规模AI生成领域,把训练和推理整套集群系统,做得更优化、更完整、更易用,谁就能够在这场游戏中拔得先机。

在人工智能算力领域,燧原科技已经有了很深的积累。目前燧原科技已经迭代了两代训练和推理产品,第三代也已经在研发中。此外,燧原科技已经在科研领域和智慧城市的应用中落地了训练和推理的超千卡算力集群。张亚林表示,类似ChatGPT这样的AIGC生成式模型,对于燧原科技而言是个机遇,公司可以把已经积累的系统集群的经验推广到更多的客户赛道上,帮助客户使能更多大模型的生成。

同时,面对生成式AI大模型带来的发展机会,燧原科技将从多个方面去做深度布局。第一是持续推进和迭代集群化产品和软件生态栈,与更多战略用户一起优化集群系统,提高性价比和能效比;第二是与国内云服务商进行深度合作,通过他们的云服务平台,触达更多To B和To C用户;第三是与国家相关机构合作制定更多关于AIGC标准和白皮书,探讨未来发展方向,与国家政策和标准融合;第四是与更多大模型厂商、云平台厂商等一起共创生态。

小结

整体而言,虽然目前ChatGPT仍然还存在一些问题,不过它的强大功能却是有目共睹。对于人们的生产生活来说,ChatGPT等大模型的发展将会带来劳动力的释放。

未来随着模型的进一步扩大,数据集进一步加强,AIGC这类巨大模型将会愈发智能,它也将会更加逼近人们所说的通用人工智能(AGI),而这个过程必然给相关产业带来机会,包括算力,而对于用户来说,厂商如何提供更高能效比、性价比的算力是关键。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算力
    +关注

    关注

    1

    文章

    917

    浏览量

    14711
  • ChatGPT
    +关注

    关注

    29

    文章

    1547

    浏览量

    7418
收藏 人收藏

    评论

    相关推荐

    浅析三大之异同

    随着一年多前ChatGPT的出现引爆人工智能(AI)浪潮,支撑大模型背后的“”概念突然闯进我们的视野,成为科技圈炙手可热的新词,引领着最新潮流。作为数字经济时代新生产,也许不少人
    的头像 发表于 08-30 12:56 610次阅读
    浅析三大<b class='flag-5'>算</b><b class='flag-5'>力</b>之异同

    国内最大智中心月底在哈尔滨投用

    国内领域迎来重大进展,中国移动智中心(哈尔滨)节点即将于8月30日正式启用,标志着国内最大的智
    的头像 发表于 08-23 18:15 1545次阅读

    摩尔线程张建中:以国产助力数智世界,满足大模型需求

    摩尔线程创始人兼CEO张建中在会上透露,为了满足国内对AI的迫切需求,他们正在积极寻求与国内顶尖科研机构的深度合作,共同推动更大规模的AI智
    的头像 发表于 05-10 16:36 868次阅读

    力系列基础篇——101:从零开始了解

    相信大家已经感受到,我们正处在一个人工智能时代。如果要问在人工智能时代最重要的是什么?那必须是:
    的头像 发表于 04-24 08:05 1002次阅读
    <b class='flag-5'>算</b>力系列基础篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>101:从零开始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    十问:超,通存比

    邬贺铨指出,现有测算方法难以精准衡量国内企业服务器的出货量并不等于国内市场的使用量,而且进口国外的服务器未统计在内;服务器出货量也不等于上架量,更不等于已经加电使用量。通常服务器
    的头像 发表于 04-13 11:40 4177次阅读

    Sora引全球需求激增?赛思时间同步技术使如虎添翼!

    近日,联想集团杨元庆表示,Sora的推出会加大全球AI的需求,会进一步带动AI的普及和平民化应用。从供给侧来看,这一方面会提高对传统性能的要求,另一方面也需要进行新的技术创新。赛思时频创新技术使
    的头像 发表于 03-01 10:36 423次阅读
    Sora<b class='flag-5'>爆</b><b class='flag-5'>火</b>引全球<b class='flag-5'>算</b><b class='flag-5'>力</b>需求激增?赛思时间同步技术使<b class='flag-5'>算</b><b class='flag-5'>力</b>如虎添翼!

    Sora需求引发业界对集结国内AI企业的探讨

    据周鸿祎观察,Sora视频分析所需恐远超千亿规模模型。因而,考虑到如今国内芯片供应受限,问题至关重要。事实上,Meta已有约50万台
    的头像 发表于 02-25 10:03 534次阅读

    智能规模超通用,大模型对智能提出高要求

    电子发烧友网报道(文/李弯弯)是设备通过处理数据,实现特定结果输出的计算能力,常用FLOPS作为计量单位。FLOPS是Floating-point Operations Per Second
    的头像 发表于 02-06 00:08 6037次阅读

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    ChatGPT芯片如何做输出

    卡的核心当然还是计算芯片,会搭配大容量高带宽的内存、缓存,以及搭载CPU用于调度,为了帮助数据传输,便会使用高速通道,这便是PCIe(高速串行计算机扩展总线标准)在系统中的作用:提供总线通道。
    发表于 01-11 10:01 446次阅读
    <b class='flag-5'>ChatGPT</b><b class='flag-5'>算</b><b class='flag-5'>力</b>芯片如何做<b class='flag-5'>算</b><b class='flag-5'>力</b>输出

    芯科技,解密ChatGPT畅聊之芯片

    在今日飞速发展的科技浪潮中,OpenAI的ChatGPT如一颗璀璨明星,引领着智能对话的新潮流。ChatGPT不仅是一款聊天机器人程序,它背后的驱动力是一个庞大而复杂的网络。这个网
    的头像 发表于 12-27 07:45 922次阅读
    芯科技,解密<b class='flag-5'>ChatGPT</b>畅聊之<b class='flag-5'>算</b><b class='flag-5'>力</b>芯片

    浅谈为AI大而生的存-体芯片

    大模型之后,存一体获得了更多的关注与机会,其原因之一是因为存一体芯片的裸
    发表于 12-06 15:00 365次阅读
    浅谈为AI大<b class='flag-5'>算</b><b class='flag-5'>力</b>而生的存<b class='flag-5'>算</b>-体芯片

    什么是可分为哪些类别?

    计算是人类解决问题的一种方式。 在漫长的历史长河中,人类遇到过很多问题,都需要通过计算来解决。这些计算任务,仅凭大脑这个“原生”工具,是无法完成的。 于是,人类发明了很多
    的头像 发表于 11-20 09:27 1.3w次阅读
    什么是<b class='flag-5'>算</b><b class='flag-5'>力</b>?<b class='flag-5'>算</b><b class='flag-5'>力</b>可分为哪些<b class='flag-5'>算</b><b class='flag-5'>力</b>类别?

    到底什么是的作用?

    的字面意思,大家都懂,就是计算能力(Computing Power)。
    的头像 发表于 11-20 09:26 1779次阅读
    到底什么是<b class='flag-5'>算</b><b class='flag-5'>力</b>?<b class='flag-5'>算</b><b class='flag-5'>力</b>的作用?

    不到1分钟开发一个GPT应用!各路大神疯狂整活,网友:ChatGPT就是新iPhone

    的能力仍然是不可替代的。 此外,ChatGPT等语言模型的应用也需要大量的数据和支持,以及专业的技术人员进行开发和维护。因此,虽然ChatGPT等语言模型在某些方面具有一定的优势,
    发表于 11-19 12:06