0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI大模型进化方向:百万级训推一体机降至千元级后,推理芯片性能将成重点

Monika观察 来源:电子发烧友网 作者:莫婷婷 2024-04-15 07:29 次阅读
电子发烧友网报道(文/莫婷婷)AI大模型应用在2024年进入新的阶段。Transformer等技术正在推动着行业从单一模态的大语言模型,向多模态大模型进化。
业内普遍认为,未来3到5年我们会快速迈入AI3.0时代,届时进入以机器人为代表的具身智能时代,当人形机器人搭载了多模态大模型,和物理世界进行交互后,就会发展成行为大模型,成为自进化智能体,进一步实现AGI通用人工智能,由此打开第四次工业革命的大门。
云天励飞董事长兼CEO陈宁认为,未来3年全球80%的企业将使用大模型,未来5年机器人和数字人的数量将超越人类的数量,未来7年,也就是到2030年行业将实现通用人工智能,AI的智慧程度超越全人类大脑的组合。
他进一步提到,我们还有3年的时间可以转型到大模型时代,借助大模型生产力的变革去赋能企业。那么,企业如何拥有属于自己的大模型,训推一体机成为焦点之一。
千元级AI模盒,大模型进入平民化阶段
目前,行业内已经有多家企业推出训推一体机,但是在训练专属大模型过程中,训推一体机的痛点也随之暴露出来。成本是其中一个关键问题,主流的训推一体机价格普遍在百万级。另外还有大参数、大算力、大数据、专业人才等,要知道GPT-4模型训练数据ToKen量已经达到130000亿。为了加速AI普惠化,训推一体机亟需迭代。
就在今年3月,云天励飞推出“深目”AI模盒,面向边缘训推场景。官方介绍,“深目”AI模盒搭载了自研的14nm Chiplet大模型边缘训推芯片DeepEdge10 Max、自研多模态大模型“云天天书”,基于云天励飞的核心能力算法芯片化,实现了算法场景覆盖超过90%、算法精度超过90%,使用成本降低90%。其中,DeepEdge10 Max适配并可承载10亿级SAM、百亿级Llama2等大模型运算。
值得一提的是,“深目”AI模盒售价在千元级。可以说,在一定程度上,云天励飞将训推一体机“打下”千元级,促进了大模型平民化,解决大模型在场景落地最后一公里的问题,帮助更多中小企业客户轻松使用大模型。
智慧城市场景里还存在非常多的问题没有完全解决,例如长尾场景,只有一个模型能够解决跨场景的问题,才有可能低成本解决智慧城市的碎片化问题。
在现实问题中,天灾人祸等极端场景识别训练的数据几乎空白,云天励飞副总裁罗忆以加油站场景的吸烟识别为例进行介绍,平台能够利用大模型能力,以加油站为背景,生成在该环境抽烟行为的人物,并将数据用于算法训练中,填补训练数据的空白。
“我们通过可控的生成,对于指定的场景、部位可以做到细节可控、真实合理、高保真,而且可以批量生成数据。”目前,云天励飞已经生成了千万级的数据用于各类算法的训练,而且生成的数据不仅能够用于算法的训练,还能用于算法能力的测试。
“从生成训练到检测,这个闭环打通,也为将来它的自学习奠定基础。”罗忆再次表示。使用AI合成数据来训练算法,逐渐成为大模型时代下训练新算法和提升算法精度的方式之一。
推理芯片将是AI大模型的发展关键之一
未来,AI大模型的发展一定是降低推理成本,陈宁在接受电子发烧友网等媒体采访时表示,关于大模型的训练,业内的重视度已经比较高了,GPU一卡难求,中国也掀起了智算,上下游的企业都参与到智能算力的建设过程中,云天励飞也抓住了机遇。“我们认为2024年如果是大模型落地应用之年,推理就会越来越重要。”
云天励飞自成立之初就将AI芯片定位在推理的应用,此次将其在推理领域的深厚技术积累赋能给了“深目”。
“深目”内置了自研的SPACE训练推理引擎,罗忆表示,“我们要让大模型在边缘侧跑起来,不仅要推理,还要具备一定的训练能力,要提高它的精度,首先要解决速度的问题,确保训练有效的前提下,只要进行少样本的训练,即可进行场景自适应。”
根据介绍,基于SPACE训练推理引擎的高效训练架构,对比全量训练,“深目”AI模盒训练速度提升100倍,内存消耗降低20倍。通过混合精度训练,模型99%的计算采用int8+fP16精度训练,只有不到1%的计算才用得fp32精度训练。而且做到了存储及功耗均大幅下降,推理速度同比提升50%,推理成本更是降低10倍。
通过SPACE训练推理引擎和神经网络处理器芯片架构的深度耦合,“深目”在边缘端48T至64T的有限算力情况下,一样可以实现高精度的推理大模型,并且可以微调和训练。陈宁表示,面向边缘场景,云天励飞强化了多模态大模型场景泛化和在线学习、训练的能力,通过一系列的性能提升,解决场景价值闭环的问题。
一般来说,AI芯片可以分为两种:推理芯片、训练芯片。“但是算法的训练不是目的,千行百业的推理应用才是最终目的,人形机器人、无人机、无人车、可穿戴设备、AIPC、AI手机等,万物智联的智能硬件都需要一颗或者几颗神经网络处理器的推理芯片”,陈宁表示。
2024年,AI行业在推理芯片领域迎来了新的进展。例如,AI芯片创企Groq自研的新型AI芯片——LPU(Language Processing Units)在AI行业内“出圈”,该芯片专为AI推理而生。公开资料显示,由Groq LPU驱动Meta Llama 2模型,推理性能可以做到顶级云计算供应商的18倍。英伟达在GTC 2024上也发布了全新的 GPU——Blackwell芯片,推理能力是Hopper的30倍。
如今,推理芯片领域还没有垄断性的巨头,推理芯片是一个万亿颗芯片的大蓝海市场,而中国市场拥有丰富的场景,未来推理芯片会应用到各个行业中,解决各个场景的问题,国内的AI芯片企业也会在推理芯片领域迎来新的进展。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 云天励飞
    +关注

    关注

    0

    文章

    140

    浏览量

    11419
  • AI大模型
    +关注

    关注

    0

    文章

    334

    浏览量

    380
收藏 人收藏

    评论

    相关推荐

    中科曙光推出DeepSeek人工智能一体机

    为满足用户对DeepSeek的多方位需求。近日,中科曙光推出DeepSeek人工智能一体机。该一体机集多形态曙光高端计算服务器、高效能基础模型、全流程AI工具链于
    的头像 发表于 02-21 11:40 430次阅读

    DeepSeek一体机:加速AI超融合,推动行业智能化落地

    本地部署推出FusionCube A3000超融合一体机,以“数据-模型-应用”全流程创新,破解大模型落地难题,助力企业低成本、高质量推
    的头像 发表于 02-20 11:14 326次阅读
    DeepSeek<b class='flag-5'>一体机</b>:加速<b class='flag-5'>AI</b><b class='flag-5'>训</b><b class='flag-5'>推</b>超融合,推动行业智能化落地

    格灵深瞳发布全国产超融合大模型一体机

    模型一体机最大的亮点在于其支持单台运行DeepSeek-R1满血版。DeepSeek-R1是格灵深瞳自主研发的款高性能AI
    的头像 发表于 02-19 15:37 399次阅读

    华为推出昇腾DeepSeek大模型一体机

    DeepSeek大模型的横空出世,让AI正以前所未有的速度重塑各行各业的发展格局。昇腾DeepSeek一体机深度融合昇腾高性能算力底座与DeepSeek全系列大
    的头像 发表于 02-18 09:56 1179次阅读

    澎峰科技发布万DeepSeek智算一体机

    满血DeepSeek智算一体机——智算先锋Deep Fusion DF100。 这款划时代的产品不仅将大模型的私有化部署带入了万时代
    的头像 发表于 02-17 11:04 1084次阅读

    宁畅推出DeepSeek大模型一体机

    为加速人工智能大模型技术在企业场景中的规模化落地,宁畅正式发布DeepSeek大模型一体机解决方案。作为款面向企业的“开箱即用”智能算力
    的头像 发表于 02-15 14:51 810次阅读

    云从科技从容大模型一体机成功适配DeepSeek

    了新的动能。 从容大模型一体机是云从科技基于昇腾AI基础软硬件平台推出的创新产品。该产品集成了大模型
    的头像 发表于 02-14 15:44 451次阅读

    云天天书大模型一体机成功适配DeepSeek

    近日,云天天书大模型一体机成功适配DeepSeek。该一体机由云天励飞与华为联合推出,可以部署在华为昇腾服务器上,支持私有化部署,实现开
    的头像 发表于 02-14 11:02 336次阅读

    新华三发布DeepSeek大模型一体机UniCube

    ,为各行各业的智能进化注入了全新动力。 UniCube一体机实现了671B DeepSeek大模型的单机推理及单机
    的头像 发表于 02-11 15:21 998次阅读

    智海AI教育一体机:加速人工智能教育普及

    壁仞科技携手中兴通讯、浙江大学上海高等研究院及蓦科技,共同推出了智海AI教育一体机。这款一体机产品是壁仞科技针对行业特定需求,联合多方力量共同打造的自主原创之作。 智海
    的头像 发表于 02-11 11:47 416次阅读

    图为大模型一体机新探索,赋能智能家居行业

    与效率。 其中,图为AI模型一体机作为人工智能领域的最新成果,正逐步成为智能家居行业的重要驱动力。本文将深入探讨图为图为AI模型
    的头像 发表于 10-24 11:05 376次阅读

    浪潮信息发布脑企智一体机

    在2024中国算力大会上,浪潮信息正式发布了其创新的脑企智一体机。这款一体机融合了脑企智EPAI企业大模型开放平台和
    的头像 发表于 09-30 16:50 1677次阅读

    雷曼智慧一体机获得最高能效等级一级认证

    近日,雷曼智慧会议/教育交互大屏(以下简称“雷曼智慧一体机”)成功通过国家权威认可实验室的检测认证,依据最新国家标准《显示器能效限定值及能效等级》(GB 21520-2023),其能源效率等级达到高性能LED一体机的最高等级
    的头像 发表于 08-26 09:58 721次阅读

    澎峰科技CA100智能计算一体机核心优势解读

    CA100 智能计算一体机 日前,澎峰科技正式对外发布CA100智能计算一体机产品, CA100智能计算一体机 是面向高性能计算、AI
    的头像 发表于 07-08 10:59 1014次阅读
    澎峰科技CA100智能计算<b class='flag-5'>一体机</b>核心优势解读

    【机器视觉】欢创播报 | 百度智能云发布帆大模型一体机

    1 百度智能云发布帆大模型一体机 编辑 ​ 4月9日上午,百度智能云GENERATE全球生态大会在成都召开。会上,百度智能云发布帆大模型
    的头像 发表于 04-11 10:49 702次阅读
    【机器视觉】欢创播报 | 百度智能云发布<b class='flag-5'>千</b>帆大<b class='flag-5'>模型</b><b class='flag-5'>一体机</b>