0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型引发技术变革, AI芯片公司面临新挑战

智能计算芯世界 来源:机器之心 2023-05-04 09:47 次阅读

ChatGPT 在全球范围内掀起了一场技术革命与商业浪潮,AI 市场也迎来了前所未有的机遇与增量。

当前,AI 基础设施的算力、算法呈现新 “摩尔定律”:相同算力下能训练生产更优质的模型,同时最先进的 AI 模型约每几个月算力需求就会扩大一倍。

14d12908-e8b6-11ed-ab56-dac502259ad0.png

根据斯坦福大学和麦肯锡联合发布的《2019 人工智能指数报告》,2012 年之前最先进 AI 模型计算量每两年翻一倍;2012 年之后计算量每 3.4 个月翻一番,从 2012 年到 2020 年 3 月已增长 30 万倍。

伴随着大模型的快速迭代,其对算力的要求也不断提高,而算力的核心就是人工智能芯片。因此,如何在新趋势、新挑战下快速响应客户需求,推出切实可用的软硬件解决方案,成为了摆在国内 AI 芯片企业面前的首要课题。

拥抱变化,聚焦提升产品

ChatGPT 及大模型技术大会上,昆仑芯科技研发总监王志鹏表示:“作为一家芯片公司,需要对市场的需求和变化非常敏感,才能使硬件产品始终精准匹配主流需求。”

大模型对计算的要求主要体现在三个方面,一是算力,二是互联,三是成本。就大模型而言,昆仑芯科技在产品定义上已经做出布局 —— 相较第一代产品,昆仑芯 2 代 AI 芯片可大幅优化算力、互联和高性能,而在研的下一代产品则将提供更佳的性能体验。

昆仑芯科技成立于 2021 年,前身为百度智能芯片及架构部。在实际业务场景中深耕 AI 加速领域已逾 10 年,专注打造拥有强大通用性、易用性和高性能的通用人工智能芯片。

在持续推进核心技术攻关的同时,昆仑芯科技紧密关注科技前沿,精准匹配市场需求。目前,公司已实现两代通用 AI 芯片的量产及落地应用,在互联网、智慧金融、智慧交通等领域已规模部署数万片。

14eff248-e8b6-11ed-ab56-dac502259ad0.png

昆仑芯在大模型场景的规模落地实践

“来自真实场景” 一直是昆仑芯科技最独特的身份标签,也是其规模部署数万片、在行业内 “领跑落地” 的核心优势所在。

王志鹏认为,只有基于真实业务场景中的数据进行端到端优化,才能顺利推进大模型落地。

目前市场上主流的大模型以 Transformer 架构为主,包含 Encoder 和 Decoder。Encoder 主要被应用于各类 NLP 的判别类任务;而 Decoder 更多被应用于翻译、图文生成等场景,最近出圈的 ChatGPT 就是典型代表。

针对大模型,昆仑芯持续打磨部署优化方案,领跑产业落地。昆仑芯已将大模型的 Transformer 相关优化技术沉淀为重要基建,优化后的性能比原有方案提升 5 倍以上,压缩显存 30% 以上。

以文生图大模型为例,昆仑芯已跑通一条端到端优化、规模落地之路。

AI 绘画模型的推理算力及显存需求随图像分辨率增大而指数级增加,同时,图像生成需要循环采样数十次,产业落地动辄需要高昂成本的部署集群,严重阻碍了 AIGC 模型大规模商业化落地。

2022 年第四季度,昆仑芯联合客户,基于飞桨 PaddlePaddle 发起了端到端联合优化项目。在 2-3 周内,项目组快速完成端到端优化,最终实现输入文本后 2 秒出图的优化效果,性能提升近 8 倍。

目前,昆仑芯 AI 加速卡 R200 已在该客户的大模型场景完成规模部署,性能数据全面超越同系列主流推理卡:

基于昆仑芯 AI 加速卡 R200 高效运算与推理能力,综合优化方案,在 dpm-25steps 算法下,利用昆仑芯 AI 加速卡 R200,生成 1024*1024 图像时的推理速度为 10.89 iters/s,相比同能力的主流推理卡快 20%。

昆仑芯 AI 加速卡 R200 拥有 32G GDDR6 显存,为大规模参数提供更大的存储容量、更高带宽的内存访问、更稳定的性能,生成更高分辨率的图片,为用户提供高性价比服务。

与此同时,面向当前市场需求迫切的大模型场景,据悉昆仑芯科技即将推出一款加速器组解决方案。

该加速器组搭载第二代昆仑芯 AI 芯片,是 AI 基础设施的重要组成部分,为 AI IAAS 平台、 AI PAAS 平台提供坚实算力支撑。该产品可提供更为集约的 AI 算力,具备分布式集群部署能力,支持弹性 RDMA 网络,对比传统网络通信时延降低 2~3 倍。该产品可明显提高并行加速比,训推一体化助力提高资源利用率,极大提升模型开发迭代效率。

携手上层伙伴共拓 AI 芯生态

ChatGPT 及大模型技术大会上,与会者提问:在生态建设方面,国内 AI 芯片产业面临的客观情况是什么?

这也是昆仑芯科技经常被客户提及的现实问题。

昆仑芯科技在努力进一步扩大生态影响力:首先要深刻理解客户的使用习惯,满足客户需求,踏踏实实把软硬件从产品和技术上做到位。随着产品的规模部署,客户越来越多,生态也就自然而然建立起来了。与此同时,产品也会因此得到更好的打磨,进入良性循环。

在昆仑芯科技看来,AI 芯片看似是一个硬件,但其本质则是一款软件产品。这也证明了软件栈、生态对于 AI 芯片发展的关键作用。

目前,昆仑芯已实现对飞桨的原生适配,并完成了 III 级兼容性测试,训练与推理性能可以满足用户的应用需求。从底层 AI 算力组件、AI 服务器,到操作系统,再到昆仑芯 SDK,昆仑芯和飞桨携手完成了一套端到端的 AI 计算系统解决方案,并致力于打造一个全栈式软硬一体的 AI 生态。

为进一步完善软件生态,昆仑芯已与多款通用处理器、操作系统、主流框架完成端到端适配,实现了软硬件解决方案的技术栈,为客户提供开箱即用的 AI 芯片产品。

15015312-e8b6-11ed-ab56-dac502259ad0.png

昆仑芯软件栈

结语

谈及大模型趋势下 AI 芯片公司面对的变化,王志鹏说道: “必须快速调整心态,并拥抱大模型带来的变化。”

而这也刚好印证了昆仑芯科技 “突破创新” 的公司文化:面对瞬息万变的外部环境,突破创新是适应行业的唯一方式。

面对复杂多变的市场环境以及新场景新应用对研发和落地的重重挑战,国内 AI 芯片公司如何出圈?

集十余年 AI 加速领域的技术积淀,曾任百度智能芯片及架构部首席架构师、现任昆仑芯科技 CEO 欧阳剑认为,“AI 芯片公司应抓住场景和技术创新‘双驱动’模式,驱动架构优化升级与软硬件产品迭代,这是持续保持竞争力的关键。”

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29892

    浏览量

    268180
  • 智能芯片
    +关注

    关注

    0

    文章

    136

    浏览量

    25232
  • ChatGPT
    +关注

    关注

    29

    文章

    1547

    浏览量

    7399

原文标题:大模型引发技术变革, AI芯片公司面临新挑战

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【书籍评测活动NO.49】大模型启示录:一本AI应用百科全书

    自小型机发明后,我们经历了3次大的科技变革:PC互联网时代,移动互联网时代,以及离我们最近的云计算时代。 如果说在上一次云计算变革中,很多公司落下队伍是因为态度和认知,那在这一次大模型
    发表于 10-28 15:34

    亿铸科技熊大鹏探讨AI大算力芯片挑战与解决策略

    在SEMiBAY2024《HBM与存储器技术与应用论坛》上,亿铸科技的创始人、董事长兼CEO熊大鹏博士发表了题为《超越极限:大算力芯片技术挑战与解决之道》的演讲,深入剖析了
    的头像 发表于 10-25 11:52 306次阅读

    AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    计算的结合 我深刻体会到高性能计算(HPC)在AI for Science中的重要性。传统的科学计算往往面临计算量大、计算时间长等问题,而AI技术的引入可以显著提高计算效率。同时,HP
    发表于 10-14 09:16

    当前主流的大模型对于底层推理芯片提出了哪些挑战

    随着大模型时代的到来,AI算力逐渐变成重要的战略资源,对现有AI芯片也提出了前所未有的挑战:大算力的需求、高吞吐量与低延时、高效内存管理、能
    的头像 发表于 09-24 16:57 554次阅读

    Meta发布Imagine Yourself AI模型,重塑个性化图像生成未来

    Meta公司近日在人工智能领域迈出了重要一步,隆重推出了其创新之作——“Imagine Yourself”AI模型,这一突破性技术为个性化图像生成领域带来了前所未有的
    的头像 发表于 08-26 10:59 439次阅读

    亿铸科技谈大算力芯片面临技术挑战和解决策略

    随着人工智能技术的飞速发展,算力已成为推动产业变革的关键力量,但大模型的快速发展,参数的爆发,对于算力需求也提出了更高的要求,带来了全新的挑战。那大算力
    的头像 发表于 08-07 10:03 668次阅读

    AI模型与传统AI的区别

    AI模型(如LLM,即大型语言模型)与传统AI在多个方面存在显著的区别。以下将从技术层面、应用场景、性能表现、计算资源和成本、以及发展趋势
    的头像 发表于 07-15 11:37 2174次阅读

    AI模型的发展历程和应用前景

    领域取得重要突破。本文将深入解析AI模型的基本原理、发展历程、应用前景以及面临挑战与争议,为读者提供一个全面而深入的科普视角。
    的头像 发表于 07-03 18:20 1067次阅读

    高盛报告引发对科技公司AI投资回报的热烈讨论

    在科技浪潮汹涌澎湃的当下,人工智能(AI技术无疑是引领这场变革的领航者。然而,当科技公司纷纷加大在AI领域的投资力度时,高盛近期发布的一份
    的头像 发表于 07-01 17:13 393次阅读

    模型时代,程序员当下如何应对 AI挑战

    随着 AI 技术的飞速发展,特别是大模型的出现,传统的程序员角色正在经历深刻的变革,我们不得不重新对自己进行审视和思考。 通用领域大模型的“
    的头像 发表于 06-28 16:19 494次阅读
    大<b class='flag-5'>模型</b>时代,程序员当下如何应对 <b class='flag-5'>AI</b> 的<b class='flag-5'>挑战</b>

    后摩智能引领AI芯片革命,推出边端大模型AI芯片M30

    在人工智能(AI技术飞速发展的今天,AI模型的部署需求正迅速从云端向端侧和边缘侧设备迁移。这一转变对AI
    的头像 发表于 06-28 15:13 622次阅读

    “从无处不在到无人不用”,大模型推动边缘计算变革的机遇与挑战

    《从云到端 AI触手可及》2024年芯原AI专题技术研讨会上,芯原执行副总裁、IP事业部总经理戴伟进作了“大模型推动边缘计算变革的机遇与
    的头像 发表于 06-18 16:11 1042次阅读
    “从无处不在到无人不用”,大<b class='flag-5'>模型</b>推动边缘计算<b class='flag-5'>变革</b>的机遇与<b class='flag-5'>挑战</b>

    sora模型是什么意思 sora模型引发行业变革

    约为290亿美元),且文生视频大模型将会大幅推动人工智能基础设施的需求,英伟达、OpenAI、软银等巨头公司都被曝正在进行AI芯片的制造布局,英伟达也因大
    的头像 发表于 02-22 17:00 1751次阅读

    AI模型怎么解决芯片过剩?

    AI模型
    电子发烧友网官方
    发布于 :2024年01月02日 15:42:05

    模型时代,AI芯片面临的三大挑战

    AI算力需求的提升给中国本土芯片厂商的发展提供了较大的空间,带来新的机遇。IDC预计,2023年中国人工智能芯片出货量将达到133.5万片,同比增长 22.5%。
    发表于 12-14 10:15 1254次阅读
    大<b class='flag-5'>模型</b>时代,<b class='flag-5'>AI</b><b class='flag-5'>芯片面临</b>的三大<b class='flag-5'>挑战</b>