0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤绝影在行业率先实现原生多模态大模型的车端部署

商汤科技SenseTime 来源:商汤科技SenseTime 2024-07-23 10:52 次阅读

“基于原生多模态大模型,商汤绝影正在打造一系列全新的车载智能产品,推动智能汽车向超级智能体进化。”商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚在WAIC 2024商汤科技“大爱无疆·向新力”人工智能论坛上说。

一个超级智能体的进化离不开强大的端侧模型,大量原生多模态大模型正在从云走向智能汽车为代表的各种智能终端,车端模型部署能力将成为智能汽车进化过程中不可或缺的技术保障。

在论坛上,王晓刚宣布商汤绝影在行业内率先实现了原生多模态大模型的车端部署。绝影行业领先的车载端侧8B模型首包延迟可低至300毫秒以内,推理速度40 Tokens/秒,并且能够覆盖主流算力平台。

商汤绝影在行业率先实现

原生多模态大模型的车端部署

此前GPT-4o的发布为消费者展示了多模态实时交互的方式,让更多人领略多模态感知和交互的魅力,也开始帮助释放多模态大模型的商业落地想象空间。

相较于手机,智能汽车才是更适合承载多模态大模型的落地场景。因为智能汽车内外的各种摄像头是常开的,用户可以实时跟汽车通过多模态的方式进行交互。同时,智能汽车的保有量不断增加,能够产生丰富的终端用户反馈和数据信息,让模型不断迭代成长。

和OpenAI等公司相比,商汤绝影是汽车智能化的核心供应商,在智能驾驶和智能座舱领域具备丰富的量产经验,将以多模态大模型为核心加速“以人为本”的智能汽车交互革新。

但相比于其他的终端,智能汽车有其特殊性,对安全和实时响应有着非常高的要求,汽车是私密空间,终端用户非常在意隐私保护。这就注定了多模态大模型大部分的任务将在车载终端完成。商汤绝影能够以云侧、端云结合、端侧等全栈方式灵活部署多模态大模型,让商汤原生多模态能力能够快速落地智能汽车。

在WAIC 2024商汤人工智能论坛上,商汤绝影宣布在行业率先实现原生多模态大模型的车端部署,并在现场演示了搭载在200 TOPS+平台上的8B模型(即80亿参数)车端部署方案,展示强多模态感知和交互能力。

wKgaomafGuOAFfavAABeskhV_7o211.jpg

相较于动辄就有几秒钟延迟的云上部署方案,商汤绝影车载端侧8B多模态模型可以实现首包延迟可低至300毫秒以内,推理速度40 Tokens/秒,引领“以人为本”的智能汽车交互革新。

在WAIC 2024面向公众的展台上,商汤绝影还对外展示了在多个不同算力平台上运行2.1B或8B端侧多模态大模型的适配能力。

明年,上千TOPS算力的车载芯片就会问世。基于更高算力的计算平台,商汤绝影多模态大模型车端部署方案的首包延迟将大幅度降低,推理速度进一步提高,为用户带来更加流畅和自然的智能汽车交互体验。

引领多模态车端部署

商汤绝影有“杀器”

多模态大模型能够将语音、文字、图像、手势、视频等各种模态进行高效且深度地融合,提供更加丰富且自然的人机交互体验。

过去许多模型处理不同模态信息是先把语音等输入转化为文字,文字和图像结合进行分析,输出反馈也是先生成文字,根据文字再生成语音输出,会有大量信息丢失和很高的延迟。

由“日日新5.5”体系支持的全新商汤多模态大模型是一种端到端的模型,也就是文字、语音、视频等模态一同输入,模型统一处理后输出相应模态的信息,相较于过去的方案,多模态融合的技术难度是几何倍数的提升。

技术上的高难度是商汤行业领先的原生多模态能力的直接体现。今年4月发布的“日日新5.0”是国内首个对标GPT-4 Turbo的国产大模型,“日日新5.5”体系更是全面升级,数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标实现对标GPT-4o。

商汤持续迭代的“日日新”大模型体系是商汤绝影多模态的车端部署领先行业的底气所在,也是绝影的“大杀器”之一。

要让多模态大模型从云上落地到车端,商汤绝影还有更多的秘密武器。

由于车载硬件、系统种类繁多,各种加速芯片层出不穷,其他行业和开源的框架工具很难完全支持和适配,同时也为了解决自回归方式生成token效率较低的问题,商汤绝影专为多模态大模型打造了一个“大杀器”——高性能计算引擎“HyperPPL”。它综合了大语言模型、多模态模型、CNN模型、前后处理完整的优化能力,是智能汽车领域最广泛的高性能AI芯片异构计算平台,为商汤绝影多模态大模型落地车端提供强大的计算底座。

HyperPPL目前扩展并支持主流车载计算硬件,兼容多种主流操作系统,适配多个车载芯片的部署平台,使得商汤绝影原生多模态大模型在主流芯片平台均可快速部署上线。

同时,HyperPPL支持flash decode、segment prefill等400多个硬件算子,并对算子进行性能优化,同时量化支持int8、int4模式,并支持训练后量化,从而实现极致推理效率。相较于大多数开源的Python推理框架、C++推理框架以及训练推理框架,商汤绝影自研HyperPPL方案在Orin平台上的推理速度更快,超过40 Tokens/S。而对比英伟达的原生推理框架 TensorRT,绝影的HyperPPL在推理能力相当的情况下,在内存上有明显优势,即以更小的内存达到和前者相同的推理速度。

不仅如此,商汤绝影HyperPPL还针对车载多人场景进行优化,使得车内多人并发情况下,车端多模态大模型的模型推理效率相比单人没有明显降低。

这些“大杀器”为商汤绝影引领多模态大模型的车端部署保驾护航。基于车端原生多模态大模型,商汤绝影将与合作伙伴共同打造全新的车载智能化产品,引领“以人为本”的智能汽车交互革新,加速智能汽车驶入AGI时代。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1787

    文章

    46011

    浏览量

    234720
  • 商汤科技
    +关注

    关注

    8

    文章

    471

    浏览量

    35990
  • 大模型
    +关注

    关注

    2

    文章

    2117

    浏览量

    1947

原文标题:80亿参数,40 Tokens/秒,0.3秒延迟!商汤绝影行业首发原生多模态大模型车端部署

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    商汤发布国内首个病理大模型,开启病理诊断新篇章

    2024世界人工智能大会(WAIC)期间,作为全球医疗大模型创新先行者,商汤医疗携手瑞金医院、华西医院、新华医院、西京医院、中科大附属第一医院、北京清华长庚医院,在行业率先启动医疗
    的头像 发表于 09-02 09:21 407次阅读

    基于AX650N芯片部署MiniCPM-V 2.0高效模态模型

    2.8B参数。MiniCPM-V 2.0具有领先的光学字符识别(OCR)和模态理解能力。该模型在综合性OCR能力评测基准OCRBench上达到开源社区的最佳水平,甚至在场景文字理解方面实现
    的头像 发表于 07-15 09:34 513次阅读
    基于AX650N芯片<b class='flag-5'>部署</b>MiniCPM-V 2.0高效<b class='flag-5'>端</b>侧<b class='flag-5'>多</b><b class='flag-5'>模态</b>大<b class='flag-5'>模型</b>

    商汤科技推出SenseFoundry-VL方舟模态新智平台

    WAIC 2024期间,基于 “日日新5.5”大模型体系能力,商汤“方舟城市开放平台”进行全新产品架构升级, 推出首个“大模型+城市服务”的解决方案及应用实践「SenseFoundry-VL 方舟
    的头像 发表于 07-12 14:15 421次阅读
    <b class='flag-5'>商汤</b>科技推出SenseFoundry-VL方舟<b class='flag-5'>多</b><b class='flag-5'>模态</b>新智平台

    商汤“日日新”大模型全面赋能2024 WAIC

    7月6日,WAIC 2024迎来第三天。 商汤科技全新升级的「日日新SenseNova 5.5」备受热议,作为国内首个具备流式原生模态交互能力的大
    的头像 发表于 07-08 15:54 509次阅读

    商汤模型C助力LEVC全新智慧出行体验

    模型上车,翼真L380更是为用户打造了创新的智能座舱体验。作为中国智能座舱的领军企业,商汤与LEVC翼真汽车强强联手,助力AI大模型
    的头像 发表于 06-26 15:00 1247次阅读

    商汤携手经纬恒润推出智能感知后视镜

    近日,商汤携手经纬恒润,在北京车展上共同展示了一款智能感知后视镜。这款后视镜将行业领先的
    的头像 发表于 05-07 14:36 444次阅读

    商汤科技联合海通证券发布模态全栈式大模型

    商汤科技近日隆重推出了其最新研发的“日日新SenseNova 5.0”大模型体系,并与海通证券携手,共同发布了业内首个专为金融行业量身打造的模态
    的头像 发表于 05-07 14:15 379次阅读

    商汤科技发布“日日新SenseNova 5.0”大模型

    商汤科技近日隆重推出全新升级的“日日新SenseNova 5.0”大模型,其卓越性能赢得了业界的广泛赞誉。凭借这一行业领先的技术实力,商汤
    的头像 发表于 05-07 14:13 461次阅读

    商汤科技与海通证券携手发布金融行业首个模态全栈式大模型

    商汤科技与海通证券联合研发并发布了金融行业内首个面向业务场景的模态全栈式大模型。双方计划将这
    的头像 发表于 05-06 10:16 358次阅读

    商汤真·自动驾驶解决方案UniAD上车首秀

    近日,商汤科技发布全新升级的“日日新SenseNova 5.0”大模型,广受好评!
    的头像 发表于 04-28 18:23 929次阅读
    <b class='flag-5'>商汤</b><b class='flag-5'>绝</b><b class='flag-5'>影</b>真·<b class='flag-5'>端</b>到<b class='flag-5'>端</b>自动驾驶解决方案UniAD上车首秀

    商汤科技联合海通证券发布业内首个面向金融行业模态全栈式大模型

    4月23日,商汤科技正式推出“日日新SenseNova 5.0”大模型体系,并与海通证券联合发布业内首个面向金融行业模态全栈式大
    的头像 发表于 04-26 09:48 334次阅读
    <b class='flag-5'>商汤</b>科技联合海通证券发布业内首个面向金融<b class='flag-5'>行业</b>的<b class='flag-5'>多</b><b class='flag-5'>模态</b>全栈式大<b class='flag-5'>模型</b>

    商汤科技发布5.0模态模型,综合能力全面对标GPT-4 Turbo

    商汤科技发布5.0模态模型,综合能力全面对标GPT-4 Turbo 4月23日,商汤科技董事长兼CEO徐立在2024
    的头像 发表于 04-24 16:49 957次阅读

    模型+模态的3种实现方法

    我们知道,预训练LLM已经取得了诸多惊人的成就, 然而其明显的劣势是不支持其他模态(包括图像、语音、视频模态)的输入和输出,那么如何在预训练LLM的基础上引入跨模态的信息,让其变得更强大、更通用呢?本节将介绍“大
    的头像 发表于 12-13 13:55 1332次阅读
    大<b class='flag-5'>模型</b>+<b class='flag-5'>多</b><b class='flag-5'>模态</b>的3种<b class='flag-5'>实现</b>方法

    2023广州车展丨“速度”,跑出量产“加速度”

    和智能座舱领域的最新成果,以AI“新科技”,共绘人出行“新生活”。 作为智能汽车时代的通用人工智能核心供应商,商汤致力于以领先的大模型
    的头像 发表于 11-20 19:55 514次阅读
    2023广州车展丨“<b class='flag-5'>绝</b><b class='flag-5'>影</b>速度”,跑出量产“加速度”

    探究编辑模态大语言模型的可行性

    不同于单模态模型编辑,模态模型编辑需要考虑更多的模态信息。文章出发点依然从单
    发表于 11-09 14:53 394次阅读
    探究编辑<b class='flag-5'>多</b><b class='flag-5'>模态</b>大语言<b class='flag-5'>模型</b>的可行性