0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤科技推出SenseFoundry-VL方舟多模态新智平台

商汤科技SenseTime 来源:商汤科技SenseTime 2024-07-12 14:15 次阅读

日日新」进化到5.5,商汤AI产品会有哪些具体升级?

生成式AI创新应用自不必说,商汤传统视觉AI中的核心产品也正发生变化。

WAIC 2024期间,基于 “日日新5.5”大模型体系能力,商汤“方舟城市开放平台”进行全新产品架构升级,推出首个“大模型+城市服务”的解决方案及应用实践「SenseFoundry-VL 方舟多模态新智平台」,助力智慧城市服务场景进一步提智提效。

智慧城市走向多模态大模型赋能管理

「方舟多模态新智平台」着力解决传统视觉业务所面临的交互方式单一化、泛化场景看不懂、复杂场景误报高、大模型应用难上手等问题。

在传统智慧城市解决方案基础上主要进行三方面升级:

“需求即指令”。通过Agent技术,「方舟多模态新智平台」构建了可理解并处理多种业务的AI智能体,实现了需求描述向具象指令的高效转化。这种方式更接近于人类交互,用户可直接自然语言提问输入查询,大模型会理解用户意图并给出相应的答案。

例如,在交通运输场景,交通部门或物流企业可通过构建物流运力分析智能体,提取车辆位置、车流状况、天气等相应信息提取派单信息,最终制定更科学合理的物流车辆运输时空图谱。

“对话即检索”。依托大模型视图语义理解能力,可实现图文资源的智能语义化检索和对话式研判。让用户获得“所说即所得”、“所问即所应”的体验。

例如,在剧烈台风后,城市管理者可通过对话即刻检索出树木倒伏、电线杆倾倒等各类危害交通安全的场景,从而进行快速响应处理。

“提示即提优”。依托大模型良好的泛化能力,无需海量定制研发投入,只需少量正负样例数据和提示词调整,即可一键生成通用模型和特定模型,部分复杂城市事件的识别准确率高达90%以上,真正实现模型生产和调优的使用易、落地快、成本低。

作为一款“听得懂、会交流、擅优化”的多模态大模型平台,「方舟多模态新智平台」未来有望持续推动智慧城市+大模型的迭代升级,聚焦多模态、高效化、个性化、可解释性和数据驱动决策等方向,并拓展至智能交通、公共服务智能化、应急响应、城市服务与决策支持、区域协同发展等应用场景。

wKgZomaQyhqAIKS_AAR-zcJv67Y887.jpg

已落地一线,实现城市服务十倍提效

目前,「方舟多模态新智平台」已在城市服务场景中实际落地。

以城市便民服务为例,该平台可实现便民窗口服务的智能化分类分拨、智能视频设备调取、智能处置建议、智能系统信息查询等能力。

在某一线城市12345公共服务便民热线场景中,「方舟多模态新智平台」助力12345工单的分类分拨速度提升至原先的10倍以上,并统一了分类标准。在短短一个月内,完成超过30万次的分拨诉求,平均每天处理一万余次。

借助「方舟多模态新智平台」,单个分拨员原本一个月的工作量现在仅需一天即可完成,经二次复核,准确率高达90%以上。

这样的智能化分拨应用不仅切实有效,更极大减轻了政务工作压力,显著提升工作效率。

此外,「方舟多模态新智平台」支持自然语言调取10万路以上前端点位,实现分钟级精准检索;升级后的模型架构支持通过简单提示词,即刻创建全新场景分析功能,实现1天内快速部署上线,3天内手动快速调优,部分场景通过二次分析后准确率达90%以上。真正让大模型迅速落地在各类应用场景中,实现所想即所得。

差异化优势明显,智慧城市行业新标杆

与常见行业方案相比,商汤「方舟多模态新智平台」差异化优势明显,主要体现在三方面:平台技术布局、硬件选型、业务应用。

首先,是融合架构的技术布局。视觉领域深厚算法积累+「日日新」领先大模型能力,为「方舟多模态新智平台」的全面架构升级奠定扎实基础。

「方舟多模态新智平台」采用的视觉-语言多模态大模型,集图文对比、文本理解生成及交错图文理解三大能力为一体,在国际权威机构的国产化大模型评测中,位列第一梯队;同时视觉模型+大模型融合架构,AI智能体等引入,为城市AI应用创新提供全方位的技术支撑。

其二,是国产适配的硬件选型。「方舟多模态新智平台」充分研讨了国产自主可控的方针政策。目前充分适配了主流的国产芯片和硬件服务器,为大模型国产化落地提供全面的算力保障。

第三,灵活可配的业务应用。城市场景有复杂性高、碎片化强等特点,「方舟多模态新智平台」能根据智慧城市的具体需求,进行高度定制化开发。此外,其创新性配套图文可视化的提示工程设计,也很好地兼顾了方案落地的泛化性及系统应用的低门槛,有效保障AI大模型的落地效果。

伴随全球数字化转型加速,“智慧城市”与“大模型”结合被视为未来城市发展的关键。「方舟多模态新智平台」是商汤在助力城市服务智能化发展中取得的突破性进展,必将作为新质生产力,开启城市智能化发展新篇章。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    28818

    浏览量

    266157
  • 商汤科技
    +关注

    关注

    8

    文章

    474

    浏览量

    35993
  • 大模型
    +关注

    关注

    2

    文章

    2126

    浏览量

    1965

原文标题:商汤推出「方舟多模态新智平台」,首个多模态大模型落地城市服务场景

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    商汤Sensechat向香港用户免费开放

    「Sensechat 」基于商汤今年5月推出的“商量模态大模型粤语版”。依托商汤“日日新”出色语言和
    的头像 发表于 09-18 15:53 150次阅读

    云知声推出山海模态大模型

    在人工智能技术的浩瀚星海中,模态交互技术正成为引领未来的新航标。继OpenAI的GPT-4o掀起滔天巨浪后,云知声以创新之姿,推出了其匠心独运的山海
    的头像 发表于 08-27 15:20 254次阅读

    商汤绝影在行业率先实现原生模态大模型的车端部署

    “基于原生模态大模型,商汤绝影正在打造一系列全新的车载智能化产品,推动智能汽车向超级智能体进化。”商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚在WAIC 2024
    的头像 发表于 07-23 10:52 456次阅读
    <b class='flag-5'>商汤</b>绝影在行业率先实现原生<b class='flag-5'>多</b><b class='flag-5'>模态</b>大模型的车端部署

    商汤科技发布“商量”粤语版大模型

    商汤科技近日发布了针对粤语用户量身定制的商量语言大模型和商量模态大模型。这两款模型即日起向企业用户开放API接口,同时Web版和App版也将很快向粤语区用户免费推出,以满足广大用户的
    的头像 发表于 05-31 10:52 705次阅读

    商汤科技联合海通证券发布模态全栈式大模型

    商汤科技近日隆重推出了其最新研发的“日日新SenseNova 5.0”大模型体系,并与海通证券携手,共同发布了业内首个专为金融行业量身打造的模态全栈式大模型。此次强强联合旨在加速大模
    的头像 发表于 05-07 14:15 380次阅读

    商汤科技与海通证券携手发布金融行业首个模态全栈式大模型

    商汤科技与海通证券联合研发并发布了金融行业内首个面向业务场景的模态全栈式大模型。双方计划将这一先进技术应用于智能问答、合规风控、代码辅助以及办公助手等关键业务领域,以实现大模型技术
    的头像 发表于 05-06 10:16 360次阅读

    商汤科技联合海通证券发布业内首个面向金融行业的模态全栈式大模型

    4月23日,商汤科技正式推出“日日新SenseNova 5.0”大模型体系,并与海通证券联合发布业内首个面向金融行业的模态全栈式大模型。
    的头像 发表于 04-26 09:48 335次阅读
    <b class='flag-5'>商汤</b>科技联合海通证券发布业内首个面向金融行业的<b class='flag-5'>多</b><b class='flag-5'>模态</b>全栈式大模型

    商汤科技发布5.0模态大模型,综合能力全面对标GPT-4 Turbo

    场景应用需求;升级“日日新SenseNova 5.0”大模型体系,综合能力全面对标GPT-4 Turbo。 此外对于文生视频徐立也表示商汤科技很快就会发布相关的平台产品。 备受瞩目的商汤科技“日日新SenseNova” 5.0
    的头像 发表于 04-24 16:49 962次阅读

    谷歌推出模态VLOGGER AI

    谷歌最新推出的VLOGGER AI技术引起了广泛关注,这项创新的模态模型能够让静态肖像图“活”起来并“说话”。用户只需提供一张人物肖像照片和一段音频内容,VLOGGER AI就能让图片中的人物仿佛真的在朗读这段音频,面部表情丰
    的头像 发表于 03-22 10:45 670次阅读

    从Google模态大模型看后续大模型应该具备哪些能力

    前段时间Google推出Gemini模态大模型,展示了不凡的对话能力和模态能力,其表现究竟如何呢?
    的头像 发表于 12-28 11:19 1001次阅读
    从Google<b class='flag-5'>多</b><b class='flag-5'>模态</b>大模型看后续大模型应该具备哪些能力

    人工智能领域模态的概念和应用场景

    随着人工智能技术的不断发展,模态成为了一个备受关注的研究方向。模态技术旨在将不同类型的数据和信息进行融合,以实现更加准确、高效的人工智能应用。本文将详细介绍
    的头像 发表于 12-15 14:28 7210次阅读

    大模型+模态的3种实现方法

    我们知道,预训练LLM已经取得了诸多惊人的成就, 然而其明显的劣势是不支持其他模态(包括图像、语音、视频模态)的输入和输出,那么如何在预训练LLM的基础上引入跨模态的信息,让其变得更强大、更通用呢?本节将介绍“大模型+
    的头像 发表于 12-13 13:55 1345次阅读
    大模型+<b class='flag-5'>多</b><b class='flag-5'>模态</b>的3种实现方法

    用语言对齐模态信息,北大腾讯等提出LanguageBind,刷新多个榜单

    目前的 VL 预训练方法通常仅适用于视觉和语言模态,而现实世界中的应用场景往往包含更多的模态信息,如深度图、热图像等。如何整合和分析不同模态的信息,并且能够在多个
    的头像 发表于 11-23 15:46 560次阅读
    用语言对齐<b class='flag-5'>多</b><b class='flag-5'>模态</b>信息,北大腾讯等提出LanguageBind,刷新多个榜单

    探究编辑模态大语言模型的可行性

    不同于单模态模型编辑,模态模型编辑需要考虑更多的模态信息。文章出发点依然从单模态模型编辑入手,将单模态
    发表于 11-09 14:53 399次阅读
    探究编辑<b class='flag-5'>多</b><b class='flag-5'>模态</b>大语言模型的可行性

    基于视觉的模态触觉感知系统

    传统的模态/多任务触觉感知系统通过集成多种传感单元来达到模态触觉信息的解耦,但其往往导致系统结构的复杂性,以及需要应对来自不同刺激间的干扰。
    发表于 10-18 11:24 706次阅读
    基于视觉的<b class='flag-5'>多</b><b class='flag-5'>模态</b>触觉感知系统