商汤日日新大模型全面升级，SenseCore可支持20个千亿参数量大模型同时训练-电子发烧友网

电子发烧友网报道（文/李弯弯）今年4月10日，商汤科技正式首次公布“日日新SenseNova”大模型体系。在日前的2023世界人工智能大会上，商汤科技宣布“商汤日日新SenseNova”大模型体系将多方位全面升级，并宣布在该体系下一系列的大模型产品更新和落地成果。

“日日新SenseNova”全面升级及应用落地

商汤科技发布的“商量”2.0版本，是一个千亿级参数的自然语言处理模型，它突破了大语言模型输入长度的限制，推出不同参数量级的模型版本，可完美适配移动端、云端等不同终端及场景的应用需求，降低部署成本。

商汤还推出小模型商量S版（SenseChat S）等不同参数量级的模型版本，小模型不但性能上有一定突破，在前端的运行上也能够跑到高通骁龙8 Gen2的终端芯片上，适配移动端等不同终端及场景的应用需求。

另外，商汤全新的秒画3.0，模型参数从今年4月首发的10亿提升至70亿量级；如影SenseAvatar 2.0数字人生成平台，相较1.0版本的语音和口型流畅度提升30%以上，实现4K高清视频效果，并带来AIGC生成形象及数字人歌唱功能。

基于神经辐射场技术（NeRF）的大场景3D内容生成平台商汤琼宇SenseSpace2.0，在空间重建效率上提升20%，渲染性能提升50%，每100平方公里场景的建图仅需38小时即可完成（1200 TFLOPS/秒算力支持），同等工作量由人工建图需要10000人天。

商汤格物SenseThings 2.0对小物体的纹理及材质还原达到毫米级精细度，并突破对高反光和镜面物体的采集难题。

在应用上，比如格物在线下场景的落地，商汤科技灵境空间事业部总监李宇飞介绍，目前，“格物”支持多种物品品类的复刻，并突破了行业难题——高反光、镜面物体的复刻，比如珠宝首饰、小家电、金属物件等。

传统的重建技术通常难以解决高反光，镜面物体的采集和复刻。然而，“格物”不仅可以避免伤害和改变物品的情况，还能精确还原物品的外观和特征。除此之外，“格物”包含一键成图和一键成片等再创作服务。通过一键成图功能，用户可以生成商品与场景融合的海报，或者试穿试戴的真人海报，相比其他AI技术只能部分还原商品细节，一键成图可以100%还原商品的各个视角和效果。

再比如影SenseAvatar 2.0数字人生成平台，商汤数字人在金融领域，银行、保险、券商等担任智能客服、智慧营销等工作，接入大语言模型能力，还能提供投研分析、研报撰写等新功能，实现降本增效。挂载金融知识库后，还能100%基于客户的产品说明进行内容问答输出，并实现信息及时更新。此外，商汤如影2.0生成的数字人，正在进入多个头部企业的直播间、短视频频道。

“大模型+大装置”的AGI战略布局

2022年，以GPT为代表的预训练大模型带来新一波AI应用的爆发，大模型的研发依赖于大规模智能计算基础设施。商汤科技坚持“大模型+大装置”的AGI战略布局。商汤科技打造了人工智能基础设施AI大装置SenseCore，打通算力、算法和平台，并在此基础上建立商汤“日日新SenseNova”大模型及研发体系。

根据该公司2022年度报告，商汤SenseCore AI大装置持续扩建，完成2.7万块GPU的部署并实现了5.0 exaFLOPS算力输出能力，以AIaaS的模式面向行业伙伴提供服务，全面赋能商汤自身以及行业伙伴的大模型生产。SenseCore目前可有效支持最多20个千亿参数量大模型（以千卡并行）同时训练，最高可支持万亿参数超大模型的训练。

目前，SenseCore已支持了超过10个大模型训练项目，包括语言大模型、文生图模型、视觉大模型、多模态模型等自研模型和客户自定义模型。同时商汤面向8家大型客户支持了7000多张GPU的计算资源，以服务其自定义的大模型训练任务。

SenseCore提供的AIaaS具体包括了计算基础设施服务（IaaS）、深度学习平台服务（PaaS）、模型部署及推理服务（MaaS）三大部分的能力。

1、强大的计算基础设施（IaaS）：SenseCore提供高性能计算资源（例如GPU集群和高速网络），以支持大型模型训练所需的强大算力。分布式训练构架支持千卡级别的大规模分布式训练，千卡并行效率达91.5%，最高支持4,000块GPU卡的单任务训练，有效降低训练时间，提升计算效率。2022年，位于上海临港的商汤AIDC开放运营，是由公司自建的大规模、低碳节能的先进计算基础设施，是目前亚洲最大的人工智能算力中心之一。上海临港AIDC的开业大大增强了SenseCore的高性能算力供应能力。

2、易用的深度学习平台、丰富的开发工具、预训练模型库和开源体系（PaaS）：商汤提供易用的开发工具和深度学习平台，协助内外部高效构建和优化模型。也提供涵盖多个领域和场景的预训练模型库。用户可基于这些模型进行二次开发，大幅缩短研发周期，降低研发成本和风险。同时，公司开源了OpenMMLab、OpenGVLab、OpenDILab、OpenXRLab及OpenPPL五大平台，包含了共计2,500多种预训练模型及400多种算法，这些开源体系吸引全球AI开发者的参与，在Github上获得77,000+的星标。

3、灵活的模型部署及推理服务（MaaS）：SenseCore支持用户将训练好的AI模型一键跨平台部署到云端、边缘设备或混合环境中。公司针对30款芯片、100多种平台进行了常规模型的适配和优化，支持大规模的实时推理。提供模型压缩、模型融合等优化工具和技术，进一步提高模型在部署和推理阶段的性能。

小结

过去几个月时间，国内外已经涌现出大量大模型产品，如今，探索大模型应用落地已经成为当前业界关注的焦点。目前包括商汤科技在内的不少企业已经在多个领域实现应用。此外，无论是大模型的训练还是推理都离不开算力的支持，而在这方面，商汤科技也早有布局。在算力匮乏的当下，大模型+大装置的战略路线对于其后续的发展，也极其有利。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

商汤

商汤

+关注

关注
0

文章
57

浏览量
3966

商汤“日日新”融合大模型荣获双料冠军

近日，商汤科技正式推出了其创新力作——“日日新”融合大模型。该模型在技术上实现了原生融合模态的突破，使得其深度推理能力和多模态信息处理能力均得到了显著提升。这一成果的发布，标志着

发表于 01-13 16:10 •184次阅读

商汤科技推出“日日新”融合大模型

刚刚，商汤正式推出“日日新”融合大模型，领先实现原生融合模态，深度推理能力与多模态信息处理能力均大幅提升，并在两大权威评测榜单夺得第一，成为“双冠王”。

发表于 01-10 15:59 •266次阅读

商汤日日新多模态大模型权威评测第一

刚刚，商汤科技日日新SenseNova多模态大模型，在权威综合评测权威平台OpenCompass的多模态评测中取得榜单第一。

发表于 12-20 10:39 •332次阅读

商汤日日新大模型中标上海电信订单

近日，中国电信上海公司公布《产数开发代码助手》项目采购结果：凭借「日日新」大模型出色的代码能力，商汤科技中标。由「商汤•小浣熊家族」系列产品团队提供相关业务产品服务

发表于 07-29 14:25 •595次阅读

商汤“日日新”大模型全面赋能2024 WAIC

7月6日，WAIC 2024迎来第三天。商汤科技全新升级的「日日新SenseNova 5.5」备受热议，作为国内首个具备流式原生多模态交互能力的大模型，交互效果和多项核心指标实现

发表于 07-08 15:54 •685次阅读

商汤科技发布日日新5.5大模型体系

商汤科技近日震撼发布其最新的日日新5.5大模型体系，标志着人工智能领域又迈出了坚实的一步。该体系以6000亿参数的超大规模基础模型——

发表于 07-08 15:05 •641次阅读

商汤发布日日新大模型5.0粤语版

近日，人工智能领军企业商汤科技正式对外发布了其最新研发成果——日日新大模型5.0粤语版。该模型针对粤语用户进行了深度优化，旨在提供更精准、更高效的自然语言处理服务。

发表于 05-30 09:21 •667次阅读

中文大模型测评基准SuperCLUE：商汤日日新5.0，刷新国内最好成绩

日前，中文大模型测评基准SuperCLUE发布最新榜单，对商汤科技全新升级「日日新SenseNova 5.0」大模型进行了全方位综合性测评，

发表于 05-21 14:45 •828次阅读

中文大<b class='flag-5'>模型</b>测评基准SuperCLUE：<b class='flag-5'>商汤</b><b class='flag-5'>日日新</b>5.0，刷新国内最好成绩

商汤科技即将推出日日新大模型5.0粤语版本

在盛大的“新质企业家联合会”成立典礼上，商汤科技副总裁、智慧城市与商业事业群总裁张果琲宣布了一项重要消息。商汤科技即将推出日日新大模型5.0的粤语版本，这一新版本将基于大装置和强大的技

发表于 05-13 10:58 •623次阅读

商汤将发布日日新大模型5.0粤语版本

商汤科技即将迎来一项重要更新，他们将发布日日新大模型5.0的粤语版本。这一版本是基于商汤科技现有的大装置和日日新大

发表于 05-08 09:33 •538次阅读

商汤科技发布“日日新SenseNova 5.0”大模型

商汤科技近日隆重推出全新升级的“日日新SenseNova 5.0”大模型，其卓越性能赢得了业界的广泛赞誉。凭借这一行业领先的技术实力，商汤绝

发表于 05-07 14:13 •605次阅读

商汤科技发布日新5.0大模型，对标GPT-4 Turbo，预计2024年落地端侧

据了解，4月23日，商汤科技在上海举行了技术交流日活动，公布了“云、端、边”全栈大模型产品矩阵，并对“日日新SenseNova 5.0”大模型进行了

发表于 04-25 09:30 •612次阅读

商汤科技新升级大模型，对标GPT-4 Turbo

昨日，商汤科技在沪举办技术交流日活动，公布了其“云、端、边”全栈大模型产品矩阵，并对“日日新SenseNova 5.0”大模型体系进行了全面

发表于 04-24 17:17 •723次阅读

商汤日日新SensNova 4.0发布

商汤科技“日日新SenseNova 4.0”正式发布，标志着大模型体系的一次重大飞跃。该模型在知识覆盖、推理能力、长文本理解、数字推理以及代码生成等多个维度上实现了

发表于 02-05 10:29 •974次阅读

商汤科技发布新版日日新·商量大语言模型

商汤科技近日发布了新版的日日新·商量大语言模型-通用版本（SenseChat V4）。这一版本的模型在知识理解、阅读理解、综合推理、数理、代

发表于 02-04 10:30 •1019次阅读

搜索历史

商汤日日新大模型全面升级，SenseCore可支持20个千亿参数量大模型同时训练

评论