0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤日日新·商量大模型位列国内大模型第一梯队

商汤科技SenseTime 来源:商汤科技SenseTime 2024-11-08 15:38 次阅读

模型表现好,金牌少不了。

刚刚,中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年10月报告》:

商汤日日新·商量大模型(SenseChat5.5)凭借出色的能力表现,总得分位列国内大模型第一梯队,获得金牌。

本次SuperCLUE10月报告覆盖23个国内模型,聚焦语言大模型的通用能力评估,分为三大维度:除了考察“文科”、“理科”基础能力外,还有考察模型更高阶能力的“Hard”附加任务,总共2900+道题:

【理科任务】分为计算、逻辑推理、代码、工具使用测评集;

【文科任务】分为知识百科、语言理解、长文本、角色扮演、生成与创作、安全六大测评集;

【Hard任务】分为精确指令遵循测评集,复杂任务高阶推理测评集。

商汤SenseChat5.5在多项评测任务中均位列第一梯队,文科中语言理解、安全等维度表现突出,也是理科中逻辑推理、代码学科的“尖子生”。

值得注意的是,在【Hard】的两项任务——精准指令遵循和高阶推理中,商汤SenseChat5.5是唯一两项任务均位于国内第一梯队的大模型,体现了模型优秀的复杂推理智能

未来,商汤将继续坚持基础大模型的持续研发与投入,不断提升真正高阶推理及“慢思考”能力。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 商汤科技
    +关注

    关注

    8

    文章

    489

    浏览量

    36037
  • 大模型
    +关注

    关注

    2

    文章

    2273

    浏览量

    2350

原文标题:近3000道题,商汤大模型拿了金牌

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    云知声山海大模型位居全球大模型第一梯队

    SuperCLUE发布《中文大模型基准测评2024上半年报告》,报告选取国内外有代表性的33个大模型在6月份的版本,通过多维度综合性测评,对国内外大
    的头像 发表于 09-12 14:41 528次阅读

    GenAI IaaS增速惊人,商汤科技跻身第一梯队

    ,与火山引擎、阿里巴巴共同跻身2023年下半年中国GenAI IaaS服务厂商TOP 3,以显著的市场份额优势位居GenAI IaaS领域的第一梯队
    的头像 发表于 07-30 11:00 675次阅读
    GenAI IaaS增速惊人,<b class='flag-5'>商汤</b>科技跻身<b class='flag-5'>第一梯队</b>

    商汤日日新模型中标上海电信订单

    近日,中国电信上海公司公布《产数开发代码助手》项目采购结果:凭借「日日新」大模型出色的代码能力,商汤科技中标。由「商汤•小浣熊家族」系列产品团队提供相关业务产品服务支持。
    的头像 发表于 07-29 14:25 479次阅读

    商汤科技&quot;日日新SenseNova 5.5&quot;大模型闪耀WAIC,引领AI新纪元

    在近期举办的世界人工智能大会(WAIC)上,商汤科技携其流式多模态交互大模型日日新SenseNova 5.5”震撼登场,不仅为大会带来了前所未有的AI体验,更通过多场主题论坛活动,深入探讨了AI大
    的头像 发表于 07-08 16:05 506次阅读

    商汤日日新”大模型全面赋能2024 WAIC

    7月6日,WAIC 2024迎来第三天。 商汤科技全新升级的「日日新SenseNova 5.5」备受热议,作为国内首个具备流式原生多模态交互能力的大模型,交互效果和多项核心指标实现
    的头像 发表于 07-08 15:54 583次阅读

    商汤科技发布日日新5.5大模型体系

    商汤科技近日震撼发布其最新的日日新5.5大模型体系,标志着人工智能领域又迈出了坚实的步。该体系以6000亿参数的超大规模基础模型——
    的头像 发表于 07-08 15:05 508次阅读

    商汤科技发布“商量”粤语版大模型

    商汤科技近日发布了针对粤语用户量身定制的商量语言大模型商量多模态大模型。这两款模型即日起向企业
    的头像 发表于 05-31 10:52 806次阅读

    商汤发布日日新模型5.0粤语版

    近日,人工智能领军企业商汤科技正式对外发布了其最新研发成果——日日新模型5.0粤语版。该模型针对粤语用户进行了深度优化,旨在提供更精准、更高效的自然语言处理服务。
    的头像 发表于 05-30 09:21 582次阅读

    中文大模型测评基准SuperCLUE:商汤日日新5.0,刷新国内最好成绩

    日前,中文大模型测评基准SuperCLUE发布最新榜单,对商汤科技全新升级「日日新SenseNova 5.0」大模型进行了全方位综合性测评,结果显示在SuperCLUE综合基准上,
    的头像 发表于 05-21 14:45 677次阅读
    中文大<b class='flag-5'>模型</b>测评基准SuperCLUE:<b class='flag-5'>商汤</b><b class='flag-5'>日日新</b>5.0,刷新<b class='flag-5'>国内</b>最好成绩

    商汤科技即将推出日日新模型5.0粤语版本

    在盛大的“新质企业家联合会”成立典礼上,商汤科技副总裁、智慧城市与商业事业群总裁张果琲宣布了项重要消息。商汤科技即将推出日日新模型5.0
    的头像 发表于 05-13 10:58 538次阅读

    商汤将发布日日新模型5.0粤语版本

    商汤科技即将迎来项重要更新,他们将发布日日新模型5.0的粤语版本。这版本是基于商汤科技现有
    的头像 发表于 05-08 09:33 448次阅读

    商汤科技发布“日日新SenseNova 5.0”大模型

    商汤科技近日隆重推出全新升级的“日日新SenseNova 5.0”大模型,其卓越性能赢得了业界的广泛赞誉。凭借这行业领先的技术实力,商汤
    的头像 发表于 05-07 14:13 521次阅读

    商汤科技新升级大模型,对标GPT-4 Turbo 

    昨日,商汤科技在沪举办技术交流日活动,公布了其“云、端、边”全栈大模型产品矩阵,并对“日日新SenseNova 5.0”大模型体系进行了全面升级。基于此,
    的头像 发表于 04-24 17:17 632次阅读

    商汤日日新SensNova 4.0发布

    商汤科技“日日新SenseNova 4.0”正式发布,标志着大模型体系的次重大飞跃。该模型在知识覆盖、推理能力、长文本理解、数字推理以及代
    的头像 发表于 02-05 10:29 855次阅读

    商汤科技发布新版日日新·商量大语言模型

    商汤科技近日发布了新版的日日新·商量大语言模型-通用版本(SenseChat V4)。这版本的模型
    的头像 发表于 02-04 10:30 894次阅读