商汤小浣熊荣获中国信通院代码大模型能力评估“三好生”-电子发烧友网

“通用能力突出，专用场景全面，应用成熟度优秀”。

近日，商汤小浣熊代码大模型在中国信通院“可信AI代码大模型评估”中，荣获4+级最高评级，成为国内首批通过该项评估的企业之一。

商汤小浣熊在代码通用能力、专用场景和应用成熟度等多个评估维度中表现优秀。

依据中国信通院《智能化软件工程技术和应用要求第1部分：代码大模型》，此次评估聚焦大模型的通用能力、专用场景能力和应用成熟度三大部分，包括16个能力项、100多个能力要求，从输入多样性、任务多样性、语言完备度、结果可接收性、结果准确度等维度，考核代码大模型的全栈技术能力。

图片来源：中国信通院

商汤小浣熊作为首批参评企业获得4+级评级，是本次评分最高的代码大模型之一。中国信通院测评结果显示：

通用能力方面，小浣熊在代码解释、代码转换等方面表现突出；

专用场景方面，小浣熊支持网站开发、桌面应用开发、移动应用开发、数据库开发等多个场景的开发能力；

应用成熟度方面，小浣熊在数据分类分级、模型性能、模型服务可维护性、风险可控性等方面均表现优秀。

「小浣熊家族」是基于商汤“日日新SenseNova”大模型体系打造的 AI Native 生产力系列工具，覆盖软件开发、数据分析、编程教育等多个场景，旨在通过先进的人工智能技术优化和提升工作效率。现已推出代码小浣熊和办公小浣熊两位产品成员。

代码小浣熊是基于大模型的软件智能研发助手，覆盖软件需求分析、架构设计、代码编写、软件测试等环节，满足用户代码编写、编程学习等各类需求，现已支持Python、Java、JavaScript、C++、Go、SQL等90+主流编程语言和VS Code、JetBrains全家桶、Android Studio等主流IDE。

办公小浣熊是基于大模型的大模型原生数据分析产品，可以通过用户的自然语言输入，自动将数据转化为有意义的分析和可视化结果。

小浣熊家族背后的「小浣熊代码大模型」，在权威测试集HumanEval Coding测试中一次通过率达到78.1%，在数据分析场景下的数据测试集（1000+题目）中以85.71%的正确率超过GPT-4。

自上线以来，小浣熊代码大模型累计为10万+个人用户提供服务，单日代码生成数量达到10亿+Tokens，总体平均代码采纳率超过30%，用户编码能效提升达到20%~78%。

目前，商汤小浣熊代码大模型已经被包括金融、新能源汽车等行业在内的200+企业客户使用，凭借突出的数理能力覆盖多元落地场景。

例如，在与金山办公的合作中，小浣熊代码大模型助力WPS 365打造更高效释放场景能力的智能办公平台，为用户多元、碎片化的办公需求提供新质生产力。

此外，基于小浣熊代码大模型，商汤科技与海通证券合作打造智能研发助手，辅助金融企业研发人员进行代码编程，为开发者提供代码智能补全与对话问答服务，可辅助生产约20%代码，降低开发技术门槛，有效提高开发效率。

未来，商汤小浣熊将持续降低大模型技术的开发和应用门槛，赋能更多场景创新。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

代码

代码

+关注

关注
30

文章
4793

浏览量
68700
商汤

商汤

+关注

关注
0

文章
55

浏览量
3958
大模型

大模型

+关注

关注
2

文章
2476

浏览量
2814

原文标题：首批通过，最高评级，商汤小浣熊喜提中国信通院代码大模型能力评估“三好生”

文章出处：【微信号：SenseTime2017，微信公众号：商汤科技SenseTime】欢迎添加关注！文章转载请注明出处。

华为云云原生中间件 DCS & DMS 通过中国信通院与全球 IPv6 测试中心双重能力检测

【摘要】近日，中国信息通信研究院（以下简称“中国信通院”）与全球 IPv6 测试中心相继宣布，华为云的分布式缓存服务（Distributed Cache Service，简称 DCS

发表于 12-18 09:18 •257次阅读

华为云云原生中间件 DCS & DMS 通过<b class='flag-5'>中国信</b>通<b class='flag-5'>院</b>与全球 IPv6 测试中心双重<b class='flag-5'>能力</b>检测

权威认证 “图扑软件数字孪生低代码平台”获中国信通院检测认证

2024 年 10 月 31 日，在首届数字孪生技术与产业发展大会上，中国信息通信研究院颁布了第四批数字孪生低代码测评结果。厦门图扑软件科技有限公司自主研发的“数字孪生低代码平台”产品

发表于 11-05 11:32 •295次阅读

中国信通院发布“2024云计算十大关键词”

据研究所所长何宝宏在会上对“2024云计算十大关键词”进行了解读。中国信通院云大所何宝宏所长发布2024云计算十大关键词十大关键词分别是：应用现代化、大模型云服务、智

发表于 08-02 08:28 •640次阅读

<b class='flag-5'>中国信</b>通<b class='flag-5'>院</b>发布“2024云计算十大关键词”

商汤日日新大模型中标上海电信订单

近日，中国电信上海公司公布《产数开发代码助手》项目采购结果：凭借「日日新」大模型出色的代码能力，商汤

发表于 07-29 14:25 •551次阅读

中交兴路入选中国信通院“卓信大数据计划”

为推动我国数字经济更加健康可持续发展，不断提升全行业数据安全能力，中国信息通信研究院（以下简称：中国信通院）已连续3年发起“卓信大数据计划”

发表于 07-23 09:29 •499次阅读

商汤AI大模型与中国国家篮球队达成战略合作

商汤科技与中国国家篮球队达成战略合作，将基于商汤“日日新SenseNova5.5”大模型技术共同打造AI大模型篮球产品，推动AI大

发表于 07-17 09:58 •726次阅读

商汤科技与泰国DTGO集团联合发布泰语大模型

。「东风」泰语大模型结合了商汤与DTGO双方的专业能力——将商汤的基模型和算力优势，与DTGO的泰国语言文化优势相结合，提供本地化

发表于 07-11 19:57 •1137次阅读

华为云盘古研发大模型荣获最高评级,引领行业创新

在科技日新月异的今天，人工智能技术的每一次突破都牵动着整个行业的脉搏。近日，华为云官方传来喜讯，其旗下的盘古研发大模型在中国信通院组织的首轮代码大模

发表于 06-13 16:20 •557次阅读

首批！数势科技SwiftAgent完成中国信通院大模型驱动的智能数据分析工具专项测试

2024年5月15日，在中国信通院组织的首批大模型驱动的智能数据分析工具专项测试中，数势科技大模型智能分析助手SwiftAgent顺利完成了专项测试的全部内容，成为首批完成此项测试的企

发表于 05-24 19:04 •372次阅读

中国信通院主导制定首个代码大模型国际标准

据了解，这一《方法》涵盖了代码大模型所需的通用和特定功能以及应用成熟度方面的要求，并对其输入多样化、任务多样性、语言完整性、结果接受度及准确度等多方面进行全面评估。

发表于 05-14 15:38 •292次阅读

业界首个一云多芯迁移标准 中国信通院联合浪潮云海发布

北京2024年5月11日 /美通社/ -- 近日，中国信息通信研究院（简称中国信通院）与浪潮云海等多家产业单位共同发布了《一云多芯迁移能力要

发表于 05-13 17:16 •376次阅读

首家！数势科技通过中国信通院数据指标管理平台技术要求专项测试

专项测试的全部内容，成为首家完成此项测试的企业。《数据指标管理平台技术要求》标准及测试介绍为进一步规范数据指标管理平台的标准化发展，围绕指标生命周期管理各环节的能力建设，中国信通院云计算与大数据研究所依托

发表于 05-13 10:30 •692次阅读

IBM助力客户赢得中国信通院“可信AI案例”奖

IBM近日在中国信通院举办的“可信AI案例”评选中荣获殊荣。该公司与延锋国际汽车技术有限公司及苏州环球科技股份有限公司合作，凭借IBM智能自动化软件共同打造的案例成功入选"AI原生技术和应用优秀案例"。

发表于 05-09 11:35 •624次阅读

商汤科技发布5.0多模态大模型，综合能力全面对标GPT-4 Turbo

商汤科技发布5.0多模态大模型，综合能力全面对标GPT-4 Turbo 4月23日，商汤科技董事长兼CEO徐立在2024商汤技术交流日上发布

发表于 04-24 16:49 •1122次阅读

加速布局智能制造三菱电机与中国信通院共建重庆智能制造科创中心

2024年3月11日，由中国信息通信研究院西部分院（以下简称“中国信通院西部分院”）牵头，联合三菱电机（

发表于 03-19 10:30 •857次阅读