0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤小浣熊荣获中国信通院代码大模型能力评估“三好生”

商汤科技SenseTime 来源:商汤科技SenseTime 2024-06-13 15:37 次阅读

“通用能力突出,专用场景全面,应用成熟度优秀”。

近日,商汤小浣熊代码大模型在中国信通院“可信AI代码大模型评估”中,荣获4+级最高评级,成为国内首批通过该项评估的企业之一。

商汤小浣熊在代码通用能力、专用场景和应用成熟度等多个评估维度中表现优秀。

b7e21aca-2957-11ef-91d2-92fbcf53809c.png

依据中国信通院《智能化软件工程技术和应用要求 第1部分:代码大模型》,此次评估聚焦大模型的通用能力、专用场景能力和应用成熟度三大部分,包括16个能力项、100多个能力要求,从输入多样性、任务多样性、语言完备度、结果可接收性、结果准确度等维度,考核代码大模型的全栈技术能力。

bbdbc130-2957-11ef-91d2-92fbcf53809c.png

图片来源:中国信通院

商汤小浣熊作为首批参评企业获得4+级评级,是本次评分最高的代码大模型之一。中国信通院测评结果显示:

通用能力方面,小浣熊在代码解释、代码转换等方面表现突出;

专用场景方面,小浣熊支持网站开发、桌面应用开发、移动应用开发、数据库开发等多个场景的开发能力;

应用成熟度方面,小浣熊在数据分类分级、模型性能、模型服务可维护性、风险可控性等方面均表现优秀。

「小浣熊家族」是基于商汤“日日新SenseNova”大模型体系打造的 AI Native 生产力系列工具,覆盖软件开发、数据分析、编程教育等多个场景,旨在通过先进的人工智能技术优化和提升工作效率。现已推出代码小浣熊和办公小浣熊两位产品成员。

代码小浣熊是基于大模型的软件智能研发助手,覆盖软件需求分析、架构设计、代码编写、软件测试等环节,满足用户代码编写、编程学习等各类需求,现已支持PythonJava、JavaScript、C++、Go、SQL等90+主流编程语言和VS Code、JetBrains全家桶、Android Studio等主流IDE。

办公小浣熊是基于大模型的大模型原生数据分析产品,可以通过用户的自然语言输入,自动将数据转化为有意义的分析和可视化结果。

小浣熊家族背后的「小浣熊代码大模型」,在权威测试集HumanEval Coding测试中一次通过率达到78.1%,在数据分析场景下的数据测试集(1000+题目)中以85.71%的正确率超过GPT-4。

自上线以来,小浣熊代码大模型累计为10万+个人用户提供服务,单日代码生成数量达到10亿+Tokens,总体平均代码采纳率超过30%,用户编码能效提升达到20%~78%。

目前,商汤小浣熊代码大模型已经被包括金融、新能源汽车等行业在内的200+企业客户使用,凭借突出的数理能力覆盖多元落地场景。

例如,在与金山办公的合作中,小浣熊代码大模型助力WPS 365打造更高效释放场景能力的智能办公平台,为用户多元、碎片化的办公需求提供新质生产力。

此外,基于小浣熊代码大模型,商汤科技与海通证券合作打造智能研发助手,辅助金融企业研发人员进行代码编程,为开发者提供代码智能补全与对话问答服务,可辅助生产约20%代码,降低开发技术门槛,有效提高开发效率。

未来,商汤小浣熊将持续降低大模型技术的开发和应用门槛,赋能更多场景创新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 代码
    +关注

    关注

    30

    文章

    4596

    浏览量

    67332
  • 商汤
    +关注

    关注

    0

    文章

    51

    浏览量

    3889
  • 大模型
    +关注

    关注

    2

    文章

    1871

    浏览量

    1497

原文标题:首批通过,最高评级,商汤小浣熊喜提中国信通院代码大模型能力评估“三好生”

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    商汤大装置算力服务获国家级认证

    商汤大装置算力服务获国家级认证! 近日,经过中国电子技术标准化研究院专家审核,商汤科技通过算力服务能力成熟度(CPMM)增强级评估,并成为首
    的头像 发表于 06-22 10:59 326次阅读

    华为云盘古研发大模型荣获最高评级,引领行业创新

    在科技日新月异的今天,人工智能技术的每一次突破都牵动着整个行业的脉搏。近日,华为云官方传来喜讯,其旗下的盘古研发大模型中国信通院组织的首轮代码模型
    的头像 发表于 06-13 16:20 300次阅读

    中国信通院主导制定首个代码模型国际标准

    据了解,这一《方法》涵盖了代码模型所需的通用和特定功能以及应用成熟度方面的要求,并对其输入多样化、任务多样性、语言完整性、结果接受度及准确度等多方面进行全面评估
    的头像 发表于 05-14 15:38 141次阅读

    【大语言模型:原理与工程实践】大语言模型的评测

    计算和代码纠错等。这些场景覆盖日常生活和学习的多个方面,使得对话能力评测变得尤为复杂和关键。为了全面评估大语言模型在各种应用场景下的对话能力
    发表于 05-07 17:12

    商汤科技推出6000亿参数大模型,全力对标GPT-4 Turbo 

    稍晚些时候,商汤科技发布公告称,4月23日在上海临港AIDC举办技术交流日活动,推出了6000亿参数大模型(日日新5.0),其知识、数学、推理和代码能力均有显著提升,综合性能可媲美GP
    的头像 发表于 04-25 10:11 205次阅读

    商汤科技发布5.0多模态大模型,综合能力全面对标GPT-4 Turbo

    商汤科技发布5.0多模态大模型,综合能力全面对标GPT-4 Turbo 4月23日,商汤科技董事长兼CEO徐立在2024商汤技术交流日上发布
    的头像 发表于 04-24 16:49 727次阅读

    商汤科技发布新版日日新·商量大语言模型

    商汤科技近日发布了新版的日日新·商量大语言模型-通用版本(SenseChat V4)。这一版本的模型在知识理解、阅读理解、综合推理、数理、代码和长文本理解等领域的通用
    的头像 发表于 02-04 10:30 639次阅读

    代码浣熊Raccoon上线,助你丝滑写代码商汤大语言模型实力加持

    基于商汤自研大语言模型的 智能编程助手 —— 代码浣熊Raccoon ,即日起开放公测!
    的头像 发表于 12-07 16:40 498次阅读
    <b class='flag-5'>代码</b>小<b class='flag-5'>浣熊</b>Raccoon上线,助你丝滑写<b class='flag-5'>代码</b>,<b class='flag-5'>商汤</b>大语言<b class='flag-5'>模型</b>实力加持

    新华社研究院:商汤“商量”获评中国模型市场未来领袖

    编者按 : 日前,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告3.0》,对主流大模型进行了全面评估,并为中国企业的大
    的头像 发表于 11-29 18:30 328次阅读
    新华社研究院:<b class='flag-5'>商汤</b>“商量”获评<b class='flag-5'>中国</b>大<b class='flag-5'>模型</b>市场未来领袖

    商汤打出“数字中国”建设大模型组合拳

    提供宏观尺度的解译能力,“洞察地球奥秘”。 以 商汤琼宇SenseSpace高精实景三维重建平台 提供精细化建模能力,“还原真实世界”。 从 二维到三维的大模型组合拳 ,是
    的头像 发表于 11-09 13:35 381次阅读
    <b class='flag-5'>商汤</b>打出“数字<b class='flag-5'>中国</b>”建设大<b class='flag-5'>模型</b>组合拳

    恭喜!华为云通过中国信通院《API 全生命周期管理能力评估

    互联互通。为助力企业高质量管理 API 全生命周期的发展目标,中国信通院牵头制定了《API 全生命周期管理能力评估》标准并推出相关评估服务,规范企业 API 建设
    的头像 发表于 10-26 09:16 529次阅读
    恭喜!华为云通过<b class='flag-5'>中国信</b>通院《API 全生命周期管理<b class='flag-5'>能力</b><b class='flag-5'>评估</b>》

    国内首批!商汤如影获中国信通院“可信虚拟人”L3卓越级证书

    每一个在“商汤如影”平台创作的数字人,都是经过严格认证的“可信数字人”。 日前 “商汤如影SenseAvatar”AI数字人生成平台 正式通过中国信通院“可信虚拟人生成内容管理系统”测评,荣获
    的头像 发表于 09-15 15:45 711次阅读

    重磅!华为云计算技术有限公司云原生中间件高分通过中国信通院能力评估先进级

    近日,中国信息通信研究院(以下简称“中国信通院”)公布了《分布式缓存稳定性测试要求》、《分布式消息队列服务稳定性测试要求》能力的检验结果,华为云计算技术有限公司凭借过硬的技术实力顺利通过,华为
    的头像 发表于 08-30 23:08 390次阅读
    重磅!华为云计算技术有限公司云原生中间件高分通过<b class='flag-5'>中国信</b>通院<b class='flag-5'>能力</b><b class='flag-5'>评估</b>先进级

    喜讯!基调听云可观测性平台获评中国信通院根因分析评估先进级

    了2023年上半年度的可信云评估结果。 值得一提的是,在这次大会上,基调听云可观测性平台凭借其稳定性和卓越的根因分析能力受到了广泛关注。基调听云可观测性平台在中国信通院举办的“稳保行动”中通过了根因分析
    的头像 发表于 07-26 13:10 572次阅读

    中国信息通信研究院院长余晓晖一行到访上海商汤科技

    7月8日上午, 中国信息通信研究院院长余晓晖、总工程师敖立、副总工程师王爱华一行到访上海商汤科技参观调研 ,详细了解商汤在AI技术创新、大模型开发及应用、数据安全和隐私保护等方面工作进
    的头像 发表于 07-08 18:20 1039次阅读
    <b class='flag-5'>中国信</b>息通信研究院院长余晓晖一行到访上海<b class='flag-5'>商汤</b>科技