0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤科技发布5.0多模态大模型,综合能力全面对标GPT-4 Turbo

A面面观 2024-04-24 16:49 次阅读

商汤科技发布5.0多模态大模型,综合能力全面对标GPT-4 Turbo

4月23日,商汤科技董事长兼CEO徐立在2024商汤技术交流日上发布了行业首个云、端、边全栈大模型产品矩阵,能够满足不同规模场景应用需求;升级“日日新SenseNova 5.0”大模型体系,综合能力全面对标GPT-4 Turbo。

此外对于文生视频徐立也表示商汤科技很快就会发布相关的平台产品。

备受瞩目的商汤科技“日日新SenseNova” 5.0多模态大模型独特地采用了混合专家(MoE)架构,能够无缝支持多达10T Tokens的中英文训练数据,并在此基础上,推理合成数据更是可高达数千亿Token。尤为值得一提的是,该模型在进行推理计算时,其上下文窗口可以扩展至约200K Token范围,使得其综合能力中的知识、推理、数学、代码等方面均能全面对标GPT-4Turbo。

商汤科技的领导团队表示,这是业界首个真正意义上的“云、端、边”全栈大模型产品矩阵,旨在满足各种规模场景的应用需求。他们坚信,公司的技术领先地位将进一步加速生成式AI向产业落地的全面跃迁,从而实现大模型的按需所取。

商汤科技的董事长兼首席执行官徐立先生表示,在遵循尺度定律(Scaling Law)的原则下,商汤科技始终致力于推动自身大模型的研发工作,并将持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力的边界。他充满信心地指出,“我们深信,2024年将会是端侧大模型爆发的重要年份。”

据了解,自去年4月首次亮相以来,商汤科技的“日日新SenseNova”大模型体系已经成功推出了五个重大版本迭代。而此次的更新重点则集中在提升了知识、数学、推理以及代码能力等多个方面,全面对标GPT-4 Turbo,并在主流客观评测中达到甚至超过了GPT-4 Turbo的水平。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 商汤科技
    +关注

    关注

    8

    文章

    508

    浏览量

    36083
  • 大模型
    +关注

    关注

    2

    文章

    2423

    浏览量

    2637
收藏 人收藏

    评论

    相关推荐

    商汤日日新模态模型权威评测第一

    刚刚,商汤科技日日新SenseNova模态模型,在权威综合评测权威平台OpenCompass的
    的头像 发表于 12-20 10:39 118次阅读

    科大讯飞发布讯飞星火4.0 Turbo:七大能力GPT-4 Turbo

    超过GPT-4 Turbo,数学能力和代码能力更是超过了Open AI最新一代GPT模型
    的头像 发表于 10-24 11:39 434次阅读

    讯飞星火内容运营大师新增三大功能

    一个月前,GPT-4o一出,打破了人们对于大模型的响应速度和模态理解能力的想象边界。6月27日,科大讯飞马上也要
    的头像 发表于 10-14 10:08 549次阅读

    商汤“日日新”大模型全面赋能2024 WAIC

    7月6日,WAIC 2024迎来第三天。 商汤科技全新升级的「日日新SenseNova 5.5」备受热议,作为国内首个具备流式原生模态交互能力的大
    的头像 发表于 07-08 15:54 617次阅读

    中文大模型测评基准SuperCLUE:商汤日日新5.0,刷新国内最好成绩

    日前,中文大模型测评基准SuperCLUE发布最新榜单,对商汤科技全新升级「日日新SenseNova 5.0」大模型进行了全方位
    的头像 发表于 05-21 14:45 725次阅读
    中文大<b class='flag-5'>模型</b>测评基准SuperCLUE:<b class='flag-5'>商汤</b>日日新<b class='flag-5'>5.0</b>,刷新国内最好成绩

    阿里云正式发布通义千问2.5,中文性能全面赶超GPT-4 Turbo

    在通义大模型发布一周年之际,阿里云迈出了历史性的一步。近日,阿里云正式发布通义千问2.5版本,其性能全面超越GPT-4
    的头像 发表于 05-13 11:16 964次阅读

    股价久违飙涨,商汤要用自己的Scaling law挑战GPT4

    前一天的“2024年商汤技术交流日”上,商汤发布了对GPT4-Turbo的大模型日日新大
    的头像 发表于 05-08 08:05 276次阅读
    股价久违飙涨,<b class='flag-5'>商汤</b>要用自己的Scaling law挑战<b class='flag-5'>GPT4</b>

    讯飞星火大模型V3.5春季升级,领域知识问答超越GPT-4 Turbo

    刘庆峰指出,现如今,星火大模型在通用长文本处理能力方面已相当成熟,覆盖长文档信息抽取、知识问答、归纳总结、文本生成等诸多领域,整体表现已达GPT-4 Turbo今年
    的头像 发表于 04-26 14:26 1025次阅读

    商汤科技联合海通证券发布业内首个面向金融行业的模态全栈式大模型

    4月23日,商汤科技正式推出“日日新SenseNova 5.0”大模型体系,并与海通证券联合发布业内首个面向金融行业的
    的头像 发表于 04-26 09:48 455次阅读
    <b class='flag-5'>商汤</b>科技联合海通证券<b class='flag-5'>发布</b>业内首个面向金融行业的<b class='flag-5'>多</b><b class='flag-5'>模态</b>全栈式大<b class='flag-5'>模型</b>

    商汤科技推出6000亿参数大模型,全力对GPT-4 Turbo

    稍晚些时候,商汤科技发布公告称,4月23日在上海临港AIDC举办技术交流日活动,推出了6000亿参数大模型(日日新5.0),其知识、数学、推
    的头像 发表于 04-25 10:11 391次阅读

    商汤科技发布日新5.0模型,对GPT-4 Turbo,预计2024年落地端侧

    据了解,4月23日,商汤科技在上海举行了技术交流日活动,公布了“云、端、边”全栈大模型产品矩阵,并对“日日新SenseNova 5.0”大模型
    的头像 发表于 04-25 09:30 566次阅读

    商汤科技新升级大模型,对GPT-4 Turbo

    昨日,商汤科技在沪举办技术交流日活动,公布了其“云、端、边”全栈大模型产品矩阵,并对“日日新SenseNova 5.0”大模型体系进行了全面
    的头像 发表于 04-24 17:17 683次阅读

    OpenAI推出Vision模型GPT-4 Turbo,融合文本与图像理解

    据悉,此模型沿用GPT-4 Turbo系列特有的12.8万token窗口规模及截至2023年12月的知识库架构,其创新亮点则是强大的视觉理解功能。
    的头像 发表于 04-10 10:49 400次阅读

    微软Copilot全面更新为OpenAI的GPT-4 Turbo模型

    起初,Copilot作为Bing Chat AI助手推出,初期采用GPT-3.5模型,随后升级至GPT-4取得显著进步,如今再次更新至性能卓越的GPT-4
    的头像 发表于 03-13 13:42 723次阅读

    Anthropic推出Claude 3系列模型全面超越GPT-4,树立AI新标杆

    近日,AI领域的领军企业Anthropic震撼发布了全新的Claude 3系列模型,该系列模型模态和语言
    的头像 发表于 03-05 09:49 678次阅读