0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OPPO登顶CLUE与MUGE,刷新中文自然语言理解与图文多模态双榜记录

荷叶塘 来源:OPPO 作者:厂商供稿 2022-11-10 16:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2022年11月9日,OPPO语音语义研究部融智团队提出的中文预训练大模型CHAOS ,在中文自然语言理解测评基准CLUE上登顶,以30亿参量同时刷新了CLUE总排行榜、CLUE分类任务排行榜和CLUE阅读理解排行榜的最好成绩。其中在“AFQMC,TNEWS,CSL,CHID1.1”4个赛道的成绩超过了人类识别精确准确度,总成绩距离超越人类表现仅差0.1。

同期,在业界首个大规模中文多模态评测基准MUGE上,该团队自主训练的中文多模态预训练模型也在综合“图文检索、看图说话、文本到图像生成”三个赛道的总成绩上位列总榜第一名。


OPPO 中文预训练大模型CHAOS登顶CLUE


OPPO中文多模态预训练模型登顶MUGE


CLUE (Chinese Language Understanding Evaluation) 是中文自然语言理解最权威测评榜单之一,包含了文本分类、阅读理解、句间关系等众多语义分析和语义理解类子任务,旨在推动NLP(自然语言处理)训练模型技术的不断进步和突破,对学术界和工业界都产生了较大的影响。

MUGE(Multimodal Understanding and Generation Evaluation)是业界首个大规模中文多模态评测基准,由达摩院联合浙江大学、阿里云天池平台联合发布,中国计算机学会计算机视觉专委会(CCF-CV专委)协助推出,旨在帮助中文多模态研究人员全方位评估算法模型。

NLP(自然语言处理)技术是人工智能领域的一个核心研究方向,其目的是使得计算机具备人类的听、说、读、写等能力,并利用知识和常识进行推理和决策。而图文融合的多模态能力的建设,目前工作主要集中在建立图像模态和文本模态的联系,相关能力的构建能够广泛落地到搜索、推荐、服饰设计、智能文案等真实场景中。

“融合多种智能,研发统一的基础模型”是OPPO语音语义研究部融智团队的目标,也是“融智”二字的含义。未来融智团队将在推进感知认知融合,更可控/可编辑的视觉生成,及促进工业化落地转化的模型小型化等方向上继续突破。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • OPPO
    +关注

    关注

    20

    文章

    5304

    浏览量

    85452
  • 人工智能
    +关注

    关注

    1821

    文章

    50510

    浏览量

    267687
  • 自然语言处理

    关注

    1

    文章

    630

    浏览量

    14756
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    模态大模型 前沿算法与实战应用 第一季》精品课程简介

    全栈掌握模态:从算法原理到项目落地的技术实践 在人工智能从单模态模态跨越的进程中,全栈开发者需要同时
    发表于 05-01 17:46

    视美泰模态融合+姿态感知技术,让机器真正 “读懂” 世界

    如果说传统监控是记录世界的"眼睛",那么融合了模态融合算法与姿态估计算法的视美泰解决方案,则是一颗能理解物理世界的"大脑"。它不再局限于单一的视觉识别,而是
    的头像 发表于 04-29 14:59 284次阅读
    视美泰<b class='flag-5'>多</b><b class='flag-5'>模态</b>融合+姿态感知技术,让机器真正 “读懂” 世界

    商汤科技正式开源模态自主推理模型SenseNova-MARS

    今日,商汤正式开源模态自主推理模型 SenseNova-MARS(8B/32B 版本),其在模态搜索与推理的核心基准测试中以 69.7
    的头像 发表于 01-30 10:13 875次阅读
    商汤科技正式开源<b class='flag-5'>多</b><b class='flag-5'>模态</b>自主推理模型SenseNova-MARS

    商汤开源SenseNova-MARS:突破模态搜索推理天花板

    今日,商汤正式开源模态自主推理模型 SenseNova-MARS(8B/32B 版本),其在模态搜索与推理的核心基准测试中以 69.7
    的头像 发表于 01-29 23:53 302次阅读
    商汤开源SenseNova-MARS:突破<b class='flag-5'>多</b><b class='flag-5'>模态</b>搜索推理天花板

    自然语言处理NLP的概念和工作原理

    自然语言处理 (NLP) 是人工智能 (AI) 的一个分支,它会教计算机如何理解口头和书面形式的人类语言自然语言处理将计算语言学与机器学习
    的头像 发表于 01-29 14:01 683次阅读
    <b class='flag-5'>自然语言</b>处理NLP的概念和工作原理

    商汤科技日日新V6.5荣获2025年模态大模型全国第一

    近日,权威大模型评测基准 SuperCLUE 发布《中文模态视觉语言模型测评基准12月报告》,商汤日日新V6.5(SenseNova V6.5 Pro)以75.35的总分位列国内第一
    的头像 发表于 01-06 14:44 1032次阅读
    商汤科技日日新V6.5荣获2025年<b class='flag-5'>多</b><b class='flag-5'>模态</b>大模型全国第一

    云知声论文入选自然语言处理顶会EMNLP 2025

    近日,自然语言处理(NLP)领域国际权威会议 ——2025 年计算语言学与自然语言处理国际会议(EMNLP 2025)公布论文录用结果,云知声提交的《面向门诊病历生成的高质量医患对话合成技术
    的头像 发表于 11-10 17:30 960次阅读
    云知声论文入选<b class='flag-5'>自然语言</b>处理顶会EMNLP 2025

    格灵深瞳模态大模型Glint-ME让图文互搜更精准

    在电商、安防等场景下,图文互搜应用广泛。随着以CLIP为代表的模态表征方法相继提出,过去单一模态搜索(文搜文、图搜图)被突破,模型可以同时理解
    的头像 发表于 11-02 15:56 1935次阅读
    格灵深瞳<b class='flag-5'>多</b><b class='flag-5'>模态</b>大模型Glint-ME让<b class='flag-5'>图文</b>互搜更精准

    商汤日日新V6.5模态大模型登顶全球权威榜单

    Pro)模态大模型以82.2的综合成绩登顶榜首,领先Gemini 2.5 Pro以及GPT-5等国际顶尖模型。
    的头像 发表于 09-10 09:55 1037次阅读

    成都汇阳投资关于大模型白热化,应用加速分化

    Gemini 2.5 Flash Image登顶 主流图像,Meta 也从 Midjourney 授权 AI 图像模型;视频领域,阿里字节等刷新能力高度 ,谷歌将视频模型推进至实
    的头像 发表于 09-09 09:30 1154次阅读

    米尔RK3576部署端侧模态轮对话,6TOPS算力驱动30亿参数LLM

    加载 → 图片预处理 → 用户交互 → 推理输出”的核心流程,支持图文一体的模态对话,适配轮问答、视觉问答等典型场景。 具体运行机制可拆解为以下步骤:1. 模型初始化首先加载大
    发表于 09-05 17:25

    浅析模态标注对大模型应用落地的重要性与标注实例

    ​在人工智能迈向AGI通用智能的关键道路上,大模型正从单一的文本理解者,演进为能同时看、听、读、想的“多面手”。驱动这一进化的核心燃料,正是高质量的模态数据,而将原始数据转化为“机器可读教材
    的头像 发表于 09-05 13:49 2983次阅读

    【HZ-T536开发板免费体验】5- 无需死记 Linux 命令!用 CangjieMagic 在 HZ-T536 开发板上搭建 MCP 服务器,自然语言轻松控板

    GPIO 等),并返回结果。 Cangjie Magic 角色 :构建MCP服务器,同时提供自然语言理解能力,将用户输入的文本(如 “查看开发板 IP 地址”“点亮 LED1”)转换为机器可识别的指令(如
    发表于 08-23 13:10

    飞凌嵌入式RK3576模态大模型图像理解助手,让嵌入式设备“看懂”世界

    (LLM)+视觉语言模型(VLM)模态架构,推出模态大模型图像理解助手,为嵌入式设备打造 “
    的头像 发表于 07-25 11:09 1895次阅读
    飞凌嵌入式RK3576<b class='flag-5'>多</b><b class='flag-5'>模态</b>大模型图像<b class='flag-5'>理解</b>助手,让嵌入式设备“看懂”世界

    云知声四篇论文入选自然语言处理顶会ACL 2025

    结果正式公布。云知声在此次国际学术盛会中表现卓越,共有4篇论文被接收,其中包括2篇主会论文(Main Paper)和2篇Findings。入选的4篇论文聚焦大语言模型知识溯源、图文模态
    的头像 发表于 05-26 14:15 1536次阅读
    云知声四篇论文入选<b class='flag-5'>自然语言</b>处理顶会ACL 2025