0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenGVLab开源平台推动通用AI技术的规模化应用

商汤科技SenseTime 来源:商汤科技SenseTime 作者:商汤科技SenseTime 2022-03-08 16:14 次阅读

下面这几张图的内容分别是什么?你或许一眼就能看出是打麻将、竞速摩托、香槟、熊猫。

人工智能不一定可以。

虽然人工智能已经强大到可以识别万物,但很多AI模型只能完成单一的任务,比如识别单一的物体,或者识别风格较为统一的照片,如果换一种类型或者风格,就爱莫能助。

现在,有一位“书生”,对于这不同类型的图,它都能较为准确地识别出其中的内容,包括图画。

这需要有独特的模型训练及标签体系,也要求模型具有一定的通用性,这样才能对不同类型的图片做出准确的描述。

这位“书生”正是去年11月,由上海人工智能实验室联合商汤科技、香港中文大学、上海交通大学,联合发布的通用视觉技术体系“书生”(INTERN)。

今天,为了帮助业界更好地探索通用视觉AI技术,基于“书生”技术体系的通用视觉平台OpenGVLab正式发布并开源。

OpenGVLab开放的内容包括其超高效预训练模型,和千万级精标注、十万级标签量的公开数据集,为全球开发者提升各类下游视觉任务模型训练提供重要支持。

同时,OpenGVLab还同步开放业内首个针对通用视觉模型的评测基准,便于开发者对不同通用视觉模型的性能进行横向评估和持续调优。

目前OpenGVLab开源平台(opengvlab.shlab.org.cn)已正式上线,供各界研究人员访问和使用,后续项目还将开通在线推理功能,供所有对人工智能视觉技术感兴趣的社会人士自由体验。

超高性能模型,展现极强的通用性

OpenGVLab继承了“书生”体系的技术优势,其开源的预训练模型具有超高的性能和通用性。

具体而言,相较于当前最强开源模型(OpenAI 于2021年发布的CLIP),OpenGVLab的模型可全面覆盖分类、目标检测、语义分割、深度估计四大视觉核心任务,在准确率和数据使用效率上均取得大幅提升。

基于同样的下游场景数据,开源模型在分类、目标检测、语义分割及深度估计四大任务26个数据集上,平均错误率分别降低了40.2%、47.3%、34.8%和9.4%。

开源模型在分类、检测、分割和深度估计中,仅用10%的下游训练数据就超过了现有其他开源模型。

使用此模型,研究人员可以大幅降低下游数据采集成本,用极低的数据量,即可快速满足多场景、多任务的AI模型训练。

OpenGVLab还提供多种不同参数量、不同计算量的预训练模型,以满足不同场景的应用。模型库中列出了多个模型,其在ImageNet的微调结果和推理资源、速度,相比于之前的公开模型均有不同程度的性能提升。

开放千万级精标注数据集

高性能的模型,离不开丰富数据集的训练。

除了预训练模型,以百亿数据总量为基础,上海人工智能实验室构建了超大量级的精标注数据集,近期将进行数据开源工作。

超大量级的精标注数据集不仅整合了现有的开源数据集,还通过大规模数据图像标注任务,实现了对图像分类、目标检测以及图像分割等任务的覆盖,数据总量级近七千万。开源范围涵盖千万级精标注数据集和十万级标签体系。

目前,图像分类任务数据集已率先开源,后续还将开源目标检测任务等更多数据集。

此外,此次开源的超大标签体系,不仅几乎覆盖了所有现有开源数据集,并在此基础上扩充了大量细粒度标签,涵盖各类图像中的属性、状态等,极大丰富了图像任务的应用场景,显著降低下游数据的采集成本。

研究人员还可以通过自动化工具添加更多标签,对数据标签体系进行持续扩展和延伸,不断提高标签体系的细粒度,共同促进开源生态繁荣发展。

首个通用视觉评测基准

伴随OpenGVLab的发布,上海人工智能实验室还开放了业内首个针对通用视觉模型的评测基准,弥补通用视觉模型评测领域的空白。

当前,行业中已有的评测基准主要针对单一任务、单一视觉维度设计,无法反映通用视觉模型的整体性能,难以用于横向比较。

全新的通用视觉评测基准凭借在任务、数据等层面的创新设计,可以提供权威的评测结果,推动统一标准上的公平和准确评测,加快通用视觉模型的产业化应用步伐。

在任务设计上,OpenGVLab提供的通用视觉评测基准创新地引入了多任务评测体系,可以从分类、目标检测、语义分割、深度估计、行为识别等5类任务方向,对模型的通用性能进行整体评估。

不仅如此,该评测基准新加了仅用测试数据集10%数据量的评测设定,可以有效评估通用模型在真实数据分布下的小样本学习能力。在测试后,评测基准还会根据模型的评测结果给出相应的总分,方便使用者对不同的模型进行横向评测。

随着人工智能与产业融合的不断深入,行业对人工智能的需求逐渐从单一任务向复杂的多任务协同发展,亟需构建开源、开放的体系,以满足趋于碎片化和长尾化的海量应用需求。

OpenGVLab的开源,将帮助开发者显著降低通用视觉模型的开发门槛,用更低成本快速开发用于成百上千种视觉任务、视觉场景的算法模型,高效实现对长尾场景的覆盖,推动通用AI技术的规模化应用。

欢迎大家加入OpenGVLab,一起构筑通用AI生态。

原文标题:通用视觉研究利器来了!OpenGVLab平台正式开源

文章出处:【微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1792

    文章

    47445

    浏览量

    239051
  • 开源
    +关注

    关注

    3

    文章

    3371

    浏览量

    42584
  • 模型
    +关注

    关注

    1

    文章

    3268

    浏览量

    48937

原文标题:通用视觉研究利器来了!OpenGVLab平台正式开源

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    广汽埃安携手小马智行打造Robotaxi规模化量产车型

    近日,广汽埃安与小马智行在广汽集团番禺总部举行Robotaxi战略合作签约仪式。根据协议,双方将进一步合作打造具备商业运营竞争力的Robotaxi规模化量产车型,共同推动全无人Robotaxi量产商业落地。
    的头像 发表于 12-12 13:47 164次阅读

    蔚来能源武汉制造中心规模化量产

    近日,中国光谷迎来了蔚来能源武汉制造中心的一个重要里程碑——第100座换电站正式下线。这一事件标志着蔚来能源全球最大的能源产品生产基地已经正式迈入规模化量产的新阶段。 蔚来能源武汉制造中心占地面积约
    的头像 发表于 12-06 11:38 622次阅读

    把握关键节点,美格智能持续推动端侧AI规模化拓展

    当前,AI大模型走向端侧已经是大势所趋,端侧AI的发展将推动人工智能成为影响世界的第四次工业革命。与传统的云端大模型相比,端侧大模型拥有更小的参数体量和更垂直的训练数据。对于终端产品而言,端侧
    的头像 发表于 11-26 01:00 183次阅读
    把握关键节点,美格智能持续<b class='flag-5'>推动</b>端侧<b class='flag-5'>AI</b><b class='flag-5'>规模化</b>拓展

    把握关键节点,美格智能持续推动端侧AI规模化拓展

    当前,AI大模型走向端侧已经是大势所趋,端侧AI的发展将推动人工智能成为影响世界的第四次工业革命。与传统的云端大模型相比,端侧大模型拥有更小的参数体量和更垂直的训练数据。对于终端产品而言,端侧
    的头像 发表于 11-25 16:45 300次阅读
    把握关键节点,美格智能持续<b class='flag-5'>推动</b>端侧<b class='flag-5'>AI</b><b class='flag-5'>规模化</b>拓展

    AI高性能计算平台是什么

    AI高性能计算平台不仅是AI技术发展的基石,更是推动AI应用落地、加速产业升级的重要工具。以下,
    的头像 发表于 11-11 09:56 229次阅读

    智慧农业平台推动农业现代的科技力量

    随着信息技术的飞速发展,智慧农业平台正逐步成为推动农业现代、提高农业生产效率和质量的重要力量。智慧农业平台集成了物联网、大数据、云计算、人
    的头像 发表于 10-15 16:25 336次阅读

    南方测绘亮相中国国际北斗规模化应用博览会

    7月18日-20日,中国国际北斗规模化应用博览会在成都世纪城新国际会展中心举办。本届展会与第九届中国(成都)智慧产业国际博览会(以下简称“智慧产业博览会”)同期举办,有效推动了北斗产业产需对接
    的头像 发表于 07-22 10:55 920次阅读

    IBM加速AI规模化应用,解锁企业新质生产力

    今天,由北京市贸促会主办、以“吸收外资,助力北京高水平对外开放”为主题的北京国际投资贸易洽谈(京洽会)会在国家会议中心成功举行。IBM 大中华区董事长、总经理陈旭东应邀参会,并以“加速 AI 规模化应用,解锁企业新质生产力”为题作主旨演讲。
    的头像 发表于 07-16 09:46 573次阅读
    IBM加速<b class='flag-5'>AI</b><b class='flag-5'>规模化</b>应用,解锁企业新质生产力

    IBM陈旭东:携手IBM加速 AI 规模化应用,解锁企业新质生产力

    、总经理陈旭东应邀参会,并以"加速 AI 规模化应用,解锁企业新质生产力"为题作主旨演讲。 他认为,在企业规模化应用AI的路径中,最关键的是如何把企业数据转化为
    的头像 发表于 07-15 16:13 331次阅读
    IBM陈旭东:携手IBM加速 <b class='flag-5'>AI</b> <b class='flag-5'>规模化</b>应用,解锁企业新质生产力

    科华数据携手希姆计算,推动国产RISC-V开源AI算力快速发展

    近日,科华数据与希姆计算签署战略合作协议。依据协议,双方将利用各自的技术优势和资源,打造先进的国产AI智算中心,配备先进的硬件设备和软件系统,支持大规模
    的头像 发表于 06-30 08:36 597次阅读
    科华数据携手希姆计算,<b class='flag-5'>推动</b>国产RISC-V<b class='flag-5'>开源</b><b class='flag-5'>AI</b>算力快速发展

    科华数据携手希姆计算,推动国产RISC-V开源AI算力快速发展

    近日,科华数据与希姆计算签署战略合作协议。依据协议,双方将利用各自的技术优势和资源,打造先进的国产AI智算中心,配备先进的硬件设备和软件系统,支持大规模
    的头像 发表于 06-26 08:36 566次阅读
    科华数据携手希姆计算,<b class='flag-5'>推动</b>国产RISC-V<b class='flag-5'>开源</b><b class='flag-5'>AI</b>算力快速发展

    IBM开源AI模型,推动AI企业应用

    IBM近日宣布,将把一系列先进的人工智能模型以开源软件的形式发布,此举标志着人工智能技术在企业应用上的新篇章。公司表示,随着watsonx平台推出满一年,该平台将迎来重大更新,新增的数
    的头像 发表于 05-22 09:25 499次阅读

    比斯特自动|新能源行业降本攻坚:从自动升级推动规模化生产新篇章

    随着全球环保意识的不断加强,新能源行业的发展势头日益迅猛。然而,在快速发展的同时,新能源行业也面临着巨大的降本压力。为了应对这一挑战,规模化生产成为了行业的迫切需求,而自动升级则是实现规模化生产的关键一步。
    的头像 发表于 05-09 09:43 390次阅读
    比斯特自动<b class='flag-5'>化</b>|新能源行业降本攻坚:从自动<b class='flag-5'>化</b>升级<b class='flag-5'>推动</b><b class='flag-5'>规模化</b>生产新篇章

    声通科技:高标准及可扩展的产品能力,助力公司实现规模化经营

    高标准及可扩展的产品能力对企业发展具有重要意义,有助于企业提高运营效率、增强市场竞争力,并推动企业实现规模化发展。上海声通信息科技股份有限公司(下文称:声通科技或公司)作为我国领先的企业级全栈
    的头像 发表于 04-16 15:51 352次阅读

    蚂蚁集团AI研发部门开源AI Infra技术,助力大模型训练效率提升

    蚂蚁集团AI创新研发部门NextEvo近日宣布,他们将全面开源AI Infra技术,以推动AI
    的头像 发表于 02-04 10:01 1104次阅读