腾讯AI Lab宣布正式开源“Tencent ML-Images”项目-电子发烧友网

今日，腾讯AI Lab宣布正式开源“Tencent ML-Images”项目，该项目由多标签图像数据集ML-Images，以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。

该项目的开源，是腾讯AI Lab在计算机视觉领域所累积的基础能力的一次释放，为人工智能领域的科研人员和工程师提供了充足的高质量训练数据，及简单易用、性能强大的深度学习模型，促进人工智能行业共同发展。

腾讯AI Lab此次公布的图像数据集ML-Images，包含了1800万图像和1.1万多种常见物体类别，在业内已公开的多标签图像数据集中规模最大，足以满足一般科研机构及中小企业的使用场景。此外，基于ML-Images训练得到的深度残差网络ResNet-101，具有优异的视觉表示能力和泛化性能，在当前业内同类模型中精度最高，将为包括图像、视频等在内的视觉任务提供强大支撑，并助力图像分类、物体检测、物体跟踪、语义分割等技术水平的提升。

本次正式开源，其主要内容包括：

ML-Images数据集的全部图像URLs,以及相应的类别标注。因原始图像版权问题，此次开源将不直接提供原始图像，用户可利用腾讯AI Lab提供的下载代码和URLs自行下载图像。

ML-Images数据集的详细介绍。包括图像来源、图像数量、类别数量、类别的语义标签体系、标注方法，以及图像的标注数量等统计量。

完整的代码和模型。腾讯AI Lab提供的代码涵盖从图像下载和图像预处理，到基于ML-Images的预训练和基于ImageNet的迁移学习，再到基于训练所得模型的图像特征提取的完整流程。项目提供了基于小数据集的训练示例，以方便用户快速体验该训练流程。项目还提供了具有极高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求，随意选用该项目的代码或模型。

以深度神经网络为典型代表的深度学习技术已经在很多领域充分展现出其优异的能力，尤其是计算机视觉领域，包括图像和视频的分类、理解和生成等重要任务。然而，要充分发挥出深度学习的视觉表示能力，必须建立在充足的高质量训练数据、优秀的模型结构和模型训练方法，以及强大的的计算资源等基础能力之上。

各大科技公司都非常重视人工智能基础能力的建设，都建立了仅面向其内部的大型图像数据集，例如谷歌的JFT-300M和Facebook的Instagram数据集。但这些数据集及其训练得到的模型都没有公开，对于一般的科研机构和中小企业来说，这些人工智能基础能力有着非常高的门槛。

当前业内公开的最大规模的多标签图像数据集是谷歌公司的Open Images, 包含900万图像和6000多物体类别。腾讯AI Lab此次开源的ML-Images数据集包括1800万图像和1.1万多常见物体类别，或将成为新的行业基准数据集。

此外，基于ML-Images训练得到的ResNet-101模型，具有优异的视觉表示能力和泛化性能。通过迁移学习，该模型在ImageNet验证集上取得了80.73%的top-1分类精度，超过谷歌同类模型（迁移学习模式）的精度，且值得注意的是，ML-Images的规模仅为JFT-300M的约1/17。这充分说明了ML-Images的高质量和训练方法的有效性。详细对比如下表。

注：微软ResNet-101模型为非迁移学习模式下训练得到，即1.2M预训练图像为原始数据集ImageNet的图像。

腾讯AI Lab此次开源的“Tencent ML-Images”项目，展现了腾讯在人工智能基础能力建设方面的努力，以及希望通过基础能力的开放促进行业共同发展的愿景。

“Tencent ML-Images”项目的深度学习模型，目前已在腾讯多项业务中发挥重要作用，如“天天快报”的图像质量评价与推荐功能，其后台测试的日调用量已达1000万次。

如下图所示，天天快报新闻封面图像的质量得到明显提高。

左图为优化前，右图为优化后

此外，腾讯AI Lab团队还将基于Tencent ML-Images的ResNet-101模型迁移到很多其他视觉任务，包括图像物体检测，图像语义分割，视频物体分割，视频物体跟踪等。这些视觉迁移任务进一步验证了该模型的强大视觉表示能力和优异的泛化性能。“Tencent ML-Images”项目未来还将在更多视觉相关的产品中发挥重要作用。

自2016年腾讯首次在GitHub上发布开源项目（https://github.com/Tencent），目前已累积开源覆盖人工智能、移动开发、小程序等领域的57个项目。为进一步贡献开源社区，腾讯相继加入Hyperledger、LF Networking和开放网络基金会，并成为LF深度学习基金会首要创始成员及Linux基金会白金会员。作为腾讯“开放”战略在技术领域的体现，腾讯开源将继续对内推动技术研发向共享、复用和开源迈进，向外释放腾讯研发实力，为国内外开源社区提供技术支持，注入研发活力。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

腾讯

腾讯

+关注

关注
7

文章
1659

浏览量
49489
数据集

数据集

+关注

关注
4

文章
1208

浏览量
24739
深度学习

深度学习

+关注

关注
73

文章
5507

浏览量
121296

原文标题：腾讯AI Lab正式开源业内最大规模多标签图像数据集

文章出处：【微信号：AppDowns，微信公众号：掌上科技频道】欢迎添加关注！文章转载请注明出处。

腾讯混元大模型开源成绩斐然，GitHub Star数近1.4万

近日，在2024年12月24日举办的开放原子开发者大会暨首届开源技术学术大会上，腾讯云副总裁、腾讯混元大模型负责人刘煜宏发表了重要演讲。他强调，腾讯始终将

发表于 12-26 10:30 •230次阅读

开源AI模型库是干嘛的

开源AI模型库是指那些公开源代码、允许自由访问和使用的AI模型集合。这些模型通常经过训练，能够执行特定的任务。以下，是对开源

发表于 12-14 10:33 •208次阅读

腾讯申请注册“腾讯云AI代码助手”商标

近日，腾讯科技(深圳)有限公司正式向相关机构申请注册了两枚“腾讯云AI代码助手”商标。这两枚商标的国际分类分别为科学仪器和网站服务，目前正处于等待实质审查的阶段。据了解，腾讯云

发表于 12-13 10:28 •282次阅读

腾讯申请注册多枚“腾讯AI助手”商标

近日，根据爱企查App的最新数据显示，腾讯科技(深圳)有限公司在商标领域有了新动作，该公司已经正式申请注册了多枚“腾讯AI助手”商标。这一举动无疑展示了腾讯在人工智能(

发表于 11-19 11:01 •438次阅读

全球首个开源AI标准正式发布

近日，在备受瞩目的2024年ALL THINGS OPEN大会上，开源组织Open Source Initiative（OSI）宣布了一项重大突破——正式发布了开源人工智能定义（OSAID）1.0版本。这一里程碑式的成就标志着全

发表于 10-31 10:59 •279次阅读

Llama 3 与开源AI模型的关系

在人工智能（AI）的快速发展中，开源AI模型扮演着越来越重要的角色。它们不仅推动了技术的创新，还促进了全球开发者社区的合作。Llama 3，作为一个新兴的AI

发表于 10-27 14:42 •394次阅读

真格基金宣布捐赠开源AI项目vLLM

万个通用人工智能项目，Hugging Face 上有超过 40 万个模型。每一周，有超过 100 万行代码在开源 AI 领域中创建，开发者像交换礼物一样，从全世界的各个角落为开源

发表于 09-24 16:13 •400次阅读

开源 KiCad/AD 查看器 + AI Copilot?

使用，从一个电阻到一个复杂的 MCU，机器人都能给你解释的清清楚楚，省时省力！开源的 EDA 查看器之前推荐过一个非常不错的项目：KiCanvas。这个 EDAViewer 就是在 KiCanvas

发表于 08-18 22:41

SensiML开源AutoML解决方案-Piccolo AI发布

的功能引入微控制器和IoT边缘设备，使其更容易生成ML推理模型，而无需广泛的数据科学专业知识。对于企业团队，请联系SensiML获取软件许可。 Piccolo AI项目包括 SensiML的M

发表于 07-22 16:53 •785次阅读

深兰AI数字伙伴项目入选“AI Partner·2024 AI应用标杆案例”

近期，36氪揭晓了“AI Partner·2024 AI应用标杆案例”，深兰AI数字伙伴项目从200多个报名项目中脱颖而出，当选标杆案例。一

发表于 05-23 10:34 •456次阅读

最新开源代码证实！“鸿蒙原生版”微信正在积极开发中

话不多说，直接看图：这是 MMKV 最新版本 v1.3.5 的发布说明。 MMKV 是微信团队开源的键值对(Key-Value)存储系统，也是微信客户端自用的底层基础组件。发布说明写道

发表于 05-08 17:08

红帽发布RHEL AI开发者预览版，集成IBM Granite模型，简化AI开发流程

RHEL AI依托InstructLab开源项目，结合IBM Research的开源授权Granite大型语言模型与InstructLab模型对齐工具，采用

发表于 05-08 15:01 •504次阅读

腾讯突然宣布，微信鸿蒙版要来了！

今年初，华为宣布HarmonyOS NEXT命名为“鸿蒙星河版” ，并计划在二季度启动开发者 Beta 计划，四季度发布商用正式版。消息一出，不少人为之振奋。鸿蒙星河版因不再兼容安卓开源

发表于 04-30 19:34

Alif Semiconductor宣布推出先进的BLE和Matter无线微控制器，搭载适用于AI/ML工作负载的神经网络协同处理器

4 月 18 日 -先进的安全、互联、节能的人工智能和机器学习（AI/ML）微控制器（MCU）和融合处理器供应商Alif Semiconductor®今天宣布推出Balletto™系列。该系列是先进

发表于 04-18 17:51 •687次阅读

是德科技推出AI数据中心测试平台旨在加速AI/ML网络验证和优化的创新

2024年2月29日，是德科技（Keysight Technologies,Inc.）宣布，针对人工智能（AI）和机器学习（ML）基础设施生态系统，推出了 AI数据中心测试平台，旨在加

发表于 02-29 09:32 •650次阅读

搜索历史

腾讯AI Lab宣布正式开源“Tencent ML-Images”项目

评论

腾讯混元大模型开源成绩斐然，GitHub Star数近1.4万

开源AI模型库是干嘛的

腾讯申请注册“腾讯云AI代码助手”商标

腾讯申请注册多枚“腾讯AI助手”商标

全球首个开源AI标准正式发布

Llama 3 与开源AI模型的关系

真格基金宣布捐赠开源AI项目vLLM

开源 KiCad/AD 查看器 + AI Copilot?

SensiML开源AutoML解决方案-Piccolo AI发布

深兰AI数字伙伴项目入选“AI Partner·2024 AI应用标杆案例”

最新开源代码证实！“鸿蒙原生版”微信正在积极开发中

红帽发布RHEL AI开发者预览版，集成IBM Granite模型，简化AI开发流程

腾讯突然宣布，微信鸿蒙版要来了！

Alif Semiconductor宣布推出先进的BLE和Matter无线微控制器，搭载适用于AI/ML工作负载的神经网络协同处理器

是德科技推出AI数据中心测试平台旨在加速AI/ML网络验证和优化的创新