据外媒,知名机器学习公司OpenAI近日推出两套多模态人工智能系统模型DALL-E和CLIP,DALL-E可以基于文本直接生成图像,CLIP能够完成图像与文本类别的匹配。DALL-E可以将以自然语言形式表达的大量概念转换为恰当的图像,并使用了GPT-3 同样的方法,只不过DALL-E将其应用于文本-图像对。
另一个神经网络CLIP能够执行一系列视觉识别任务。给出一组以语言形式表述的类别,CLIP能够立即将一张图像与其中某个类别进行匹配,而且它不像标准神经网络那样需要针对这些类别的特定数据进行微调。在ImageNet基准上,CLIP的性能超过ResNet-50,在识别不常见图像任务中的性能远超ResNet。
虽然CLIP在识别常见对象时往往表现良好,但在计算图像中对象数量等更抽象或更系统的任务,以及预测照片中最靠近车辆间的距离等更复杂任务上的表现不佳。在这两项任务上,zero-shot CLIP的效果也只比随机猜测好一点。
责任编辑:YYX
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
人工智能
+关注
关注
1781文章
44964浏览量
232385 -
OpenAI
+关注
关注
9文章
918浏览量
6069
发布评论请先 登录
相关推荐
OpenAI 深夜抛出王炸 “ChatGPT- 4o”, “她” 来了
当地时间5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前迈出的一大步。在GPT-4turbo的强大基础上,这种迭代拥有显著的改进。在发布会的演示中,OpenAI展示
发表于 05-27 15:43
OpenAI发布全新GPT-4o模型
近日,OpenAI宣布推出全新的GPT-4o模型,标志着人工智能领域的一大技术飞跃。这款模型不仅具备强大的生成能力,还能精准理解用户意图,提
OpenAI推出更快更便宜的大语言模型GPT-4o
美国人工智能公司OpenAI于14日凌晨正式推出了一个更快、更便宜的人工智能模型来支持其聊天机器人ChatGPT。
OpenAI推出新款人工智能模型GPT-4o
人工智能领域的领军者OpenAI在最近的春季更新活动中,重磅推出了全新升级的ChatGPT版本,它支持了GPT-4o这一强大的人工智能模型。
微软准备推出新的AI模型与谷歌及OpenAI竞争
据报道,微软在向OpenAI投资超过100亿美元后,首次成功训练了一个名为“MAI-1”的内部人工智能模型。这一模型规模庞大,足以与谷歌、Anthropic和
OpenAI迎战纽约时报指控 非法使用其内容训练人工智能模型
OpenAI迎战纽约时报指控 《纽约时报》提起版权诉讼指控OpenAI非法使用其内容训练人工智能模型,OpenAI积极迎战,
嵌入式人工智能的就业方向有哪些?
嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式人工智能领域布局
发表于 02-26 10:17
OpenAI宣布推出全新的生成式人工智能模型“Sora”
2022年末,OpenAI聊天机器人ChatGPT的面世无疑成为了引领人工智能浪潮的标志性事件,宣告了新一轮科技革命的到来。
OpenAI推出新款大模型Sora,引领多模态AI新潮流
全球人工智能领域的佼佼者OpenAI近日发布了一款名为Sora的短视频生成模型,该模型能够根据文字指令即时生成高质量短视频,引起了业界的广泛关注。
人工智能领域多模态的概念和应用场景
随着人工智能技术的不断发展,多模态成为了一个备受关注的研究方向。多模态技术旨在将不同类型的数据和信息进行融合,以实现更加准确、高效的人工智能应用。本文将详细介绍多
ai人工智能机器人
随着时间的推移,人工智能的发展越来越成熟,智能时代也离人们越来越近,近几年人工智能越来越火爆,人工智能的应用已经开始渗透到各行各业,与生活交融,成为人们无法拒绝,无法失去的一个重要存在
发表于 09-21 11:09
《通用人工智能:初心与未来》-试读报告
作者给出的结论。整体读下来,可以给我们关于通用人工智能全面的了解。作者也反复强调了通用人工智能与专用智能的区别。尤其是人们错误的认为一堆专用智能堆砌起来就是通用
发表于 09-18 10:02
如何将人工智能应用到效能评估系统软件中去解决
如何将人工智能应用到效能评估系统软件中去解决
华盛恒辉效能评估系统是一种非常实用的管理工具,它可以帮助组织和企业掌握其运营状况,优化业务流程,提高效率和生产力。然而,随着人工智能
发表于 08-30 12:58
评论