据外媒,知名机器学习公司OpenAI近日推出两套多模态人工智能系统模型DALL-E和CLIP,DALL-E可以基于文本直接生成图像,CLIP能够完成图像与文本类别的匹配。DALL-E可以将以自然语言形式表达的大量概念转换为恰当的图像,并使用了GPT-3 同样的方法,只不过DALL-E将其应用于文本-图像对。
另一个神经网络CLIP能够执行一系列视觉识别任务。给出一组以语言形式表述的类别,CLIP能够立即将一张图像与其中某个类别进行匹配,而且它不像标准神经网络那样需要针对这些类别的特定数据进行微调。在ImageNet基准上,CLIP的性能超过ResNet-50,在识别不常见图像任务中的性能远超ResNet。
虽然CLIP在识别常见对象时往往表现良好,但在计算图像中对象数量等更抽象或更系统的任务,以及预测照片中最靠近车辆间的距离等更复杂任务上的表现不佳。在这两项任务上,zero-shot CLIP的效果也只比随机猜测好一点。
责任编辑:YYX
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
人工智能
+关注
关注
1791文章
47255浏览量
238409 -
OpenAI
+关注
关注
9文章
1087浏览量
6499
发布评论请先 登录
相关推荐
亥步多模态医疗大模型发布:人工智能引领医疗新纪元
当下,人工智能(AI)正以不可阻挡之势渗透到各行各业,包括医疗行业。12月14日,2024中国医学人工智能大会的召开。会上,一款名为“亥步”的多模态医疗大
AI看点:OpenAI 世界最贵大模型 阿里将推出人工智能电商工具
给大家带来一些最新的人工智能信息,希望对大家有用。 OpenAI发布满血版ChatGPT Pro OpenAI隆重推出了备受期待的“满血版”ChatGPT Pro。这一新版本基于全新的
Meta发布多模态LLAMA 3.2人工智能模型
Meta Platforms近日宣布了一项重要技术突破,成功推出了多模态LLAMA 3.2人工智能模型。这一创新
云知声推出山海多模态大模型
在人工智能技术的浩瀚星海中,多模态交互技术正成为引领未来的新航标。继OpenAI的GPT-4o掀起滔天巨浪后,云知声以创新之姿,推出了其匠心
OpenAI发布高性价比小型AI模型GPT-4o mini
在人工智能领域持续创新的OpenAI,近日推出了其最新力作——“GPT-4o mini”,一款旨在以亲民价格提供强大功能的小型聊天机器人。这款产品的问世,标志着OpenAI在推动
智谱AI发布全新多模态开源模型GLM-4-9B
近日,智谱AI在人工智能领域取得重大突破,成功推出全新开源模型GLM-4-9B。这款模型以其卓越的多模态
OpenAI 深夜抛出王炸 “ChatGPT- 4o”, “她” 来了
当地时间5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前迈出的一大步。在GPT-4turbo的强大基础上,这种迭代拥有显著的改进。在发布会的演示中,OpenAI展示
发表于 05-27 15:43
OpenAI推出更快更便宜的大语言模型GPT-4o
美国人工智能公司OpenAI于14日凌晨正式推出了一个更快、更便宜的人工智能模型来支持其聊天机器人ChatGPT。
OpenAI推出新款人工智能模型GPT-4o
人工智能领域的领军者OpenAI在最近的春季更新活动中,重磅推出了全新升级的ChatGPT版本,它支持了GPT-4o这一强大的人工智能模型。
苹果发布300亿参数MM1多模态大模型
近日,科技巨头苹果公司在一篇由多位专家共同撰写的论文中,正式公布了其最新的多模态大模型研究成果——MM1。这款具有高达300亿参数的多模态
Anthropic 声称其新的 AI 聊天机器人模型击败了 OpenAI 的 GPT-4
的人工智能公司,该公司表示,新的Claude3系列人工智能模型的性能与Google和OpenAI的领先模型一样好,甚至更好。与早期版本不同,
OpenAI迎战纽约时报指控 非法使用其内容训练人工智能模型
OpenAI迎战纽约时报指控 《纽约时报》提起版权诉讼指控OpenAI非法使用其内容训练人工智能模型,OpenAI积极迎战,
OpenAI推出新款大模型Sora,引领多模态AI新潮流
全球人工智能领域的佼佼者OpenAI近日发布了一款名为Sora的短视频生成模型,该模型能够根据文字指令即时生成高质量短视频,引起了业界的广泛关注。
评论