OpenAI最新大模型曝光！剑指多模态，GPT-4之后最大升级！-电子发烧友网

大模型之争，又卷起来了。

据The information爆料称，OpenAI即将推出多模态模型GPT-vision。

如果消息为真，这将是OpenAI在GPT-4之后推出的最大更新。

另一边，谷歌的多模态模型进展也在最近传出，为的就是能和OpenAI抗衡。

目前为止，OpenAI还没有对爆料中的传闻做出回应，但此前发布过多模态模型测试。

CEO奥特曼在回应有关GPT-5的传闻时，也暗示过GPT-4“正在增强”。

究竟谁能更胜一筹，还得让子弹再飞一会儿。

不能让Google抢了先

我们先回到OpenAI，被爆料的多模态模型将搭载什么样的功能呢？

首先是图像内容识别，比如根据手绘草图生成网页代码、输出可视化图表的文本分析等。

另一方面则是图像生成，通过简单的文本生成绘画、logo或表情包。

虽然OpenAI没有对这次的爆料做出回应，但做多模态模型这件事本身只是个时间问题。

3月份，OpenAI在发布GPT-4时，就曾推出了一个多模态GPT的预览版本。

当时，OpenAI把DEMO提供给了研究帮助视障群体的机构Be My Eyes。

除了这家机构之外，就再也没有人见过OpenAI的多模态模型是什么样子了。

在此之后，这个多模态模型更是杳无音讯。

唯一和图像有点关系的，就是GPT-4的升级版代码解释器（后改名为高级数据分析）可以处理一些图片任务。

但这是通过调用Python库实现的，而且也达不到AI中图像识别的程度，和多模态模型更是不沾边了。

有说法称GPT-vision迟迟没有推出的原因可能是对安全的担忧，担心被用于破解验证码和人脸识别系统。

直到这次Google多模态模型Gemini的消息传出。

安全问题有没有解决不得而知，但也许OpenAI是真的急了，不能任由谷歌超越，才有了模型发布的传闻。

另据爆料，OpenAI还在准备从头开始开发一个名为Gobi的多模态模型，不过训练还未开始。

那么，谷歌这边的情况又是怎样的呢？

Gemini来势汹汹

来势汹汹的Gemini，让网友直言其或将成为游戏规则的改变者。

甚至有媒体夸张一些地说将有机会取代GPT-4。

Gemini主要由谷歌DeepMind团队开发。谷歌CEO皮查伊介绍，Gemini集成了多种技术，支持同时输出文本和图像，还可以使用工具和API。

据悉，Gemini吸取了很多来自AlphaGo的经验教训，包括强化学习和树搜索技术。

而且，凭借着拥有YouTube这一得天独厚的优势，海量的训练数据可以说是唾手可得。

实际上，Google也一直把OpenAI视为竞争对手。

为了和ChatGPT较量，Google此前已经在Bard中加入过图像识别功能，但并未改变ChatGPT的地位。

但这次推出的Gemini，OpenAI也感到害怕了。

尽管竞争激烈，有一点倒是让谷歌和OpenAI不谋而合。

那就是，把模型的能力变成真金白银。

谷歌计划的Gemini提供方式是通过其Google Cloud Vertex AI云服务平台进行，预期价格为每个用户每月30美元。

这一做法预计将成为谷歌新的收入来源，尤其是针对企业客户。

而OpenAI这边，也已经开始通过金融服务等各种应用程序将GPT-4变为现金。

此次多模态的角逐究竟鹿死谁手，我们拭目以待。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模型

模型

+关注

关注
1

文章
3254

浏览量
48894
python

python

+关注

关注
56

文章
4797

浏览量
84776
OpenAI

OpenAI

+关注

关注
9

文章
1096

浏览量
6561

原文标题：OpenAI最新大模型曝光！剑指多模态，GPT-4之后最大升级！

文章出处：【微信号：CVer，微信公众号：CVer】欢迎添加关注！文章转载请注明出处。

OpenAI推出新模型CriticGPT，用GPT-4自我纠错

基于GPT-4的模型——CriticGPT，这款模型专为捕获ChatGPT代码输出中的错误而设计，其独特的作用在于，让人们能够用GPT-4来查找GP

发表于 06-29 09:55 •553次阅读

OpenAI API Key获取：开发人员申请GPT-4 API Key教程

OpenAI的GPT-4模型因其卓越的自然语言理解和生成能力，成为了许多开发者的首选工具。获取GPT-4 API Key并将其应用于项目，如开发一个ChatGPT聊天应用，不仅是实

发表于 06-24 17:40 •2407次阅读

国内直联使用ChatGPT 4.0 API Key使用和多模态GPT4o API调用开发教程！

1. 前言 ChatGPT-4o API 是 OpenAI 提供的强大工具，可用于自然语言处理和多模态任务。在国内直联使用这些服务需要一些配置和技巧。本文将详细介绍

发表于 06-08 00:33 •5235次阅读

开发者如何调用OpenAI的GPT-4o API以及价格详情指南

目前，OpenAI新模型GPT-4o和GPT-4 Turbo的价格如下： GPT-4o 对比 GPT-

发表于 05-29 16:00 •1.2w次阅读

OpenAI推出面向所有用户的AI模型GPT-4o

在周一的直播盛会上，OpenAI揭开了其最新的人工智能模型GPT-4o的神秘面纱。这款新模型旨在为其著名的聊天机器人ChatGPT提供更强大、更经济的支持。

发表于 05-15 09:23 •406次阅读

OpenAI全新GPT-4o能力炸场！速度快/成本低，能读懂人类情绪

电子发烧友网报道（文/李弯弯）当地时间5月13日，OpenAI举行春季发布会，宣布将推出桌面版ChatGPT，并发布全新旗舰AI模型GPT-4

发表于 05-15 00:15 •7847次阅读

OpenAI发布GPT-4o模型，供全体用户免费使用

OpenAI首席技术官穆里·穆拉蒂（Muri Murati）指出，GPT-4o具备与GPT-4相同的智能水平，且在文本、图像及语音处理方面有显著进步。

发表于 05-14 11:17 •518次阅读

OpenAI计划宣布ChatGPT和GPT-4更新

人工智能领域的领军企业OpenAI近日宣布，将于5月13日进行一场产品更新直播，届时将揭晓ChatGPT和GPT-4的新进展。这一消息立即引发了外界对OpenAI下一项重大技术发布的广泛猜测和期待。

发表于 05-13 11:06 •597次阅读

商汤科技发布5.0多模态大模型，综合能力全面对标GPT-4 Turbo

场景应用需求；升级“日日新SenseNova 5.0”大模型体系，综合能力全面对标GPT-4 Turbo。此外对于文生视频徐立也表示商汤科技很快就会发布相关的平台产品。备受瞩目的商汤科技“日日新SenseNova” 5.0

发表于 04-24 16:49 •1122次阅读

OpenAI设立日本办事处，研发日文版GPT-4

此外，OpenAI 还计划推出适用于日语环境的 GPT-4 定制版模型。据悉，该模型在处理日文文本时表现更为出色，运行速度最高可提升至三倍；同时，其在翻译和总结日语文本方面的性能和性价

发表于 04-15 16:04 •493次阅读

OpenAI推出Vision模型版GPT-4 Turbo，融合文本与图像理解

据悉，此模型沿用GPT-4 Turbo系列特有的12.8万token窗口规模及截至2023年12月的知识库架构，其创新亮点则是强大的视觉理解功能。

发表于 04-10 10:49 •417次阅读

微软Copilot全面更新为OpenAI的GPT-4 Turbo模型

起初，Copilot作为Bing Chat AI助手推出，初期采用GPT-3.5模型，随后升级至GPT-4取得显著进步，如今再次更新至性能卓越的GP

发表于 03-13 13:42 •743次阅读

OpenAI推出ChatGPT新功能：朗读，支持37种语言，兼容GPT-4和GPT-3

据悉，“朗读”功能支持37种语言，且能够自主识别文本类型并对应相应的发音。值得关注的是，该功能对GPT-4以及GPT-3.5版本的ChatGPT均适用。此举彰显了OpenAI致力于“多

发表于 03-05 15:48 •950次阅读

Anthropic推出Claude 3系列模型，全面超越GPT-4，树立AI新标杆

近日，AI领域的领军企业Anthropic震撼发布了全新的Claude 3系列模型，该系列模型在多模态和语言能力等关键领域展现出卓越性能，成功击败了此前被广泛认为是全球最强AI

发表于 03-05 09:49 •696次阅读

全球最强大模型易主：GPT-4被超越，Claude 3系列崭露头角

近日，人工智能领域迎来了一场革命性的突破。Anthropic公司发布了全新的Claude 3系列模型，该系列模型在多模态和语言能力等关键指标上展现出卓越性能，成功超越了此前被广泛认为是

发表于 03-05 09:42 •666次阅读

搜索历史

OpenAI最新大模型曝光！剑指多模态，GPT-4之后最大升级！

评论

OpenAI推出新模型CriticGPT，用GPT-4自我纠错

OpenAI API Key获取：开发人员申请GPT-4 API Key教程

国内直联使用ChatGPT 4.0 API Key使用和多模态GPT4o API调用开发教程！

开发者如何调用OpenAI的GPT-4o API以及价格详情指南

OpenAI推出面向所有用户的AI模型GPT-4o

OpenAI全新GPT-4o能力炸场！速度快/成本低，能读懂人类情绪

OpenAI发布GPT-4o模型，供全体用户免费使用

OpenAI计划宣布ChatGPT和GPT-4更新

商汤科技发布5.0多模态大模型，综合能力全面对标GPT-4 Turbo

OpenAI设立日本办事处，研发日文版GPT-4

OpenAI推出Vision模型版GPT-4 Turbo，融合文本与图像理解

微软Copilot全面更新为OpenAI的GPT-4 Turbo模型

OpenAI推出ChatGPT新功能：朗读，支持37种语言，兼容GPT-4和GPT-3

Anthropic推出Claude 3系列模型，全面超越GPT-4，树立AI新标杆

全球最强大模型易主：GPT-4被超越，Claude 3系列崭露头角