0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI最新大模型曝光!剑指多模态,GPT-4之后最大升级!

CVer 来源:量子位(QbitAI) 2023-09-20 17:34 次阅读

大模型之争,又卷起来了。

据The information爆料称,OpenAI即将推出多模态模型GPT-vision。

如果消息为真,这将是OpenAI在GPT-4之后推出的最大更新。

另一边,谷歌的多模态模型进展也在最近传出,为的就是能和OpenAI抗衡。

02048bbc-5774-11ee-939d-92fbcf53809c.png

目前为止,OpenAI还没有对爆料中的传闻做出回应,但此前发布过多模态模型测试。

CEO奥特曼在回应有关GPT-5的传闻时,也暗示过GPT-4“正在增强”。

究竟谁能更胜一筹,还得让子弹再飞一会儿。

不能让Google抢了先

我们先回到OpenAI,被爆料的多模态模型将搭载什么样的功能呢?

首先是图像内容识别,比如根据手绘草图生成网页代码、输出可视化图表的文本分析等。

另一方面则是图像生成,通过简单的文本生成绘画、logo或表情包。

虽然OpenAI没有对这次的爆料做出回应,但做多模态模型这件事本身只是个时间问题。

3月份,OpenAI在发布GPT-4时,就曾推出了一个多模态GPT的预览版本。

当时,OpenAI把DEMO提供给了研究帮助视障群体的机构Be My Eyes。

除了这家机构之外,就再也没有人见过OpenAI的多模态模型是什么样子了。

023532ee-5774-11ee-939d-92fbcf53809c.png

在此之后,这个多模态模型更是杳无音讯。

唯一和图像有点关系的,就是GPT-4的升级版代码解释器(后改名为高级数据分析)可以处理一些图片任务。

但这是通过调用Python库实现的,而且也达不到AI中图像识别的程度,和多模态模型更是不沾边了。

02438dc6-5774-11ee-939d-92fbcf53809c.png

有说法称GPT-vision迟迟没有推出的原因可能是对安全的担忧,担心被用于破解验证码和人脸识别系统。

直到这次Google多模态模型Gemini的消息传出。

025abb72-5774-11ee-939d-92fbcf53809c.png

安全问题有没有解决不得而知,但也许OpenAI是真的急了,不能任由谷歌超越,才有了模型发布的传闻。

另据爆料,OpenAI还在准备从头开始开发一个名为Gobi的多模态模型,不过训练还未开始。

那么,谷歌这边的情况又是怎样的呢?

Gemini来势汹汹

来势汹汹的Gemini,让网友直言其或将成为游戏规则的改变者。

026ce810-5774-11ee-939d-92fbcf53809c.png

甚至有媒体夸张一些地说将有机会取代GPT-4。

0282117c-5774-11ee-939d-92fbcf53809c.png

Gemini主要由谷歌DeepMind团队开发。谷歌CEO皮查伊介绍,Gemini集成了多种技术,支持同时输出文本和图像,还可以使用工具和API

据悉,Gemini吸取了很多来自AlphaGo的经验教训,包括强化学习和树搜索技术。

而且,凭借着拥有YouTube这一得天独厚的优势,海量的训练数据可以说是唾手可得。

实际上,Google也一直把OpenAI视为竞争对手。

为了和ChatGPT较量,Google此前已经在Bard中加入过图像识别功能,但并未改变ChatGPT的地位。

但这次推出的Gemini,OpenAI也感到害怕了。

尽管竞争激烈,有一点倒是让谷歌和OpenAI不谋而合。

那就是,把模型的能力变成真金白银。

谷歌计划的Gemini提供方式是通过其Google Cloud Vertex AI云服务平台进行,预期价格为每个用户每月30美元。

这一做法预计将成为谷歌新的收入来源,尤其是针对企业客户。

而OpenAI这边,也已经开始通过金融服务等各种应用程序将GPT-4变为现金。

此次多模态的角逐究竟鹿死谁手,我们拭目以待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3184

    浏览量

    48763
  • python
    +关注

    关注

    56

    文章

    4784

    浏览量

    84502
  • OpenAI
    +关注

    关注

    9

    文章

    1052

    浏览量

    6426

原文标题:OpenAI最新大模型曝光!剑指多模态,GPT-4之后最大升级!

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    OpenAI推出新模型CriticGPT,用GPT-4自我纠错

    基于GPT-4模型——CriticGPT,这款模型专为捕获ChatGPT代码输出中的错误而设计,其独特的作用在于,让人们能够用GPT-4来查找GP
    的头像 发表于 06-29 09:55 524次阅读

    OpenAI API Key获取:开发人员申请GPT-4 API Key教程

      OpenAIGPT-4模型因其卓越的自然语言理解和生成能力,成为了许多开发者的首选工具。获取GPT-4 API Key并将其应用于项目,如开发一个ChatGPT聊天应用,不仅是实
    的头像 发表于 06-24 17:40 2195次阅读
    <b class='flag-5'>OpenAI</b> API Key获取:开发人员申请<b class='flag-5'>GPT-4</b> API Key教程

    国内直联使用ChatGPT 4.0 API Key使用和模态GPT4o API调用开发教程!

    1. 前言 ChatGPT-4o API 是 OpenAI 提供的强大工具,可用于自然语言处理和模态任务。在国内直联使用这些服务需要一些配置和技巧。本文将详细介绍
    的头像 发表于 06-08 00:33 4654次阅读
    国内直联使用ChatGPT 4.0 API Key使用和<b class='flag-5'>多</b><b class='flag-5'>模态</b><b class='flag-5'>GPT4</b>o API调用开发教程!

    开发者如何调用OpenAIGPT-4o API以及价格详情指南

    ​目前,OpenAI模型GPT-4o和GPT-4 Turbo的价格如下: GPT-4o 对比 GPT-
    的头像 发表于 05-29 16:00 1w次阅读
    开发者如何调用<b class='flag-5'>OpenAI</b>的<b class='flag-5'>GPT-4</b>o API以及价格详情指南

    OpenAI推出面向所有用户的AI模型GPT-4o

    在周一的直播盛会上,OpenAI揭开了其最新的人工智能模型GPT-4o的神秘面纱。这款新模型旨在为其著名的聊天机器人ChatGPT提供更强大、更经济的支持。
    的头像 发表于 05-15 09:23 376次阅读

    OpenAI全新GPT-4o能力炸场!速度快/成本低,能读懂人类情绪

    电子发烧友网报道(文/李弯弯)当地时间5月13日,OpenAI举行春季发布会,宣布将推出桌面版ChatGPT,并发布全新旗舰AI模型GPT-4
    的头像 发表于 05-15 00:15 7788次阅读

    OpenAI计划宣布ChatGPT和GPT-4更新

    人工智能领域的领军企业OpenAI近日宣布,将于5月13日进行一场产品更新直播,届时将揭晓ChatGPT和GPT-4的新进展。这一消息立即引发了外界对OpenAI下一项重大技术发布的广泛猜测和期待。
    的头像 发表于 05-13 11:06 567次阅读

    商汤科技发布5.0模态模型,综合能力全面对标GPT-4 Turbo

    场景应用需求;升级“日日新SenseNova 5.0”大模型体系,综合能力全面对标GPT-4 Turbo。 此外对于文生视频徐立也表示商汤科技很快就会发布相关的平台产品。 备受瞩目的商汤科技“日日新SenseNova” 5.0
    的头像 发表于 04-24 16:49 1081次阅读

    OpenAI设立日本办事处,研发日文版GPT-4

    此外,OpenAI 还计划推出适用于日语环境的 GPT-4 定制版模型。据悉,该模型在处理日文文本时表现更为出色,运行速度最高可提升至三倍;同时,其在翻译和总结日语文本方面的性能和性价
    的头像 发表于 04-15 16:04 462次阅读

    微软Copilot全面更新为OpenAIGPT-4 Turbo模型

    起初,Copilot作为Bing Chat AI助手推出,初期采用GPT-3.5模型,随后升级GPT-4取得显著进步,如今再次更新至性能卓越的GP
    的头像 发表于 03-13 13:42 691次阅读

    OpenAI推出ChatGPT新功能:朗读,支持37种语言,兼容GPT-4GPT-3

    据悉,“朗读”功能支持37种语言,且能够自主识别文本类型并对应相应的发音。值得关注的是,该功能对GPT-4以及GPT-3.5版本的ChatGPT均适用。此举彰显了OpenAI致力于“
    的头像 发表于 03-05 15:48 877次阅读

    Anthropic推出Claude 3系列模型,全面超越GPT-4,树立AI新标杆

    近日,AI领域的领军企业Anthropic震撼发布了全新的Claude 3系列模型,该系列模型模态和语言能力等关键领域展现出卓越性能,成功击败了此前被广泛认为是全球最强AI
    的头像 发表于 03-05 09:49 656次阅读

    全球最强大模型易主:GPT-4被超越,Claude 3系列崭露头角

    近日,人工智能领域迎来了一场革命性的突破。Anthropic公司发布了全新的Claude 3系列模型,该系列模型模态和语言能力等关键指标上展现出卓越性能,成功超越了此前被广泛认为是
    的头像 发表于 03-05 09:42 620次阅读

    ChatGPT plus有什么功能?OpenAI 发布 GPT-4 Turbo 目前我们所知道的功能

    OpenAI 发布 GPT-4 Turbo 目前我们所知道的功能分析解答 在最近的OpenAI DevDay上,该组织发布了一项备受期待的公告:推出GPT-4 Turbo,这是对其突破
    的头像 发表于 12-13 09:19 1080次阅读
    ChatGPT plus有什么功能?<b class='flag-5'>OpenAI</b> 发布 <b class='flag-5'>GPT-4</b> Turbo 目前我们所知道的功能

    OpenAI发布的GPT-4 Turbo版本ChatGPT plus有什么功能?

    OpenAIGPT-4 Turbo以前所未有的功能和价格改变人工智能的未来 在人工智能领域的一次里程碑式活动中,OpenAI开发者大会上发布了GPT-4 Turbo,这是突破性人工智
    的头像 发表于 12-05 17:57 2419次阅读
    <b class='flag-5'>OpenAI</b>发布的<b class='flag-5'>GPT-4</b> Turbo版本ChatGPT plus有什么功能?