谷歌Gemini被曝夸大营销？碾压GPT4纯靠“一张嘴”-电子发烧友网

Gemini对谷歌来说可能走了一大步，但对整个AI领域而言，并没有说的那么夸张。

涉嫌虚假宣传，交互非实时感知

才短短一天时间，谷歌Gemini就被曝涉嫌造假，夸大宣传。

作为谷歌用来应对GPT-4的“杀手锏”，Gemini一经亮相就有了两个硕大的标签：超过人类专家，碾压GPT-4。随便单拎一条出来，都是目前其他大模型所不能比拟的成绩。

但也有越来越多的人开始质疑它的真实性，彭博社的Parmy Olsen就是第一个质疑视频造假的人。

就在大家震惊于谷歌发布的6分钟互动视频里，他指出，Gemini所有交互都不是实时感知的，存在后期制作和剪辑配音的成分。随后这一说法也得到了谷歌官方的证实，承认Gemini的确使用了静态图片和多段提示词拼凑，才能达成这样的效果。

简单来说就是，Gemini不能直接看懂一段动作视频，只能看懂多张图片。像演示视频里人类在玩石头剪刀布，实际上是把“布”“拳头”“剪刀”三张照片依次传给Gemini，然后加上良好的提示词，才能让Gemini给出回答，然后再由员工配音念出来。

而且视频中展示的许多其他功能并不是谷歌独有的，GPT Plus3也可以做得到，沃顿商学院教授伊森·莫里克（Ethan Mollick）就用实验证实了这一点。

虽然从技术原理上来看，能够读取图片和能够看懂视频之间，并没有技术上的鸿沟。但是从产品实现落地的角度看，把读取图片约等于能实时看懂视频，过于强调实时性而压缩了交互过程中的延迟，这几乎已经可以理解为虚假宣传。而是否需要良好的提示词工程，更是评价模型能力的关键问题。

混淆跑分，GPT4测试标准不一致

从谷歌对Gemini的宣传信息来看，它声称Gemini在32项标准性能指标中，有30 项指标都优于GPT-4，跑出90%的高分，超过GPT-4。但实际上，差距微乎其微，而且这种比较并不公平。

Gemini Ultra的90%得分是基于谷歌研究人员开发的一种基于32个样本的思维链的方法。对于同一个问题，Gemini Ultra会生成32个答案以及这些答案的推理。然后，模型会选择最常见的答案作为最终答案。

但GPT-4的86.4%分数是基于行业评估标准5-shot。HuggingFace技术主管Philipp Schmid特意从Gemini的技术报告中提取数据重做计算，在5-shot的标准下，Gemini的得分实为83.7%，比GPT-4更低。

也就是说只有CoT（思维链）达到32个例子时，Gemini Ultra才能达到90分超过GPT-4；当例子数量减少到5个，Gemini Ultra得分就不如GPT-4。难怪连谷歌公司高管在之前都回避了关于该模型比GPT-4 强多少的问题，因为它们只是“强”在了不同的标准上。

就像谷歌在5月份发布Palm-2的时候，也挑出了两个优于GPT-4的指标，但是后来这个大模型怎么样，大家都清楚。

斯坦福大学基础模型研究中心主任 Percy Liang也谈到，虽然Gemini有很好的基准分数，但由于不知道训练数据的内容，因此很难解释这些数据。华盛顿大学计算语言学教授 Emily Bender也指出，谷歌宣传Gemini是一台万能机器，是一个可用于多种不同用途的通用模型。但是谷歌却在使用狭隘的基准，来评估它期望用于这些不同用途的模型，这意味着它实际上无法得到彻底评估。

仓促上阵，只为趁OpenAI动荡搞事？

今年3月，OpenAI发布GPT人工智能模型，并推出其支持的付费聊天AI机器人ChatGPT，这其实对谷歌来说压力很大。

毕竟谷歌已经耗费了数年心血，在人工智能领域投入巨资研究，却没想到被半路杀出来的OpenAI弯道超车。

所以在4月，谷歌迫于投资方的巨大压力，将负责人工智能研究的Google Brain，与母公司Alphabet位于伦敦的人工智能研究实验室DeepMind合并，为了在今年接下来的时间里研发Gemini模型来回应GPT-4的挑战。

而在两周前，OpenAI刚刚重新任命了奥特曼为首席执行官，并任命了新的董事会成员，勉强给这家初创公司的一段动荡期画上了句号。这场内斗事件也促使一些客户开始评估其他AI提供商，谷歌选择在这个时间点推出Gemini的心思不言而喻。

据报道，当OpenAI董事会暂时罢免首席执行官奥特曼，使公司的未来发展受到质疑时，谷歌迅速发起了一场营销活动，说服OpenAI企业客户转向谷歌。现在，随着Gemini的发布，谷歌也正是在利用这种不确定性。

然而，目前大多数人还是不能完整地体验Gemini。最强大的对标GPT-4的满血版Gemini Ultra，还需要等待几个月才能和公众见面。据谷歌高管的说法，预计将于明年初上市。而现在推出的版本是为谷歌基于文本的搜索聊天机器人Bard的后台，为其提供更高级的推理、规划和理解能力。

在接下来的几个月里，新的Gemini增强版Bard会在170多个国家提供英语版本的首发，不包括欧盟和英国。谷歌负责Bard的副总裁Sissie Hsiao表示，这是因为公司需要与当地监管机构“接轨”。除此之外，Gemini还有一个名为Nano的版本，可以直接在设备上运行的，例如谷歌的新款Pixel手机。

谷歌VS OpenAI：瑜亮之争鹿死谁手？

12月7日，随着Gemini的高调发布，谷歌市值一晚就增加逾870亿美元，增量相当于OpenAI的最新估值。就目前来说，未上市的OpenAI估值在800亿至900亿美元之间。

要知道，今年以来谷歌的股价已经上涨了逾50%，大幅跑赢了纳斯达克综合指数，但却落后于一些科技同行，里面就包括OpenAI最大的投资方微软。

事实上，谷歌在过去的发展历史中已经吃过很多次苦头，推出有缺陷的产品。这对公司发展来说，适得其反。就像今年2月为了应对ChatGPT急急忙忙推出的Bard，因为一次小小失误就导致股价蒸发了高达1000亿美元。

哪怕是5月，谷歌宣布在大部分产品中植入生成型人工智能，比如谷歌邮箱和其他软件，试图用这个举动改变市场的看法，但效果却微乎其微。这也让谷歌深刻认识到，推出有缺陷的产品带来的反噬。

但在科技行业，只要足够强大就足以抢占市场。早期的手机霸主诺基亚和黑莓就经历过惨痛教训，苹果用功能更强大、更直观的iPhone抢走了它们的市场。在软件领域，商业上的成功往往来自于性能最好的系统。

几乎可以肯定的是，随着Gemini的发布，谷歌或许有望逐渐扭转那些不利的局面。摩根大通分析师就表示，“谷歌开始通过结合 Gemini的不同模型版本，来解决投资者对生成式人工智能创新和GenAI模型运行成本过高的担忧。”

不过如果Gemini Ultra真如谷歌所说那样在明年1月初发布，那么在顶级人工智能模型的头部就呆不了太久时间。毕竟在谷歌努力追赶OpenAI的过程中，后者有将近一年的时间来开发新一代人工智能模型GPT-5。

但有一点不能否认，谷歌和OpenAI的这场对决，已是箭在弦上。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6169

浏览量
105435
Gemini

Gemini

+关注

关注
0

文章
53

浏览量
7603
人工智能

人工智能

+关注

关注
1791

文章
47314

浏览量
238643
GPT

GPT

+关注

关注
0

文章
354

浏览量
15402
OpenAI

OpenAI

+关注

关注
9

文章
1092

浏览量
6541

谷歌正式发布Gemini 2.0 性能提升近两倍

在智能体时代，谷歌再次引领技术潮流，正式发布了其最新力作——Gemini 2.0。这款AI模型不仅在性能上实现了显著提升，更是在多模态表现和原生工具应用方面展现了前所未有的强大功能。 Gemini

发表于 12-12 14:22 •278次阅读

谷歌发布Gemini 2.0 AI模型

谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名为“深度研究”的新特性，旨在为用户提供更加全面和深入的复杂主题探索与报告撰写辅助。 Gemini 2.0通过高

发表于 12-12 10:13 •230次阅读

谷歌计划12月发布Gemini 2.0模型

近日，有消息称谷歌计划在12月发布其下一代人工智能模型——Gemini 2.0。这一消息引发了业界的广泛关注，因为谷歌在人工智能领域

发表于 10-29 11:02 •497次阅读

Snapchat聊天机器人集成谷歌Gemini技术

Snap与谷歌云的战略合作再升级，为Snapchat平台注入了新的智能活力。双方宣布，Snapchat的My AI聊天机器人将深度集成谷歌Gemini技术，这一创新举措标志着Snapc

发表于 09-25 14:51 •294次阅读

谷歌推出Gemini Live，开启AI语音聊天新纪元

在万众瞩目的Pixel 9系列手机发布会上，谷歌震撼宣布了一项创新服务——Gemini Live，该服务自今日起，率先向使用英语的Gemini Advanced订阅用户敞开大门。这

发表于 08-15 17:29 •722次阅读

苹果确认未来也将与谷歌Gemini合作

在备受瞩目的2024年全球开发者大会（WWDC）上，苹果公司高级副总裁Craig Federighi透露了一项引人注目的新计划。他表示，苹果正在与谷歌人工智能部门紧锣密鼓地筹划合作，旨在将谷歌的

发表于 06-12 17:36 •600次阅读

谷歌Gemini新增旅行规划功能，助用户高效规划度假行程

谷歌方面称，Gemini可依据用户需求，快速挖掘航班时间与酒店预订详情，从而迅速制定出适宜的度假方案。谷歌副总裁兼Gemini总经理Sissie Hsiao指出，传统手动规划旅行需耗费

发表于 05-15 11:18 •395次阅读

谷歌Gmail将支持Gemini总结电子邮件内容

谷歌透露，Gemini 将协助 Workspace 和 Google One AI Premium 的用户理解和处理电子邮件内容。用户可通过移动应用和网页版 Gmail 使用 Gemini

发表于 05-15 11:11 •863次阅读

股价久违飙涨，商汤要用自己的Scaling law挑战GPT4

天的“2024年商汤技术交流日”上，商汤发布了对标GPT4-Turbo的大模型日日新大模型SenseNova5.0，追赶GPT4可能是当下中国大模型行业的集体目

发表于 05-08 08:05 •276次阅读

股价久违飙涨，商汤要用自己的Scaling law挑战<b class='flag-5'>GPT4</b>

帮忙画一张详细的电路图,谢谢

能帮忙画一张详细的电路图吗，谢谢了。因为涉及到外部链接，怕被误会发广告，所以详细的需求放在附件里面了 *附件：帮忙谢谢.rar

发表于 05-04 22:59

苹果拟将谷歌Gemini大模型植入iPhone

近日，有消息人士透露，苹果公司正与谷歌就一项具有里程碑意义的合作展开谈判。据悉，苹果公司有意将谷歌的Gemini人工智能引擎集成至iPhone中，这

发表于 03-21 13:37 •509次阅读

谷歌推出新一代大模型Gemini 1.5

近日，谷歌在无预警的情况下发布了其下一代大模型——Gemini 1.5，这款模型在性能上实现了显著增强，并在长上下文理解方面取得了令人瞩目的突破。更令人惊叹的是，Gemini 1.5甚

发表于 02-20 13:55 •893次阅读

谷歌Gemini 1.5深夜爆炸上线，史诗级多模态硬刚GPT-5！最强MoE首破100万极限上下文纪录

我们经历了LLM划时代的一夜。GeminiUltra发布还没几天，Gemini1.5就来了。卯足劲和OpenAI微软一较高下的谷歌，开始进入了高产模式。自家最强的

发表于 02-19 12:28 •726次阅读

谷歌AI聊天机器人改名为Gemini

谷歌(Google)近日宣布，旗下备受瞩目的AI聊天机器人Bard正式更名为Gemini，并推出了一款功能更加强大的付费版本——Gemini Advanced。这

发表于 02-18 11:28 •1112次阅读

谷歌最新人工智能模型Gemini Pro已在欧洲上市

近日，谷歌宣布其最新人工智能模型Gemini Pro已在欧洲市场上市，向欧洲用户开放。Gemini Pro是谷歌最大的人工智能(AI)模型之一

发表于 02-04 15:10 •1208次阅读

搜索历史

谷歌Gemini被曝夸大营销？碾压GPT4纯靠“一张嘴”

评论