史上超强模型GPT-4 ：一张手绘草图能生一个网站、60秒搞定一个游戏开发！-电子发烧友网

平地一声雷，GPT-4 重磅来袭。

OpenAI 正式上线新一代人工智能大模型 GPT-4，它是一个大型多模态模型，可以接受图像和文本输入，同时返回文本输出。就像这样：

用户：这幅画有什么好笑的地方？逐一描述它的板块。

GPT-4：图片显示的是一个 "Lightning Cable "适配器的包装，有三个板块：

板块1：一部智能手机，VGA 连接器（通常用于电脑显示器的大型蓝色 15 针连接器）插在其充电端口。

板块2："Lightning Cable "适配器的包装上有一张 VGA 接口的图片。

板块3：VGA 连接器的特写，末端是一个小的 Lightning 连接器（用于为 iPhone 和其他苹果设备充电）。

这张图片的幽默感来自于将一个大的、过时的 VGA 连接器插入一个小的、现代的智能手机充电端口的荒谬性。

不得不说，一个示例足以证明了 GPT-4 与过往大模型的不同之处，是不是很强大？

与此同时，微软宣布 Bing Chat 一直在 GPT-4 上运行。

当前，OpenAI 计划通过 ChatGPT 及其商业 API 发布 GPT-4 的文本功能，但是想要直接用上，还需要先加入一波等待名单（https://openai.com/waitlist/gpt-4-api）耐心等候。不过，ChatGPT Plus 用户倒是可以直接上手 GPT-4 的体验：https://chat.openai.com/chat

1、GPT-4 惊喜上线

虽然此前 OpenAI 首席技术官 Mira Murati 不断给大家打预防针，希望外界能够对下一代 GPT（即 GPT-4）的技术水平更加冷静务实一些，少一些炒作会更好些，但是当 GPT-4 真正到来时，大家还是坐不住了。

“我们花了 6 个月的时间，利用对抗性测试项目以及 ChatGPT 的经验，反复调整 GPT-4，结果在真实性、可操作性以及拒绝超出道德等边界方面取得了有史以来最好的结果（尽管远非完美）”，OpenAI 分享道。

2、GPT-4：可以达到应试者的前 10% 水平、一张草图生成网站

为让众人更加清楚地了解GPT-4，OpenAI 官方不仅上线了介绍性的网页（https://openai.com/research/gpt-4），还发布了一篇技术论文（https://cdn.openai.com/papers/gpt-4.pdf），详细分享了 GPT-4 强大的功能，以及其存在的局限性。

从技术维度上来看，GPT-4 是一个基于 Transformer 的模型，经过预训练，可以预测文档中的下一个 token。这个项目的一个核心部分是开发了基础设施和优化方法。这使 OpenAI 能够根据不超过 GPT-4 的 1/1000 的计算量训练的模型，准确地预测 GPT-4 的某些方面的性能。

也正如昨天 CSDN 报道的，微软的 Azure 与 OpenAI 共同设计了一台超级计算机，搭载了英伟达上万颗 A100 芯片。基于这台超算，OpenAI 在一年前将 GPT-3.5 作为系统的第一次“测试运行”进行了训练，在修复一些 Bug 并提高理论基础之上，OpenAI 基于此又训练出了首个能够提前准确预测其训练性能的大模型 GPT-4。

更长的上下文，上限为2.5 万个字

在性能上，GPT-4 超越了过往的模型，它可以遵循自然语言的复杂指令、生成技术或创意作品，支持生成和处理多达 32,768 个 token（约 25,000 字的文本），这使得 GPT-4 能有更长的上下文，允许长篇内容创建、扩展对话以及文档搜索和分析等用例。

GPT-4 可以直接上一个好大学

在分析 GPT-4 的能力时，OpenAI 还让该模型参加了统一律师考试、法学院入学考试（LSAT）、研究生入学考试（GRE）的定量、口头推理、分析写作考试以及和各种 AP 科目考试等测试。

考试问题包括选择题和自由解答题，OpenAI 为每种形式设计了单独的提示，并在需要输入的问题中加入了图片。总分是通过结合选择题和自由回答题的分数来确定的，使用的是每个考试的公开方法。

最终结果如下：

GPT-4 在大多数这些专业和学术考试中表现与人类水平相当。这意味着，如果 GPT-4 是一个仅凭应试能力来判断的人，它可以进入法学院，而且很可能也能进入许多大学。

多模态能力，通过视觉输入看世界

正如文章开头示例展现的一样，GPT-4 可以接受图像作为输入并生成标题、分类和分析。

这意味着 GPT-4 实际上将看到现实世界，为此，OpenAI 也宣布正在和它的合作伙伴 Be My Eyes 一起测试 GPT-4 的图像输入能力，这是一款即将推出的智能手机应用程序，可以直观地解释手机相机所看到的内容。

不过，该功能目前仍限于研究预览，没有公开提供。

超越传统的大模型

在一套传统的 NLP 基准测试中，GPT-4 超过了以前的大型语言模型和大多数最先进的系统（这些系统通常有特定的基准训练或手工工程）。

在 MMLU（多任务语言理解）基准测试中，GPT-4 不仅在英语中以相当大的优势胜过现有的模型，而且在其他语言中也表现出强大的性能。在 MMLU 的翻译变体上，GPT-4 的性能优于 GPT-3.5 和其他 LLM（Chinchilla，PaLM）的英语性能，包括低资源语言，如拉脱维亚语、威尔士语和斯瓦希里语。

生成代码、改 Bug 的最佳小能手

除此之外，OpenAI 通过开源评估框架（Eval，https://github.com/openai/evals），用于自动评估 AI 模型性能的框架，允许任何人报告模型中的缺点，以帮助指导进一步改进。

与此同时，GPT-4 对代码有超强的理解能力，可以帮助程序员生成代码，遇上 Bug 时，甚至只要你把错误信息或者代码异常的截图发给 GPT-4，它就能帮你给出相应的提示。

只需几秒，一张手画草图，GPT-4 直接帮你生成网页

更让人惊奇的是，在官方演示的视频中，手绘一张网站草图：

把它拍照发给 GPT-4，GPT-4 甚至可以自动生成网站的原型图。它从图片中提取文字信息并输出到 HTML，一个网站就有了，整个过程只有几秒钟的时间：

另外，GPT-4 也能处理复杂的税务问题。

一系列操作下来，惊呆众人。在上手体验之后，不少网友现身说法：

我不在乎它不是 AGI，GPT-4 是一项令人难以置信的变革性技术。我在 60 秒内重新创建了 Pong 游戏。这是我的第一次尝试。

据悉，所有的代码都是 HTML 实现的。

甚至有人看到了 GPT-4 的强大，开始暗戳戳地暗示起 GPT-5 的模样：

3、不足之处

OpenAI 表示，他们的目标是开发能够在任何智力任务方面取代人类的 AGI，尽管 GPT-4 还没有达到这个目标。

尽管有这样的能力，GPT-4 与早期的 GPT 模型有类似的局限性：它不是完全可靠的，比如，它也会对事实产生“幻觉”，推理出错误的结果。

对此，OpenAI 首席执行官 Sam Altman 在推特上说："它（GPT-4）仍然有缺陷，仍然有局限性，但它在首次使用时仍然能给你留下深刻印象。"

在使用 GPT-4 的输出时，应该小心谨慎，特别是在专业性要求非常高的重要场景中。

4、微软：新 Bing 早用上了 GPT-4

这也是事实，GPT-4 远非完美。不过根据 OpenAI 的说法，研究人员纳入了更多的人类反馈，包括 ChatGPT 用户提交的反馈，用来改善 GPT-4 的行为。此外，OpenAI 公司还聘请了 50 名人类专家，在人工智能安全方面提供反馈。

如今微软同时宣布自家产品早已第一时间用上了 GPT-4。"我们很高兴地确认，新的 Bing 正在 GPT-4 上运行，为搜索而定制，"微软在一篇博客文章中写道。"如果你在过去六周的任何时候使用过预览版的新 Bing，你已经提前看到了 OpenAI 的最新模型的力量。随着 OpenAI 对 GPT-4 及以后的更新，Bing 从这些改进中受益，以确保我们的用户拥有最全面的副驾驶功能。"

5、压力给到国外的 Google，国内的百度

虽然上周 OpenAI 早已预告过 GPT-4 会在本周到来，但是真正到来时，还是让很多人猝不及防。而之所以选择此时发布，似乎也是为微软将在 3 月 16 号的 AI 最新进展做一定的铺垫，这样微软可以在明天轻松开上一场发布会了。不过，处于同赛道的其他玩家可能得连夜加班了。

这不，就在这一天，Google CEO 皮查伊亲自下场官宣开放预训练大模型（PaLM，https://www.datalearner.com/ai-models/pretrained-models/PaLM）的 API 商业接口，这是 Google 在 2022 年 4 月发布的自然语言预训练大模型，最高参数为 5400 亿。

与此同时，百度早在此前便宣布将会在 3 月 16 日带来文心一言，最终成果不可避免地会与最新的 GPT-4 一较高下，究竟会如何，我们也将在明天揭晓。

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模型

模型

+关注

关注
1

文章
3261

浏览量
48914
GPT

GPT

+关注

关注
0

文章
354

浏览量
15431
OpenAI

OpenAI

+关注

关注
9

文章
1100

浏览量
6575

原文标题：史上超强模型 GPT-4 ：一张手绘草图能生一个网站、60 秒搞定一个游戏开发！

文章出处：【微信号：TheBigData1024，微信公众号：人工智能与大数据技术】欢迎添加关注！文章转载请注明出处。

Llama 3 与 GPT-4 比较

随着人工智能技术的飞速发展，我们见证了一代又一代的AI模型不断突破界限，为各行各业带来革命性的变化。在这场技术竞赛中，Llama 3和GPT-4作为两

发表于 10-27 14:17 •386次阅读

OpenAI推出新模型CriticGPT，用GPT-4自我纠错

款基于GPT-4的模型——CriticGPT，这款模型专为捕获ChatGPT代码输出中的错误而设计，其独特的作用在于，让人们能够用GPT-4来查找G

发表于 06-29 09:55 •559次阅读

OpenAI API Key获取：开发人员申请GPT-4 API Key教程

OpenAI的GPT-4模型因其卓越的自然语言理解和生成能力，成为了许多开发者的首选工具。获取GPT-4 API Key并将其应用于项目，如开发

发表于 06-24 17:40 •2427次阅读

国内直联使用ChatGPT 4.0 API Key使用和多模态GPT4o API调用开发教程！

API Key、配置环境、并编写调用代码。 GPT-4o模型: GPT-4o（GPT-4优化版）是OpenAI开发的

发表于 06-08 00:33 •5276次阅读

开发者如何调用OpenAI的GPT-4o API以及价格详情指南

目前，OpenAI新模型GPT-4o和GPT-4 Turbo的价格如下： GPT-4o 对比 GPT-4 Turbo

发表于 05-29 16:00 •1.2w次阅读

GPT-4人工智能模型预测公司未来盈利胜过人类分析师

据悉，本次研究中，研究人员仅向GPT-4提供了匿名的财务数据，包括资产负债表和损益表，并要求其预测未来盈利增长。尽管未获得其他信息，GPT-4仍能达到60%的准确度，远超人类分析师的平均水平（53%-57%）。

发表于 05-27 16:41 •612次阅读

OpenAI推出面向所有用户的AI模型GPT-4o

在周一的直播盛会上，OpenAI揭开了其最新的人工智能模型GPT-4o的神秘面纱。这款新模型旨在为其著名的聊天机器人ChatGPT提供更强大、更经济的支持。

发表于 05-15 09:23 •411次阅读

OpenAI全新GPT-4o能力炸场！速度快/成本低，能读懂人类情绪

”的意思。GPT-4o文本、推理、编码能力达到GPT-4 Turbo水平，速度是上一代AI大模型GPT-4 Turbo的两倍，但成本仅为

发表于 05-15 00:15 •7855次阅读

阿里云发布通义千问2.5大模型，多项能力超越GPT-4

阿里云隆重推出了通义千问 2.5 版，宣称其“技术进步，全面超越GPT-4”，尤其是在中文环境中的多种任务（如文本理解、文本生成、知识问答及生活建议、临时聊天及对话以及安全风险评估）方面表现出色，超越了GPT-4。

发表于 05-09 14:17 •977次阅读

商汤科技发布5.0多模态大模型，综合能力全面对标GPT-4 Turbo

商汤科技发布5.0多模态大模型，综合能力全面对标GPT-4 Turbo 4月23日，商汤科技董事长兼CEO徐立在2024商汤技术交流日上发布了行业首个云、端、边全栈大模型产品矩阵，能够

发表于 04-24 16:49 •1131次阅读

OpenAI推出Vision模型版GPT-4 Turbo，融合文本与图像理解

据悉，此模型沿用GPT-4 Turbo系列特有的12.8万token窗口规模及截至2023年12月的知识库架构，其创新亮点则是强大的视觉理解功能。

发表于 04-10 10:49 •421次阅读

微软Copilot全面更新为OpenAI的GPT-4 Turbo模型

起初，Copilot作为Bing Chat AI助手推出，初期采用GPT-3.5模型，随后升级至GPT-4取得显著进步，如今再次更新至性能卓越的GPT-4 Turbo

发表于 03-13 13:42 •750次阅读

新火种AI|秒杀GPT-4，狙杀GPT-5，横空出世的Claude 3振奋人心！

世的GPT-4被拉下神坛， Claude 3很可能对GPT-4实现全方位的碾压。 Anthropic发布3个模型，全方位实现

发表于 03-06 22:22 •683次阅读

全球最强大模型易主，GPT-4被超越

近日，AI领域的领军企业Anthropic宣布推出全新的Claude 3系列模型，其中包括最强版Claude 3 Opus。据该公司称，Claude 3系列在推理、数学、编码、多语言理解和视觉方面全面超越了包括GPT-4在内的所有大型模

发表于 03-05 09:58 •676次阅读

智谱AI推出新一代基座大模型GLM-4

智谱AI近日宣布推出新一代基座大模型GLM-4。这一模型在整体性能上相较上一代实现了大幅提升，其

发表于 01-17 15:29 •1078次阅读