导读:ChatGPT发布五天内,该聊天机器人的用户就超过了100万人,Facebook用了10个月时间才达到这个里程碑。
1、关于ChatGPT背后的数据
本文开篇之前,先看一组关于ChatGPT爆红背后的惊人数据。
图来源:金十数据
2022年11月30日,人工智能领域可能迎来了关键时刻。旧金山人工智能公司OpenAI的CEO山姆·阿尔特曼,宣告了这个时刻的来临。 OpenAI成立于2015年,得到了埃隆·马斯克、彼得·泰尔和其他PayPal帮成员以及LinkedIn联合创始人雷德·霍夫曼等一众硅谷大佬的投资。 11月30日,公司成立约7年后,阿尔特曼发推文称:“今天我们发布了ChatGPT。欢迎点击这里与它聊天。”任何人通过推文中的链接注册一个账号,开始与OpenAI的新聊天机器人免费聊天。
2、深入学习ChatGPT资源(可下载)
github.com/dalinvip/Awesome-ChatGPThttps://github.com/chenweiphd/ChatGPT-Hub
3、ChatGPT诞生背景介绍
通常在对用户知之甚少的情况下,ChatGPT生成内容只要大约一秒钟时间,且它生成的许多内容并没有想象的那么糟糕。 ChatGPT发布五天内,该聊天机器人的用户就超过了100万人,Facebook用了10个月时间才达到这个里程碑。 ChatGPT是一股相关人工智能技术浪潮的一部分,这种技术被统称为“生成式人工智能”,还囊括了Midjourney和Lensa等热门艺术生成模型。 OpenAI位于科技行业“下一个大事件”的前沿,具备了一家传奇初创公司的特征,包括全明星级别的团队和投资者的热捧,该公司的估值据称已经达到290亿美元。 该公司最近的突然蹿红引发了嫉妒、猜疑和恐慌。 谷歌(Google)利润丰厚的搜索帝国可能受到影响。为了应对ChatGPT,谷歌内部已经拉响了“红色警报”。 OpenAI能成为超强科技公司俱乐部的成员,出乎人们的意料。几年前,它甚至还不是一家公司,而是一家致力于学术研究的小型非营利性实验室。 “我认为最好的情况好到令人难以想象……好到谈论它的人会令人觉得这人是个疯子。我认为最糟糕的情况是,我们所有人都死去。”——OpenAI联合创始人兼CEO山姆·阿尔特曼 OpenAI与微软(Microsoft)扩大合作的消息于近日公布,微软将向该公司投资高达100亿美元,作为回报,未来几年,该软件业巨头将获得OpenAI的大部分利润。 37岁的联合创始人兼CEO阿尔特曼,充分体现了OpenAI谜一样的特性。 作为一位资深科技创业者,阿尔特曼更为人们所熟知的是他出色的商业才能,而不是其工程技术成就。他是OpenAI估值暴涨的推手,也是给该技术泼冷水的主力。 他曾公开表示ChatGPT距离真正可靠仍有很大差距。同时,他认为,该技术是实现公司使命的重要一步。 该公司有一个堂吉诃德式的使命,即开发一种计算机超级智能,又称通用人工智能(AGI)。 对于一家营利性的企业而言,这种指导理念不同寻常,尤其是有些计算机科学家认为阿尔特曼的执念纯属幻想。 通过发布ChatGPT,阿尔特曼将OpenAI及其宏大的人工智能使命,变得令整个科技界为之着迷。 问题的关键在于,他与微软的合作能否解决ChatGPT的缺点,利用其先发优势改变整个科技行业。
谷歌和其他科技业巨头纷纷在加大力气开发各自的人工智能平台;未来,更完善的软件可能使ChatGPT看起来如同儿戏。 OpenAI总有一天可能会发现,它的技术突破开启了未来的大门,这个未来却与它无关。
1
1月中旬一个星期四的晚上,阿尔特曼在旧金山罕见地公开露面。 他上身穿灰色针织衫,下身穿蓝色牛仔裤,脚蹬一双时髦的亮色扎染运动鞋,走进一个挤满投资者、技术人员和记者的房间。 所有人都想收集与ChatGPT或近期融资有关的信息。
当StrictlyVC创始人康妮·洛伊佐斯询问他,对于公司引起媒体轰动的看法时,阿尔特曼回答称:“我不看新闻,实际上我不太关注媒体的报道。” 活动在赛富时大厦(Salesforce Tower)的46层召开,房间内座无虚席。阿尔特曼似乎有意在给这种热烈的氛围降温。 他表示:“它们的表现令人印象深刻,却并不可靠。所以你在使用第一版演示版的时候,会产生一种非常深刻的反应:‘哇,真是不可思议,我已经迫不及待了’。在用过一百次之后,你就会发现它的缺点。” 这种谨慎似乎代表了OpenAI总部的官方态度。 该公司总部位于旧金山教会区的一家旧行李箱工厂。OpenAI在几个月前,几乎要叫停ChatGPT项目。 ChatGPT的聊天界面,支持用户以简单的英语(和其他多种语言)与人工智能对话,OpenAI最初的设想是,将这个界面作为完善其“大语言模型”(LLM)的一种方式。 大多数生成式人工智能系统核心,都有一个大语言模型。 大语言模型是将非常庞大的神经网络,应用于大量人为创建文本所生成的。 神经网络是大致基于人脑内部神经连接的一种人工智能。
模型从这个数据库中学习一个复杂的统计学概率图,代表了任何一组单词在特定语境下相邻出现的统计学概率。 这样一来,大语言模型就可以执行大量自然语言处理任务,例如翻译、总结或写作等。 OpenAI已经创建了全世界最强大的大语言模型之一。
该模型名为GPT-3,由1750亿个统计性联系组成,在约2/3互联网、整个维基百科和两个大型图书数据集中进行训练。 OpenAI发现,GPT-3很难准确提供用户想要的结果。 一个团队提议使用“强化学习”系统完善该模型,“强化学习”是从试错中学习以取得最大化回报的人工智能系统。 2022年初,该团队开始开发这款聊天机器人,也就是后来的ChatGPT。 开发完成后,OpenAI邀请贝塔测试人员对其进行了测试。
据OpenAI联合创始人兼现任总裁格雷戈·布洛克曼表示,测试人员的反馈却令OpenAI失望;人们不知道该与聊天机器人交流哪些内容。 OpenAI一度改变了策略,尝试开发专业聊天机器人,希望为特定领域的专业人员提供协助。
这个项目也遇到了问题,部分原因是OpenAI缺少训练专业聊天机器人的合适数据。 2022年10月25日,OpenAI首席技术官米拉·穆拉蒂参加《特雷弗·诺亚每日秀》 来源:COURTESY OF MATT WILSON/COMEDY CENTRAL’S “THE DAILY SHOW”
布洛克曼表示,OpenAI决定孤注一掷,对外发布ChatGPT,交给用户使用,任其自由发展。布洛克曼表示:“我承认,我当时的立场是,不知道它是否会成功。” OpenAI的高管表示,这款聊天机器人的突然爆红,令公司措手不及。 其CTO米拉·穆拉蒂表示:“这令我们非常惊讶。”在旧金山召开的风险投资活动上,阿尔特曼表示,他的“预期可能要低一个量级——它所引起的热度低一个量级。”
2
OpenAI还有更多创新蓄势待发。 OpenAI在贝塔测试版GPT-4中采用了更强大的大语言模型,预计该版本将于今年甚至很快发布。阿尔特曼也表示,公司正在研发一款可根据文本描述生成视频的系统。 在1月中旬,OpenAI表示其计划发布ChatGPT的商业版。付费用户可通过一个界面使用聊天机器人,更容易将其整合到自己的产品和服务当中。 可以确定的是,ChatGPT的出现搅动了一个鲨群出没的水域。
它在风投界掀起了一场狂热的追逐,风投公司希望利用OpenAI高管、员工和创始人非公开出售股权的机会,获得该公司的股份。 同时,微软将在该公司追加投资高达100亿美元的消息,刚刚对外公布。 微软在2016年开始与OpenAI合作,三年前与之建立战略合作伙伴关系,并宣布投资10亿美元。
山姆·阿尔特曼与微软CEO萨蒂亚·纳德拉在位于华盛顿州雷德蒙德的微软总部合影 来源:IAN C. BATES—THE NEW YORK TIMES/REDUX
据知情人士透露,微软通过一种不同寻常的投资结构,获得了巨大的财务优势。 《财富》杂志掌握的文件显示,在新投资完成且OpenAI的首批投资者收回初始资本后,微软将有权获得OpenAI 75%的利润,直至其收回130亿美元投资,其中包括OpenAI才披露的20亿美元投资。 之后,微软在该公司的持股比例将逐步下降到49%,直至该软件巨头获得920亿美元利润为止。 与此同时,其他风险投资者和OpenAI的员工,将有权获得该公司49%的利润,直至利润达到1500亿美元为止。 利润达到上述上限之后,微软和投资者的股份,将重新归还给OpenAI的非营利基金。 要收回投资和实现利润上限目标,可能需要一段时间。 《财富》杂志掌握的文件显示,到目前为止,OpenAI只有相对微薄的收入,依旧处在严重亏损状态。 文件显示,该公司去年的收入预计不足3000万美元,计算和数据支出预计达到4.1645亿美元,人工支出8931万美元,其他非特定营业费用为3875万美元。 其在2022年的净亏损总计为5.445亿美元,不含员工股票期权。 OpenAI预测,随着ChatGPT成为吸引客户的重要工具,其收入将会快速增长。该公司预测2023年收入2亿美元,2024年收入预计超过10亿美元。 OpenAI并未预测其支出的增长情况以及何时能够扭亏为盈。 微软已开始收获双方合作协议的成果。 微软在其Azure Cloud平台中,推出了一系列OpenAI品牌的工具和服务,支持Azure客户使用OpenAI的技术,包括GPT和DALL-E工具。
例如,汽车交易平台CarMax已经推出了可在这些Azure工具上运行的新服务。 微软人工智能平台企业副总裁埃里克·博伊德表示,满足训练和运行OpenAI大语言平台的需求,推动了创新,将使所有Azure客户受益。 例如,微软为人工智能创建了其认为全球最强大的超级计算集群,并开发了多种软件创新,使在这些机器上训练和运行大型人工智能模型变得更容易。 微软正在将OpenAI的技术整合到其许多软件当中。微软在其搜索引擎必应(Bing)中推出了一款图片创作工具以及一款新型设计师图片设计工具,这两款工具均由DALL-E驱动。 对微软而言,更大的回报可能是在搜索领域。 科技媒体The Information最近报道称,微软计划将ChatGPT整合到必应,使其能够为用户反馈简洁明了的回答,且使用户可以通过与聊天机器人对话进行深入探究,而不是逐一查看一列链接。 谷歌目前在搜索市场占据主导地位,其全球市场份额超过90%。必应名列第二,市场份额仅有约3%。 在2022年前九个月,谷歌搜索业务的收入为1200亿美元,约占谷歌总收入的60%。
ChatGPT或许为微软动摇谷歌的霸主地位,提供了唯一一次真正的机会。 按照微软的标准,这些积极的回报非常划算。
微软在OpenAI的总投资额为130亿美元,确实是一个天文数字,这笔投资占其过去12个月850亿美元税前利润的15%,却能获得一项颠覆性技术的近期控制权,是一笔成本相对较低的交易。 OpenAI和阿尔特曼却可能要付出不同的代价:微软的优先任务可能对OpenAI自己的优先任务产生排挤效应,使OpenAI更宏大的使命面临风险,并且降低助力公司成功的科学家们对其的归属感。
3
阿尔特曼从最开始就参与了OpenAI的创立,他直到2019年5月后才担任该公司CEO。 该公司从一家研究实验室变成价值数十亿美元的现象级企业的过程,充分显示出阿尔特曼独特的融资能力,以及以产品为导向的经营理念。 作为OpenAI的领导人,从某种程度上来说,阿尔特曼就是硅谷的典型代表:
年轻的白人男性;坚定专注;精通极客技术;热衷于效率和生产率最大化;致力于“改变世界”的工作狂。 阿尔特曼从斯坦福大学计算机科学专业肄业,参与创建了一家社交媒体公司Loopt,该公司的应用可以告知用户好友所在的位置。 该公司在2005年,成为Y Combinator的首批初创公司,阿尔特曼出售该公司所得的收入,帮助他进入了风投界,他创建了一家小型风险投资公司Hydrazine Capital,募资约2100万美元。 阿尔特曼是一位创业者,而不是科学家或人工智能研究人员,他为人所津津乐道的是极其擅长进行风投融资。
据OpenAI的多位现任和前内部人士爆料,随着阿尔特曼掌管公司,公司开始转移业务重心。曾经广泛的研发议题被精简,主要专注于自然语言处理领域。 OpenAI首席科学家萨茨科尔和阿尔特曼辩称,这种转变的目的是,在目前似乎最有可能实现通用人工智能的研发领域,最大程度增加投入。
有前员工表示,部分原因是这些模型可以迅速投入商业应用。 有员工抱怨,OpenAI创立的目的是不受企业影响,但它很快就变成了科技界巨头的工具。
OpenAI也变得不再像以前那么开放。 该公司已经开始以担心其技术可能被滥用为由,收回此前做出的公开所有研究和将代码开源的承诺。OpenAI仅通过API提供其先进模型,保护了自己的知识产权和收入流。 OpenAI表示相比其他人工智能实验室,其会继续公布更多研究成果。 公司还为重心向产品转移的做法进行辩护。CTO穆拉蒂说道:“你不能只在实验室里开发通用人工智能。”她主张,发布产品是了解人们希望如何使用和滥用技术的唯一途径。 她表示,直到发现人们使用GPT-3进行编程,OpenAI才知道GPT-3最受欢迎的应用是编写软件代码。
同样,OpenAI最担心的问题是,人们利用GPT-3生成虚假的政治信息,但事实证明这只是杞人忧天。 穆拉蒂表示,OpenAI希望通过公开其技术,“最大程度降低真正强大的技术可能对社会产生的冲击。” 萨茨科尔也认为,OpenAI与微软的合作创造了一种全新的预期,“即我们需要利用我们的技术开发一种有用的产品”,他坚持认为,OpenAI文化的核心并未改变。 他说道,可以使用微软的数据中心,对于OpenAI的发展至关重要。 布洛克曼也表示,与微软的合作使OpenAI能够创造收入,同时不必过多关注商业运营,否则公司可能不得不在商业运营方面投入更多精力。 他说道:“招聘数千名销售人员,可能会改变这家公司,而与一家已经拥有销售团队的公司成为合作伙伴,实际上是非常好的策略。”
批评者表示,OpenAI以产品为导向开发先进人工智能的做法是不负责任的,这相当于向人们发放上膛的枪支,理由是,这是确定人们是否真的会相互射击的最佳途径。 纽约大学(New York University)认知科学专业荣誉退休教授加里·马库斯,对以深度学习为中心的人工智能开发策略持怀疑态度。 他认为,生成式人工智能“将对社会结构产生切实的、迫在眉睫的威胁”。他表示,GPT-3和ChatGPT等系统,将生成虚假信息的成本降低到接近于零,可能会掀起虚假信息泛滥的狂潮。 马库斯表示,我们甚至已经看到了第一批受害者。 程序员发布和回答编程问题的网站Stack Overflow,已经不得不禁止用户提交ChatGPT生成的回答,这种貌似合理实则错误的回答已经令该网站疲于应付。
科技资讯网站CNET开始使用ChatGPT生成资讯文章,后来发现,许多文章存在事实性错误。 对有些人而言,真正的风险是ChatGPT能够编写准确的代码。 网络安全公司Check Point的研究副总裁玛雅·霍洛维茨表示,她的团队可以用ChatGPT设计每一个阶段的网络攻击,包括杜撰一封令人信服的钓鱼邮件,编写恶意代码,以及逃避常见的网络安全检查等。 她警告称,ChatGPT基本可以让不懂编程的人成为网络罪犯。 有无数批评者和教育工作者痛斥,学生很容易使用ChatGPT作弊。
纽约、巴尔的摩和洛杉矶的校区均禁止学校管理的网络访问聊天机器人,澳大利亚的一些高校表示,将转为通过有专人监考的书面考试评估学生。 OpenAI未来能否维持其在语言人工智能领域的主导地位,仍是个未知数。 伦敦人工智能公司Faculty的创始人兼CEO马克·华纳表示:“历史上,对于这种高度通用的算法,我们所看到的是,它们并没有达到足够可靠的程度,能够保证一家公司独占全部回报。” 例如,面部识别和图像识别技术最早的开发者是谷歌和英伟达(Nvidia)等科技巨头,现在它们已经无处不在。 法院和监管部门,也可能对生成式人工智能所依赖的数据飞轮横插一脚。
同时,OpenAI的竞争对手并没有坐以待毙。 据《纽约时报》(New York Times)报道,失去搜索领域主导地位的可能性,已经促使谷歌高管发布了“红色警报”。 谷歌CEO桑达尔·皮查伊已经多次召开会议,重新制定公司的人工智能策略,计划发布20款支持人工智能的新产品,并将在今年发布搜索聊天界面的演示版本。 谷歌拥有一款强大的聊天机器人LaMDA,由于担心一旦该产品被滥用可能影响公司信誉,因此一直未对外发布。
据《时代》杂志称,现在,公司计划以ChatGPT为标杆“重新评估”其风险承受能力。 该杂志报道称,谷歌还在开发一款文本转图片的生成系统,与OpenAI的DALL-E等产品竞争。 当然,目前尚不确定聊天机器人是否代表了搜索行业的未来。
ChatGPT经常会杜撰信息,这种现象被人工智能研究人员称为“幻觉”。它无法可靠地引用其信息来源,或简单地提供链接。现有版本无法访问互联网,因此无法提供最新信息。 OpenAI已经公布了对另外一个版本GPT的研究。 该版本名为WebGPT,可以通过查询搜索引擎和汇总查询到的信息来回答问题,包括对相关来源的注释。 阿尔特曼极少在公开场合热烈讨论人工智能。在谈到人工智能的时候,他可能听上去像是一位幻想思想家。 在旧金山举办的风险投资活动上,当被问到人工智能的最佳状况时,他夸张地说道:
“我认为最好的情况好到令人难以想象……好到谈论它的人会令人觉得这人是个疯子。”
编辑:黄飞
评论
查看更多