0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI专家:GPT-3的性能令人惊叹,但存在规模和缺乏透明度等问题

如意 来源:读芯术微信公众号 作者:读芯术微信公众号 2020-09-18 16:31 次阅读

算法像人一样写作,是人工智能研究实验室OpenAI多年来一直追寻的梦想。其最新研究成果是语言生成算法模型GPT-3,现已被用于生成让人难以分辨的伪文章,其所写博客骗过了黑客新闻(Hacker News)的发布者,甚至成为网站热门文章。

那个帖子是这样的:“要想把事情做好,也许我们根本不需要想太多。这似乎有悖常理,但我相信有时想得多了反而会阻碍我们的创造力。”

OpenAI之所以可以实现如此高效的算法,是因为它能够访问巨额计算量和数据,且此算法本身的容量远大于已有的所有算法:最大版本的GPT-3有1750亿个参数,这种方程式能帮算法做出更精准预测。GPT-2只有15亿个参数。

虽然OpenAI曾公布过它的算法,但这次它选择让GPT-3保持神秘。该公司表示,对大多数操作者来说,GPT-3实在是太大了,对其收费,就能让OpenAI从中获利。

在过去的一年里,OpenAI变革公司结构,使其更能吸引投资者。它放弃了“限制利润”模式的非盈利定位,这样如果OpenAI获利,投资者就能获得回报。它还与微软达成了10亿美元的合作协议,开启了两家公司之间的合作,该协议还允许OpenAI优先访问微软的云计算平台。

研究人员说,他们对OpenAI不公布算法表示质疑,称这违背了基本科学原则,且对该公司声明的核实变得愈发困难。

Facebook人工智能研究(FAIR)的联合董事暨Facebook蒙特利尔人工智能研究实验室负责人乔埃尔?皮诺(Joelle Pineau)在一封电子邮件中说到:“我对目前为止对诸如GPT-2/GPT-3和AlphaGo这类代码不共享的所有争论持怀疑态度。在人工智能领域,有很多类似情况。”

GPT-3的核心是个非常强大的英语写作工具。GPT-3最重要的是它的规模,它通过分析45万亿字节的数据学会了写作。报道称这个训练过程在云计算上花费了数百万美元,它见证了人类数以亿计的书写组合。

这是OpenAI长期战略的关键部分。多年来,该公司一直表示,深度学习算法的规模越大越好。数据越多,计算能力越强,算法的能力就越强。OpenAI就是因为具备同时在数百个GPU上训练算法的能力,才在《刀塔2》中击败了职业电子竞技玩家。

OpenAI的领导曾表示,OpenAI的政策主管杰克·克拉克(Jack Clark)认为算法越大,则“越有条理,越有创造力,也越可靠”。在谈到《刀塔2》机器人需要的训练量时,首席技术官格雷格·布罗克曼表示:“等运气耗尽,我们期待一场棋逢对手的比赛。”

GPT-3采用了类似方法。OpenAI认为,算法更大意味着参数更多,就能进行更普遍的操作。例如,GPT-3最基本的功能是自动补全,给它一个词或句子,它就会逐字逐句地生成它认为接下来该出现的词句。不必对算法进行任何修改,它也能回答问题,甚至进行翻译。这与只能处理一项任务的专项微调算法不同。

有人认为,这向人工智能的圣杯——通用智能迈出了一步,它意味着算法可以像人类一样学习和适应;而另一些人则表示,算法仍不能真正理解它生成的话语。

OpenAI发布了一篇详细的研究报告,解释了该算法的架构和它所取得的结果,而当涉及到GPT-3的功能研究时,其他人工智能研究人员只能选择相信OpenAI。这家研究公司最近不再以非盈利为定位,开始筹集资金开发商业产品,它不再像过去一样公布算法。

2019年2月,OpenAI宣称,前一最大版本GPT-2算法有可能生成错误信息或虚假新闻,太过危险不便发布,这一声明引来了很多质疑。公司先行发布了简易版的GPT-2,并未发现滥用迹象,才最终发布了最大版本算法。现在,与其说GPT-3太危险,不如说它似乎太有利可图而不能发行。

GPT-3只能通过OpenAI运行的API访问,这与亚马逊、谷歌和微软等公司的算法变现方式相类似。开发者可以编写程序向GPT-3发送特定指令,GPT-3在OpenAI的云端中生成响应并回传结果。虽然API在内测期间免费,但OpenAI正在考虑长期定价。这意味着研究人员只能向算法发送特定命令,而OpenAI可以随时取消访问权限。

OpenAI将这种做法归结于对安全和规模的考虑。如果该公司发现有人滥用API做了诸如支持假新闻网站的事情,那么它可以取消该开发者的访问权限。

该公司还表示,这些算法规模庞大,运行成本高昂,更别提开始训练后的花销。“这使得任何除大公司以外的使用者都很难从底层技术中获益。我们希望API能让小型企业和组织更容易地使用强劲的人工智能系统。”

由于云计算的计价方式,OpenAI训练和操作算法的确切成本很难核算。租赁GPU的成本根据特定服务器区域的地理邻近程度,以及基于项目规模的协议费率等因素的不同,差别很大。由于OpenAI为完成任务将其中部分资金用于建造自己的超级计算机,它可能从与微软的10亿美元合作中受益。

但是这些限制,即规模和缺乏透明度,使得其他科学家很难复制和验证该算法的有效性。

尽管涉及风险投资和企业利益,人工智能仍然是研究计算机科学的一个途径,且这种科学方法仍然适用。最好的科学实验,比如建立一个算法来成功完成一项任务并证明一个假设,是可以复制的。

皮诺是可复制计算机科学的热心支持者,她认为像GPT-3和AlphaGo这样尚未公布的算法是“科学文物”。她在电子邮件中说到:“这有点像挖出的恐龙骨头,它为你提供了支持某些理论的证据,但与实际进行实验是不一样的。”皮诺表示,这些“文物”有助于提出未来的研究假设,但它们仍然不能替代确凿的知识。

很多人担心,通过限制对代码和受训算法的访问,人工智能的“民主化”,即任何人都可使用人工智能,会受OpenAI威胁。“使用人工智能”这一用语是多层面的,意思是使用计算能力、数据集以及算法本身。诸如谷歌的TensorFlow和脸书的PyTorch这类开源框架使得算法易于构建和共享,还存在其他很多开源数据集。

然而,计算能力来自硬件,是一种有限的物理资源,大公司和像OpenAI这样资金充足的研究机构更容易获得该资源。

如果OpenAI的实验被证明是人工智能的发展方向,同时算法的扩大转化为性能的提高,那么消费不起先进人工智能的人就无法使用它了。这还会允许拥有资源的大公司制定规则,决定谁有权使用某些人工智能算法。例如,他们可以利用API进行设置,并对访问和使用算法进行收费。

乔治亚理工学院(Georgia Institute of Technology)研究自然语言处理的人工智能教授马克·瑞德尔(Mark Riedl)表示:“如果确信实现更好人工智能的方法实际上是实现更大规模,那么谁能拥有更优人工智能就由OpenAI决定了。”

瑞德尔对OpenAI是否会监视其新API的所有使用情况,以确定是否被用于恶意目的表示质疑,OpenAI曾花了大量精力来思考它的算法会如何被滥用。“OpenAI是否会查看输出,以判断他们的技术是否得到恰当使用?鉴于其宗旨,以及这与他们新盈利模式相冲突,这似乎很关键。他们能做到大规模监控吗?”

并非所有人都认同OpenAI“越大越好”的方法是人工智能的发展方向。例如,自然语言处理研究人员梅拉妮·米歇尔(Melanie Mitchell)就对GPT-3进行了“模仿”测试,要求算法识别特定字母序列的变化模式。如果“abc”变为“abd”,那么“efg”会变成什么?

上世纪80年代,米歇尔开发了一种算法来解决这类人类一直以来所进行类比的微型模拟测试。要正确地进行类比,必须理解所有组件之间的关系。在字母表的例子中,算法必须了解字母表的顺序和每个字母的位置。虽然该算法在众多测试中表现良好,但米歇尔发现,它也无法掌握其他算法数十年前已掌握的一些简单概念。

米歇尔说:“在研究方面,我个人认为,在一个问题上投入过多的计算和参数可能会把人工智能逼进死胡同。如果我们的目标是制造强大、具有普遍智能的机器,我认为这无法取得真正的进展。”

她承认,在制造需要深度学习的人工智能产品时,庞大的计算能力让科技巨头获得优势,但反之并不是所有现代问题都需要高能耗的深度学习算法,不是解决每个问题都需要达到GTP-3的规模。

米切尔在测试该算法时写道:“GPT-3的性能令人惊叹,但它也和当今最先进的人工智能系统中的很多情况类似:似乎很智能的性能中夹杂着一些非人类错误,而且我们搞不清楚它表现好或犯错误的原因。”
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4618

    浏览量

    93032
  • AI
    AI
    +关注

    关注

    87

    文章

    31042

    浏览量

    269391
  • GPT
    GPT
    +关注

    关注

    0

    文章

    354

    浏览量

    15420
收藏 人收藏

    评论

    相关推荐

    《算力芯片 高性能 CPUGPUNPU 微架构分析》第3篇阅读心得:GPU革命:从图形引擎到AI加速器的蜕变

    CPU、GPU的演进历程,AI专用芯片或将引领未来计算平台的新方向。正如爱因斯坦所说:\"想象力比知识更重要\" —— 在芯片设计领域,创新思维带来的突破往往令人惊叹
    发表于 11-24 17:12

    葡萄酒俱乐部计划部署RFID技术以提高供应链的透明度

    来提高葡萄酒供应链的透明度和效率。 该解决方案是基于区块链和RFID技术来跟踪每瓶酒在运输、储存、购买和消费过程中的信息。该系统记录了每瓶葡萄酒的数字标识、生活故事以及周围的条件,一直到消费者手中。 通过将 超高频RFID标签 嵌入到瓶子
    的头像 发表于 11-23 16:18 166次阅读

    英伟达预测机器人领域或迎“GPT-3时刻”

    未来2-3年内,机器人基础模型的研究将迎来重大突破,这一时刻被形象地比喻为机器人领域的“GPT-3时刻”。
    的头像 发表于 09-20 17:05 810次阅读

    动态代理IP的匿名性和透明度,为主要考虑关键!

    动态代理IP的匿名性和透明度是用户选择代理服务时需要考虑的关键因素。根据用户的需求和场景,可以选择不同匿名级别和透明度的代理服务来平衡隐私保护和网络访问的需求。
    的头像 发表于 09-20 07:36 297次阅读
    动态代理IP的匿名性和<b class='flag-5'>透明度</b>,为主要考虑关键!

    Jim Fan展望:机器人领域即将迎来GPT-3式突破

    英伟达科学家9月19日,科技媒体The Decoder发布了一则引人关注的报道,英伟达高级科学家Jim Fan在近期预测,机器人技术将在未来两到三年内迎来类似GPT-3在语言处理领域的革命性突破,他称之为机器人领域的“GPT-3时刻”。
    的头像 发表于 09-19 15:13 601次阅读

    Arm Kleidi加速AI发展

    在持续快速发展的人工智能 (AI) 时代,我们坚定地支持全球数百万开发者,确保他们能够获得所需的性能、工具和软件库,从而顺利打造下一波令人惊叹AI 体验。
    的头像 发表于 09-14 09:46 410次阅读

    加州立法推动AI透明度,生成式人工智能迎来数据披露新纪元

    的数据使用与透明度问题也逐渐成为公众关注的焦点。8月28日,美国加州立法机构的一项重大举措——人工智能训练数据透明度法案的通过,标志着该州在推动AI行业健康发展、保障公众权益方面迈出了坚实的一步。
    的头像 发表于 08-28 16:20 577次阅读

    开源 KiCad/AD 查看器 + AI Copilot?

    线、焊盘、敷铜透明度 查看网络 3D 预览 查看 BOM AI Copilot 在查看器的右侧,切换到 AI 面板,可以直接提出您的问题: 也可以在原理图中,选中任意器件,然后
    发表于 08-18 22:41

    LED透镜的颜色与透明度基本概念

    如果 LED灯 有透镜颜色,则无论透镜透明度如何,LED 在开和关时都会显示该颜色。如果透镜颜色为白色或无色,则 LED 有可能发出白色,另一种颜色或各种颜色的光,然后在关状态下返回白色或无色。
    的头像 发表于 07-25 09:34 442次阅读

    平衡创新与伦理:AI时代的隐私保护和算法公平

    成了一把双刃剑,其锐利的一面正逐渐指向我们的核心价值。面对这些挑战,制定一套有效的AI治理框架和隐私保护机制变得迫在眉睫。 确保AI决策的透明度是解决这些问题的关键一步。透明度不仅
    发表于 07-16 15:07

    Alpha半透明图形叠加算法Matlab+Verilog的设计实现

    Alpha通道是一个8位的灰度通道,该通道用256级灰度来记录图像中的透明度信息,定义透明、不透明和半透明区域,其中黑表示全透明,白表示不
    的头像 发表于 05-01 10:28 721次阅读
    Alpha半<b class='flag-5'>透明</b>图形叠加算法Matlab+Verilog的设计实现

    Mozilla:科技公司广告透明度工具需进一步完善

    结果表明,X 平台透明度表现欠佳,仅能通过加载速度较慢的 CSV 文件获取相关数据,且缺乏用户友好型网络界面;同时,该平台在目标参数和接收方数据方面亦存在显著不足,亟待改进。
    的头像 发表于 04-17 10:41 587次阅读

    搭载M3芯片的iPad有哪些

    搭载M3芯片的iPad主要有iPad Pro系列。新一代iPad Pro系列都将搭载全新的M3芯片。M3芯片集成了令人惊叹的250亿个晶体管,比之前的M2芯片多出了50亿个,意味着
    的头像 发表于 03-13 16:09 2204次阅读

    Anthropic推出Claude 3系列模型,全面超越GPT-4,树立AI新标杆

    近日,AI领域的领军企业Anthropic震撼发布了全新的Claude 3系列模型,该系列模型在多模态和语言能力关键领域展现出卓越性能,成功击败了此前被广泛认为是全球最强
    的头像 发表于 03-05 09:49 697次阅读

    什么是OpenAI Sora?最佳OpenAI Sora替代推荐

    NightCafe Creator是一款AI艺术生成器应用程序,可以让用户使用各种技术(如神经风格转换和文本到图像AI)创建令人惊叹AI生成艺术品。
    的头像 发表于 02-22 11:22 1439次阅读