0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM新AI在辩论界完胜人类冠军!

bzSh_drc_iite 来源:电子发烧友网 作者:工程师谭军 2018-07-04 15:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

6月18日,IBM的AI系统Project Debater首次与人类进行现场公开辩论。Project Debater能够理解对方观点,并有针对性地做出清晰的反驳,最终成功战胜人类辩手。

美国时间6月18日,IBM Research推出了人工智能系统Project Debater,一个具有幽默感、小巧机智和偶尔有强有力的论点的实验性会话AI系统。当日,Project Debater首次与人类进行现场公开辩论,此次辩论比赛在旧金山的IBM沃森西部厂区( Watson West Site)举行。

Project Debater是IBM Research(即超级电脑沃森背后的团队)最新研制的AI系统,也是第一个可以对复杂话题进行辩论的AI系统,旨在通过公正的辩论来拓展人们的思维。Project Debater拥有数以亿计的论文、报告和新闻文章的庞大数据库。通过消化这些数据,Project Debater可以就特定主题做出逻辑结构良好的演讲,提出清晰明确的论点,并对对手观点进行反驳。尽管在一些叙述上不是很自然,并不能完全和人类相提并论,但Project Debater的思考和答辩仍然令人印象深刻。

IBM Research首席调查员兼Project Debater的创造者Noam Slonim称,该AI系统的训练始于六年前,直到两年前才有能力参与与人们的辩论。

IBM研究人员正在通过教授计算机来探索人工智能的界限,以创造引人入胜且信息更加丰富的观点。他们的目标是建立一个智能系统,帮助人们在答案模糊时作出基于证据的决定。自2012年起,Project Debater是IBM对AI的下一个重要里程碑,是继深蓝(Deep Blue)和沃森(Watson)后的又一突破。根据IBM的计划,Project Debater未来将能够通过提供引人注目的、以证据为基础的论点并限制情感、偏见或模棱两可的影响来帮助人们做出理智的判断。

首战告捷,战胜顶尖人类辩手

Project Debater和2016年的以色列国家辩论冠军Noa Ovadia、以色列国际辩论协会主席Dan Zafrir分别进行了辩论比赛。

图左为Noa Ovadia,图右为Dan Zafrir

在比赛中,Project Debater参与了两个辩论主题,即“政府是否应该资助太空探索”和“远程医疗是否应该在医疗保健中发挥更大作用”。IBM公司希望确保人工智能系统能在不知道将研究什么的情况下进行辩论,因此Project Debater在辩论前并不知道论题。

就“政府是否应资助太空探索”的论题,Project Debater持正方,Noa Ovadia持反方。双方随后发布了四分钟开幕词、四分钟反驳和两分钟论证总结。在每个部分之间,Project Debater听取了人类对手的四分钟开场白,解析了这些数据,并创建了一个突出显示并试图驳斥人类对手所提出的信息的论据。这令人难以置信,因为它不仅要理解单词,还要理解这些单词的背景。鹦鹉学舌般复述维基百科条目很容易做到,但获取数据并创建一个不仅基于原始数据而且还考虑到刚才听到的叙述的内容,却十分困难。

Project Debater提出一个开放性观点,即空间探索有益于人类,因为空间探索不仅有助于推动科学发现,还能激励年轻人突破思考的壁垒。Noa Ovadia则认为诸如地球科学研究之类的项目有更值得获得政府补贴。在听取了Noa的论点后,Project Debater发表了反驳言论,认为太空探索带来的潜在技术和经济利益超过其他政府支出。

在双方总结陈词后,一项快速调查显示,大多数观众认为Project Debater比人类的论述更能丰富他们的知识。

在这次辩论过程中,AI系统确实也出了些差错,并做出了一些疯狂的断言,比如它认为太空探索“比更好的道路、更好的学校或更好的医疗保健更重要”,或者在辩论过程中随机地说出“Scott Pelley画外音”,这似乎是参考了哥伦比亚广播公司(CBS)新闻和60分钟(60 Minutes)记者的言论。

Chris Reed是论证技术中心(Center for Argument Technology)的主任,负责的是一个探索会话式人工智能的学术团队,并没有参与Project Debater项目。应IBM的邀请,Reed在周一的第一次演出中观看了Project Debater的表现,并表示就像在看“如此多的难题聚集在一起”,包括坚持自己论点的能力、语法错误的欠缺以及在做出决定之前能够预测和反驳其反对者的论点等问题。

“争论和辩论,本质上是驱动科学进程的引擎,描述了大多数政治论坛发生的事情,甚至描绘了现代宗教的大多数概念。”Reed说,“论证是人类的一个决定性特征,如果我们的机器能够传达其中的一部分,那么我认为这意味着一件非常重要的事情正在发生改变。”从文化上来看,辩论的起源不在于冲突和竞争,而在于民主和讨论。辩论丰富了决策制定过程,帮助人们权衡新思想和新理念的利弊。它处于文明社会的核心。我们辩论的不仅是为了让别人相信我们自己的观点,而且也是为了理解和学习彼此的观点。

试想一下,一个与专业人类辩论家交流的AI系统听取了他的观点,并以令人信服的方式提出了自己的无脚本推论,说服听众思考其在有争议的话题上的立场,这说明AI系统可以像人类一样去理解意见并有针对性地给予自己的观点。未来,相信机器能够通过帮助人类做出许多重要决定。

之后,Project Debater与另一名以色列辩论专家Dan Zafrir之间进行了第二次辩论,对“应该增加对远程医疗的使用”的论题持反对意见。

此次辩论有四十名成员参与投票,Project Debater比Dan Zafrir多得9票,成功赢得比赛。

在辩论中,Project Debater能够引用阿拉伯联合酋长国的一系列资料以及德国经济事务部长的报告,获得太空探索所能提供的就业数量等有效数据。但是,为了避免犯引用和语言逻辑方面的错误,Project Debater没有直接引用其对手的论述。

“无偏见”的辩论机器

根据IBM研究人员Noam Slonim和Ranit Aharonov的说法,尽管人类辩论机器是对该技术的有趣展示,但Project Debater的真正力量将是其展现无偏见论述的能力。

图左为Ranit Aharonov,图右为Noam Slonim

我们生活在一个被情绪和偏见染上色彩的世界中,难免看问题的角度不够真实与客观。IBM表示,世界充满了错误的信息和肤浅的想法,片面的、被篡改的叙事的兴起正在挑战社会和互联网平台。AI在语言和推理的新发展可以帮助提供多样的、消息灵通的观点,而Project Debater推动AI的前沿发展,促进智慧辩论,帮助人们建立充分知情的论点并做出更好的决策。

Project Debater可以帮助公司和政府透过我们生活经历中的喧嚣提取出一些本质的东西,并产生大多数公正的结论。当然,它所提供的数据集是基于人类的写作作品,而这些数据仍然会存在作者的情感与偏见。

虽然Project Debater的目标是一个没有偏见的机器,但在辩论期间,它还是出现疑似带有偏见的表现。在反驳人类辩手Dan Zafrir关于远程医疗扩张的论题时,该系统声称,Zafrir在开幕声明中并没有说出有关远程医疗使用增加的事实。换句话说,它认为Zafrir是个骗子。

当被问及Project Debater这一表现时,IBM研究人员Noam Slonim表示,在反驳期间,该系统有一个置信度阈值。如果感觉非常自信,它会创建一个更复杂的陈述;如果感觉不那么自信,那么陈述就不那么令人印象深刻。因此,Project Debater对反驳意见不是很有信心,所以它基本上把Zafrir当成一个骗子。有趣的是,这大概是这个系统整个晚上做的最人性化的事情。

构建新AI系统困难重重

在此之前,人工智能可以对关键词搜索回复简单的问题或要求,比如“一升多少盎司?”或者“致电妈妈”,这为人们日常生活提供极大便利。Project Debater则开始探索新的领域:吸收了大量不同的信息和观点,帮助人们建立有说服力的论点并做出明智的决定。

构建系统是一项非常困难和复杂的挑战。Slonim说,为了使Project Debater成为可能,研究人员开发了数十篇研究论文中记载的许多创新技术。虽然准备辩论和反驳或理解对手的论点可能需要大量的技术,但辩论者的大部分对话仍然可以直接从文章中提取出来。

图为研究人员Noam Slonim和Project Debater机器的合影

过去六年来,IBM以色列海法实验室领导的全球IBM研究团队赋予了Project Debater三种功能,每种功能都在AI方面开辟了新的天地:首先是数据驱动的语音编写和交付功能;其次,听力理解能够识别隐藏在人类连续冗长的自然语音中的关键主张,并构建有意义的反驳;第三,系统的模拟人类困境,基于一个独特的知识图谱,提炼出原则性的论点。

辩论的形式为这些核心能力提供了理想的测试基础。辩论规则源于人类的讨论文化,论证的内核往往是内在的主观的。Project Debater必须适应人的理性和思考逻辑,并提出人们可以理解和接受的论点。在辩论中,人工智能必须学会在凌乱的非结构化人类世界中进行导航和检索,而不是像在棋盘游戏中那样使用预先定义的规则。

与Big Blue在国际象棋中打败国际象棋大师Gary Kasparov、DeepMind的AlphaGo击败世界顶级围棋选手不同,辩论比其他比赛更加细致,与会者通过投票来决定本场比赛的最佳辩手,而人工智能通常拥有胜过人类丰富观众知识的能力,Ranit Aharanov如是说。

结语:Project Debater有助于人类做出明智的决定

Project Debater让我们更接近人工智能的一个巨大界限:掌握语言。它是IBM一系列主要AI创新产品中的最新产品,其它产品还包括1997年获得国际象棋世界冠军Garry Kasparov的IBM深海“Deep Blue”,以及2011年在Jeopardy上击败人类冠军的超级智能系统沃森(Watson)。

尽管Project Debater的工作还远远没有完成,它有时会像人一样犯错。但在不远的将来,它很有可能帮助解决数千个复杂的人类决策。例如,帮助收集和整理某个金融事实的相关材料,或提出与公共政策有关的赞成和反对的论点。由于不经常受到人类主观意识和偏见的影响,Project Debater提出的观点可能会贴近事实。

Project Debater将扩展沃森的功能,目前数十家公司正在使用沃森的功能挖掘大量内部数据集以获得新的业务洞察力。该系统已经使用了Watson Speech to Text API,并将有助于增强沃森的高级语言和对话功能。未来,它的基础技术也将在IBM云平台和IBM沃森中商业化。

这对AI来说是一个非常积极的发展。我们可以使这种变革性技术更加透明和可解释,这样我们就越能信任它;而我们越能信任它,它就越能帮助我们在日益复杂的世界中做出最好、最明智的决定。

Slonim在接受采访时告诉VentureBeat,在此次辩论赛之后,Project Debrater将在今年晚些时候参加一场旷日持久的辩论,随后可能会举行一次研讨会,学者可以提出他们对Project Debater的意见和评论。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1879

    浏览量

    77127
  • AI
    AI
    +关注

    关注

    91

    文章

    41103

    浏览量

    302585

原文标题:辩论届人机大战:IBM新AI完胜人类冠军!

文章出处:【微信号:drc_iite,微信公众号:全球技术地图】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    解码IBM的开源AI大道

    IBM 自加入中国市场以来,已走过四十多年的发展历程。最初,IBM 中国区 IDC 市场的 x86服务器领域占据了领先地位,而小型机的市场份额更是处于绝对霸主地位。十年之后,IBM
    的头像 发表于 03-26 16:03 649次阅读
    解码<b class='flag-5'>IBM</b>的开源<b class='flag-5'>AI</b>大道

    论马斯克的预言:AI使人类边缘化

    当地时间3月11日,“Abundance Summit”科技峰会上,马斯克谈及AI进展时表示,AI已经进入自我改进阶段,超高量级AI面前
    发表于 03-14 05:27

    A2RL Drone Championship引领自主飞行领域AI创新加速前行

    自主飞行单圈的成绩夺得AI Speed Challenge冠军;与此同时,世界FPV冠军人类第一视角(FPV)飞手MinChanKimH
    的头像 发表于 01-29 17:27 1633次阅读

    电子获评2025年广东省省级制造业单项冠军企业

    2025年12月31日,广东省工业和信息化厅正式公示2025年省级制造业单项冠军企业名单,深圳市金电子科技有限公司凭借研发创新实力和细分领域的领先优势,成功获评“2025年广东省省级制造业单项冠军企业”。
    的头像 发表于 01-22 15:37 627次阅读

    IBM Rhapsody AI 助手:让系统工程更智能

    IBM Rhapsody AI 能力的加入,标志着系统工程正逐步迈入智能化新阶段。它让模型不再只是“被动表达设计意图”的工具,而成为能理解、能推理、能生成的智能伙伴。 AI 时代,系
    的头像 发表于 01-06 11:34 435次阅读
    <b class='flag-5'>IBM</b> Rhapsody <b class='flag-5'>AI</b> 助手:让系统工程更智能

    汉鑫科技与IBM落地AI深耕计划

    今天,山东汉鑫科技股份有限公司(此后简称“汉鑫科技”)和 IBM 中国正式宣布,将在山东烟台落地 IBMAI 深耕计划”,为中国企业的智能化转型和全球化运营提供安全、灵活、定制化的企业级技术方案和咨询服务。
    的头像 发表于 12-09 17:44 878次阅读

    溪图科技与IBM合作打造AI基建生态系统

    近日,IBM 与溪图科技(杭州)有限公司(以下简称”溪图科技”)达成合作,双方将基于 IBM watsonx 数据和 AI 平台、IBM watsonx Orchestrate 等企业
    的头像 发表于 09-24 16:07 1178次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    的不同。随着AI热潮的兴起,大脑的抽象模型已被提炼成各种的AI算法,并使用半导体芯片技术加以实现。 而大脑是一个由无数神经元通过突触连接而成的复杂网络,是极其复杂和精密的。大脑本质上就是一台湿润的软组织
    发表于 09-06 19:12

    OpenAI开源模型登陆IBM watsonx.ai开发平台

    OpenAI 已向公众发布了两款 AI 模型,允许开发者和企业可自由下载、运行并进行定制。其中一款模型现已部署 IBM watsonx.ai 开发平台上。
    的头像 发表于 08-26 15:36 1145次阅读

    2025 IBM中国企业级AI巅峰论坛即将开幕

    的共创交流平台,将于 2025年 9月 5日山东烟台举行 IBM 中国企业级 AI 巅峰论坛(此后简称“论坛“)。
    的头像 发表于 08-26 15:30 1305次阅读

    星宸芯片:中国AI视觉芯片的隐形冠军

    全球半导体产业竞争日益激烈的背景下,中国芯片企业正加速突围,而 星宸科技(SigmaStar) 凭借其 AI视觉芯片 领域的深耕,成为行业内的“隐形冠军”。从智能安防到车载影像,从
    的头像 发表于 07-25 12:49 2891次阅读

    智能体AI面临非结构化数据难题:IBM推出解决方案

    北京 2025年7月1日 /美通社/ -- IBM 正在从根本上简化面向 AI 的数据堆栈。IBM Think大会上预览 watsonx.data 的重大演进,以帮助组织做好数据准备
    的头像 发表于 07-02 09:40 674次阅读

    IBM发布业界首个AI智能体治理与安全软件

    随着越来越多的企业开始推动 AI 智能体的规模应用,IBM 于近日推出业内首款整合了AI 安全与 AI 治理、并提供企业风险态势统一视图的软件。
    的头像 发表于 06-28 10:39 1254次阅读

    IBM为温网推出AI聊天助手及结果预测功能

    全英草地网球俱乐部和 IBM(纽交所代码:IBM)近日宣布,将在 2025年温布尔登网球锦标赛(此后简称“温网”)期间为球迷带来全新的增强型 AI 数字体验。这包括首次亮相的交互式 AI
    的头像 发表于 06-27 09:23 1005次阅读