ChatGPT对社交机器人技术发展的影响分析
摘 要 作为生成式人工智能的典型代表,全新的预训练基础模型ChatGPT已成为各界关注的“现象级”讨论热点。对ChatGPT及其对社交机器人技术发展的影响与启发进行综合评述。首先介绍了ChatGPT的概念内涵、主要特征、发展历程;其次探讨了以ChatGPT为代表的预训练基础模型所反映出的当前人工智能技术发展趋势;最后分析了近来生成式人工智能的飞速发展对于社交机器人研究与应用的提升作用。综述表明,社交机器人对于内容自主生成能力的旺盛需求,使其与生成式人工智能的发展进度紧密耦合,未来将在个性化内容生成、生成内容鉴别与管制、“涌现”能力溯源等方面继续发展。
1 引 言
美国OpenAI公司推出的ChatGPT,几乎成为了全球人工智能领域自2016年的AlphaGo以来又一个“里程碑式”节点和“颠覆式”革新,有望开启新一轮技术驱动产业变革的加速发展。作为从“专用人工智能”迈向“通用人工智能”[1]的标志性成果,ChatGPT已于2023年1月被美国国防信息系统局(DISA)列入观察名单,值得高度关注。在刚刚过去的2023年2月24日,OpenAI公司基于对ChatGPT所代表的大规模预训练基础模型的深入思考和中长期发展规划,发布了《通用人工智能发展规划(Planning for AGI and beyond)》(如图1所示),认为通用人工智能或许能成为人类才智和创造力的强大“增幅器”。
图1 OpenAI公司发布《通用人工智能发展规划》
Fig.1 Planning for AGI and beyond from OpenAI
2 ChatGPT的概念特征与发展历程
2.1概念内涵
ChatGPT是一种全新的预训练基础模型[2-3](Pre-Training Foundation Model),主要针对智能对话任务,在“预训练+下游任务微调”模式的传统预训练基础模型的基础[4]上,通过引入基于人类反馈的强化学习等先进策略,从海量数据中自主学习“世界知识”,成功实现了复杂自然语言理解、“人格化”类人语言生成、多轮人机问答等能力的质的飞跃,在理解人类思维的准确性方面,达到了前所未有的高度,并成为史上用户数增长最快的消费级应用(2个月内积累1亿用户)。
2.2主要特征
以ChatGPT为代表的预训练基础模型,已经成为当前人工智能发展的主流方向和最高水平,预计将成为现阶段及未来3~5年内人工智能研发与应用提速升级的最强“助推器”,其成功的关键主要来源于以下三个方面:一是拥有庞大的基座大模型作为支撑,ChatGPT所基于的GPT系列模型均是拥有庞大参数规模的基座大模型,其主要经历三次迭代,参数量从1.17亿增至1750亿[5],ChatGPT的参数量业界估计将近2000亿;二是拥有高质量的真实数据作为供给,OpenAI在数据积累、清洗、标注等方面进行了持续数年的大力投入,预训练数据的体量和质量遥遥领先,业界推测ChatGPT的训练数据规模高达8000亿个单词;三是拥有强大的算力资源作为保障,驱动ChatGPT的算力资源十分昂贵,其所依托的云服务供应商——微软Azure为此提供了约1万个GPU(图形处理器)和超过28.5万个CPU(中央处理器)。
2.3发展历程
自2018年起,OpenAI公司先后发布了GPT-1、GPT-2、GPT-3、InstructGPT等4个主要版本[6]。其中,GPT-1的标志是无监督学习,GPT-2的标志是多任务学习,GPT-3的标志是海量参数(如图2所示)。自GPT-3后,OpenAI公司所有模型都不再开源,现有对ChatGPT的分析研究主要是基于历史版本的技术推测。OpenAI公司于2019年3月从非盈利转型为盈利公司,陆续获得微软等多个机构的七轮融资,其中,微软的总投资额高达数十亿美元。充足的资金是ChatGPT成功的重要条件,仅2022年,OpenAI研发投入就超过5.44亿美元。
图2 ChatGPT及其历史版本的发展历程
Fig.2 The development of ChatGPT and its historical version
3 ChatGPT对人工智能技术发展的重要意义分析
3.1ChatGPT技术定位与应用分析
ChatGPT 是技术发展的演进,不是跨代式颠覆,但会在应用层面引起新一轮的革命,其影响力不亚于互联网的诞生。
(1)技术研判
ChatGPT是一次技术路线的胜利。自2018年起,美国谷歌公司的BERT模型和美国OpenAI公司的GPT系列模型成为预训练基础模型的两个主流方向。其中,BERT的训练方式是让模型根据前后文双向猜测,实现无标注文本自监督学习,曾经在很长一段时间内优于GPT;GPT则是按照单向预测、参数升级、反复训练和生成内容反馈等方式持续迭代优化,目前已明显优于BERT。目前,ChatGPT 的效能仍然建立在海量数据训练和统计分析的基础上,技术本质上尚未脱离“弱人工智能”的范畴,虽然其在某些文字应用(如内容生成)、重复代码构建等场景中的效能已超过大多数人工,但仍然没有解决完备“世界知识”与深层认知推理等技术难题。因此,ChatGPT 虽呈现“智能”,却未拥有“智力”。
以 ChatGPT 为代表的预训练基础模型技术将会朝着以下方向发展:一是多模态融合处理,有效处理图像、视频、语言、语音等多模态的数据及跨模态信息;二是具有与物理现实世界交互的能力,探索具身智能、物理常识、抽象世界模型、可感知的四维物理空间等;三是信息时效性显著增加,不仅可以从历史数据中汲取养分,而且可以动态获取和即时分析网络实时信息;四是在缜密逻辑思考、数学求解、长程思考、复杂任务处理等能力上得到进一步提升。
(2)应用研判
ChatGPT技术应用前景广阔,积极抢占高地刻不容缓。以其在军事领域的应用为例,美国国防部的“第三次抵消战略”指出,“人工智能的快速发展,连同机器人技术、自主性、大数据以及与工业界加强合作,将定义下一代战争”。将ChatGPT这种交互式人工智能聊天机器人部署在加固型边缘计算机上有望在多域作战环境中发挥关键作用,为士兵提供他们需要的实时信息、态势感知结果、辅助决策方案等,以有效协调战场所有领域的行动。因此,其在海量信息检索、深度获取与处理,多模态情报处理与认知,作战规划与场景决策,网络对抗等方面均具备较强的应用潜力。然而,目前此类预训练基础模型没有办法保证回答是稳定可靠、正确无误的,对于军事应用具有较大风险,需进行进一步研究予以解决。
3.2ChatGPT所反映出的人工智能技术主要发展趋势分析
预训练基础模型广泛而深入的成功应用,深刻阐释了当前生成式人工智能[7](Generative Artificial Intelligence)发展的主要趋势,同时也为人工智能的发展指明了方向。
(1)模型、算力、数据仍然是影响人工智能能力的基本要素
ChatGPT成功的关键动能主要来自算力、数据、算法这三个方面,充分说明算力、数据、算法依然是当前决定人工智能能力高度的决定性因素。规模庞大且架构先进的模型、强大的算力资源、巨体量高质量的数据资源,决定了以预训练基础模型为“风向标”的新一代人工智能所能达到的高度。国内科研院所及科技企业在大语言模型、语料数据集、国产化算力等方面具备一定基础,但相对ChatGPT仍存在差距。以数据为例,国内并不缺乏数据,但在海量异构数据清洗、标注方面仍未形成有效机制。据估算,百亿级数据中可能只有10%的数据是“可用”的,数据质量在一定程度上制约了我国国产大模型的发展[8-9]。
(2)“通用+专用”人工智能呈现出融合发展态势
很长一段时间内,由于通用人工智能存在前期投入大、智能水平低、商业模式匮乏等问题,人工智能发展普遍聚焦垂直专业领域的赋能应用,专用人工智能是发展主流;作为从“专用人工智能”迈向“通用人工智能”的标志性成果,ChatGPT的成功意味着通用人工智能已逐步进入商业化落地阶段[10]。经过海量数据训练后,预训练基础模型可以被引导执行任意的任务:预训练基础模型代表了一种范式转变,从训练基于特定任务的模型到训练可执行多任务的模型。因此,在聚焦垂直专业领域的专用人工智能发展日趋成熟的当下,以预训练基础模型为代表的、具备解决多任务能力的通用人工智能也逐渐进入商业化阶段,“通用”和“专用”互补的人工智能技术与产业体系正在加速演进。
(3)人工智能正由“感知智能”快速向“认知智能”迈进
预训练基础模型带来了理解人类语言和推理解题能力的大幅度提升,引领人工智能从感知智能所侧重的图像信号(信号抽象程度相对较低)处理能力向认知智能所侧重的人类语言信号(信号抽象程度相对较高)处理能力演进,引领人工智能从感知智能所达到的“能说、能看”能力向“能思考、能创作、能决策”等高阶认知能力快速演进。
(4)模型存在安全隐患,可信可解释将成“下一站”研究方向
受训练语料和技术架构的影响,ChatGPT存在意识形态安全、内容安全、隐私泄露、网络安全等诸多问题[11-12]。以意识形态安全为例,部分政治问题等敏感的问答反映出ChatGPT依然存在思想偏见,其能够被发展为无处不在的意识形态对抗,对使用者产生无形的影响;同时,其本身也易被人为干扰导致结果出现偏向。因此,在人工智能“大模型”时代、通用技术不可阻挡的发展潮流中,面向数据隐私保护、正确价值观引导等安全要素,应积极开展反ChatGPT相关的“反智能”基础算法研究应用工作。
(5)围绕预训练基础模型的人工智能竞争可能形成“赢者通吃”态势
万亿级预训练基础模型对企业的数据储备、技术实力、算力平台、投入资金等要求极高。高昂的投入需求意味着,主流的大规模预训练基础模型只能由大型科技公司或者少数研究机构掌握。同时,ChatGPT发布后的全世界热度,使其具备巨大的先发优势,能够抢先收集大量用户使用数据,使其与其他企业之间的差距“雪球”越滚越大,逐步形成“数据壁垒”,进而质变为“能力壁垒”。
4 ChatGPT对社交机器人技术的影响分析与发展建议
4.1ChatGPT对社交机器人技术发展的主要影响分析
在信息时代社交媒体出现后,其应用场景越来越广泛、丰富,且社交媒体的用户覆盖率逐年上升。社交机器人通常是指用于自主化文宣、价值传播等用途的,且具有发布、转发、评论、点赞、聊天等“人-机”交互功能的社交媒体虚拟账号[13-14],又称为“虚拟机器人”(如图3所示),在市场营销、情感陪护、舆情治理等领域有着广泛而深入的应用。在各大社交媒体平台中,Twitter平台以其高达4.36亿的用户数量排在前列,其月度活跃用户数量达2.11亿,而这其中有4800万的账号是社交机器人[15]。
图3 社交机器人功能示意
Fig.3 Function diagram of social robot
在当前人工智能时代,随着相关技术的成熟与应用的丰富,社交机器人已逐渐从“人工”有人化、手动式养殖培育转变为“自动”无人化、托管式成长,但是其技术层面的核心需求——内容生成是始终不变的,其所生成和发布传播的内容的质量决定了社交机器人所能够产生的价值和应用效益。随着近年来以预训练基础模型为代表的生成式人工智能技术的快速发展(例如2022年被誉为“人工智能生成内容[16](AI-Generated Content)元年”),特别是最近ChatGPT快速兴起带来的启示,社交机器人的内容生成方法论已由传统的基于规则模板的“浅层”生成转变为当前预训练基础模型加持下的“深度”创作,已由过去生成内容的“千篇一律”转变为现在的向着“差异化、人格化”方向发展。
(1)ChatGPT体现出的智能“涌现”带来社交机器人“创造力”的提升
“涌现”通常是指:一个研究对象表现出自身部分所不具备的特性。例如,这些行为或能力只有通过各个部分的相互作用才能显现出来。已有研究将以ChatGPT为典型代表的预训练基础模型的“涌现”能力定义为:如果一种能力不存在于较小的模型中、而存在于较大的模型中,那么这种能力就是涌现出来的[17]。
已有研究发现,预训练基础模型的表现并非随着模型规模增加而线性增长,而是存在临界点。只有当模型规模大到超过特定的临界点,才会“涌现”出较小的模型不具备的“新”能力、自主学习到“新”功能,体现出创造性。ChatGPT所体现出的这种“涌现”能力能够赋予社交机器人强大的“创造”能力,不仅彻底改观以往人们对社交机器人发文“千篇一律”的印象,通过产生生动的且具备“人格化”的内容,让人越来越不易察觉发文的背后是一台机器,还能生成意想不到的、超乎寻常的内容。
(2)先进计算架构驱动下的ChatGPT带动社交机器人在“多任务”适配能力上的提升
如何驱动社交机器人弹性、高效地适用于不同的垂直领域场景(例如在金融、医疗、教育领域之间快速切换等)、应用于不同任务(例如对话问答、内容检索、方案规划等),是目前社交机器人所需要解决的关键问题。
预训练基础模型驱动下的社交机器人在多任务适配能力方面的提升,主要源自如下两个重要因素:一是预训练基础模型所体现出的涌现能力意味着,大规模预训练基础模型可以进一步扩展语言模型的功能范畴与应用范围。ChatGPT的成功,已经表明预训练基础模型在零样本或者小样本学习上的涌现能力,已让它们得以进入实际应用领域,并能够在自然语言处理研究领域之外产生和服务于许多新的应用;二是预训练基础模型所采用的“预训练+下游任务微调”或者“预训练+提示”等先进的数据训练与推理范式[18-20],保证其能够快速适配不同的应用任务。
(3)跨模态数据关联理解能力带动社交机器人“多模态”内容生成能力的提升
图片、视频等多模态信息加持下的生成内容,比传统单调的文字形式文宣,对社交媒体受众而言更容易被接受也更加具有感染力。因此,让发布和回复的内容存在多种模态(如图文结合等方式),是社交机器人研究与应用一直追求的目标。
从技术层面来看,ChatGPT属于生成式人工智能范畴,预训练基础模型擅长于多模态数据融合、推理与生成[21-23],能够依托数据挖掘分析策略从海量多源多模态异构信息中得到高价值信息、提高多元化和细粒度的跨模态数据关联能力,基于预训练基础模型的多模态内容生成,已经成为当前重要的研究热点。此外,在目前多模态内容生成的“延长线”上,进一步探索融合跨模态知识来得到更加符合推理目标的准确的推理链条,是未来预训练基础模型在认知能力强化方面的必由之路。
(4)以策略生成为代表的辅助决策能力带动社交机器人“精准投送”能力的提升
目前,以ChatGPT为代表的预训练基础模型已体现出初步的、可用的时序逻辑梳理和策略规划能力,而这正是社交机器人所亟需的,如文宣内容编排与投放顺序、推送强度与内容搭配等,这些文宣投放策略方面的设置与“组合拳”,直接决定了社交机器人的信息传递目的能否完成、决定了社交机器人的工作效能。
一方面,基于ChatGPT的人工智能可以分析来自多个来源与媒介的大量数据,以提供快速准确的“目标对象是否容易被影响、是否适宜文宣投放”的评估,帮助决策人员快速做出规避投入风险的决策;另一方面,依托预训练基础模型日渐成熟的策略生成能力,快速生成包括投放对象、投放内容、投放顺序等要素在内的文宣投放方案,并通过“人-机”协同机制迭代完善生成更明智、更有效的投送决策,实现新的精准投送。
4.2发展基于生成式人工智能的社交机器人技术的主要建议
ChatGPT是一种大规模预训练模型,该类模型是“生成式人工智能”的典型代表,生成式人工智能更是被誉为“提出了自启蒙运动以来从未经历过的哲学挑战和实践挑战”。生成式人工智能对于社交机器人技术有着天然的强关联,对发展基于生成式人工智能的社交机器人技术,建议如下:
(1)开展个性化内容自主生成的研究
伴随着互联网的深度发展和广泛普及,无论是商业推广还是舆情治理,都离不开对广大受众的精准推动,通过弹性强度推送、精心搭配推送内容、情感调动、意识形态引导等方式施加舆论引导、实现公众认知的改观。因此,亟需推进面向动态领域知识的多模态内容生成,构建面向虚拟机器人养成的行动部署技术体系,融合画像库及事件知识图谱设定社交机器人身份,结合大规模预训练基础模型,研究具有明确立场、观点、情感倾向和具有目标地区语言特点的内容生成技术;研究目标用户导向、事件导向的社交机器人智能化行为,提升社交机器人的人格化水平。
(2)开展生成内容甄别与管制的研究
生成式人工智能降低了虚假信息的伪造成本,为制造“信息茧房”、情报迷雾、舆论攻击、意识形态渗透、网络攻击等提供了新手段,给国家安全带来新的挑战。因此,亟需深化开展开源情报迷雾甄别技术研究,避免被误导、被诱偏;围绕意识形态与认知塑造,开展以ChatGPT为代表的生成式人工智能技术滥用的检测识别与监管控制。
(3)开展涌现能力定位溯源的研究
ChatGPT体现出强大的智能“涌现”能力。涌现能力具有重要的科学意义:如果涌现能力是没有尽头的,那么只要模型足够大,强人工智能的出现就是必然的。但是这种“涌现”目前不可控、不可预测,而且涌现能力也并非全然是好事,例如预训练基础模型带来的社会与伦理问题(性别与种族歧视、不文明用语等),有时也具有涌现的特性,即当模型较小时不会出现、只有模型足够大时才会呈现。因此,亟需研究预训练基础模型的涌现能力及其局限性:一方面建立对涌现能力的一般性理解,并探索其未实现的潜力及最终极限,探究大模型涌现能力来源、定位模型预测不稳定的根本原因,以此为构建稳健大规模预训练基础模型奠定基础;另一方面,研究知识真实性验证技术,实现对大模型中“过时”“错误”知识的快速定位,研究大模型知识更新、编辑技术,实现大模型知识的快速更新修补。
5 结束语
全新的预训练基础模型ChatGPT代表着当前生成式人工智能技术的前沿水平,已经成为新一代人工智能战略布局中不可取代的“共性技术基础设施”,并显著带动了社交机器人在内容“创造性”、“多任务”适配、“多模态”内容生成、内容“精准投送”等方面的能力提升。可以预见,随着以预训练基础模型为代表的生成式人工智能技术的发展与完善,未来社交机器人技术的研发与应用,将在个性化内容生成、生成内容鉴别与管制、智能“涌现”能力溯源等方面继续取得进步。
-
机器人
+关注
关注
210文章
28239浏览量
206641 -
人工智能
+关注
关注
1791文章
46909浏览量
237685 -
ChatGPT
+关注
关注
29文章
1550浏览量
7511
原文标题:推荐阅读 | ChatGPT对社交机器人技术发展的影响分析
文章出处:【微信号:CloudBrain-TT,微信公众号:云脑智库】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论