超大预训练模型(large scale pre-trained model, LSPTM) 的发展在人工智能领域产生了意想不到的效果, 尤其是在自然语言处理(natural language processing, NLP)上 ChatGPT 的突破, 似乎打通了 “人工智能” 的任督二脉, 在短短的几个月内, 其智能实现了从人类可以理解的智能到无法理解的智能跨越。以 ChatGPT 为代表的 LSPTM 即将开启一个全新的硅基智能时代,指挥与控制(command and control, C2) 作为人类社会引以为豪的体现智慧的关键要素,会面临什么样的机遇和挑战?以 C2 过程的基本范式和运行基本模式框架为指导, 全面分析 LSPTM 在 C2 活动的物理域、信息域、认知域以及社会域各方向潜在的应用, 阐述硅基智能时代,人工智能从辅助工具角色向伙伴和替代角色的跨越,C2 领域发展的机遇. 军事领域对抗性 C2 的竞争不再局限于技术, 而是培育 LSPTM 的文化底蕴, 东西方文化与价值观的差异将决定两种不同 LSPTM 的智慧与智能。
自1943年美国神经科学家麦卡洛克(Warren McCulloch)和逻辑学家皮茨(Water Pitts)建立神经元的数学模型以来,人工智能的发展可谓是“过山车”,既有符号主义、联结主义(神经网络)学派掀起的高潮,也有专家系统带来的困境和徘徊,总而言之,人工智能的孕育过程跌宕起伏。2018年,一种全新的学习训练方法——预训练为深度学习打开了一扇智慧之门。预训练成功激活了深度神经网络对大规模无标注数据的自监督学习能力,在图形处理器(graphics processing unit,GPU)算力和海量无标注文本数据的双重加持下,实现深度学习模型规模与性能齐飞,成为人工智能领域的革命性突破。
围绕LSPTM在海量数据、并行计算和模型学习能力方面等展开的“军备竞赛”日益白热化。2023年,OpenAI发布的预训练多模态模型GPT-4已经达到了万亿级参数量的惊人训练规模,其智能在各种职业和学术考试上的表现与人类水平相当。
马克思认为科学技术是军事发展中最活跃、最具革命性的因素,每一次重大科技进步都深刻影响着世界军事发展走向,引发战争形态和作战方式的重大变革[1]。超大规模预训练模型带来的人工智能的技术突破将导致什么样的军事变革?本文深度剖析LSPTM的发展历程、科学原理、关键技术及涌现功能,以军事体系的关键要素——指挥与控制为对象,以C2过程的基本范式和运行模式框架为指导,从物理域、信息域、认知域和社会域,全维LSPTM的应用场景,阐述LSPTM实现人工智能突破给C2领域发展带来的机遇和挑战。
1LSPTM
1.1 LSPTM发展历程
LSPTM一般指在大规模未标注数据集上进行预训练的深度神经网络(deep neural network)。预训练后的深度神经网络可以通过微调(fine-tune)、上下文学习(in-context learning)等方式适配各种下游任务,并达到最佳性能(state of the art,SOTA)。LSPTM已经成为人工智能领域中最具潜力的方向之一。
LSPTM的发展历程可以追溯到2017年Vaswani等发表的论文《Attention Is All You Need》[2],文中提出了Transformer新型神经网络。Transformer的优势在于设计自注意力机制(self-attention mechanism),在机器翻译、文本分类、问答系统等NLP问题中,超越循环神经网络(recurrent neural network,RNN)和卷积神经网络(convolutional neural network,CNN)取得了SOTA。随后Transformer被拓展至计算机视觉(computer vision,CV)、多模态数据等其他任务中,并同样取得了优异的成绩。
在Transformer提出不久后,研究人员开始探索基于Transformer的LSPTM,首先应用于NLP任务,随后拓展至CV和多模态任务。由于超大的参数量和强大的性能,这类LSPTM也被称之为基石模型(foundation model)、大模型(large/big model)[3]。
1.2典型LSPTM
国内外多家高校、研究机构和公司已开展了LSPTM的研究,并取得了丰硕的成果,本节简要介绍相关LSPTM,更多关于LSPTM的介绍和发展讨论可以参考文献[4]。
1)生成式预训练Transformer(generative pre-trained transformer,GPT)
2018年,OpenAI提出了GPT。GPT采用自监督学习(self-supervised learning)训练模型,其首先使用大量文本数据进行预训练,然后针对各种NLP任务进行微调[5]。GPT采用了Transformer结构,使用了12层解码器和768个隐藏单元,共有1.17亿个参数。GPT使用的文本数据包括维基百科、新闻、书籍等。GPT在英文的文本生成任务中取得了当时的SOTA。GPT-2在GPT的基础上提升了网络规模,约有15亿个参数和48层Transformer结构,训练集为约40 GB的文本数据[6]。GPT-3沿着该思路进一步升级,网络约有1750亿个参数[7]。今年3月份,OpenAI发布了约有1.6万亿个参数的GPT-4。GPT-4除了可以完成更加复杂的NLP任务,还可处理多模态数据,能够描述不寻常图像中的幽默、总结截屏文本以及回答包含图表的试题。在GPT-4发布前,OpenAI发布了第一款面向大众的LSPTM产品——ChatGPT,提供了堪比真人的交流体验,引起了全球轰动。
2)基于Transfomer的双向编码器表征(bidirectional encoder representations from Transformers,BERT)
2018年,Google提出了NLP模型BERT[8]。相比与其他NLP模型,BERT的不同之处在于采用了双向的Transformer结构,可以同时利用左右两个方向的上下文信息,从而更好地理解文本。在预训练任务中,BERT设计了遮蔽语言模型(masked language model)和下句预测(next sentence prediction)两种任务。在遮蔽语言模型任务中,BERT会随机遮蔽文本中的一些词汇,然后让模型预测这些被遮蔽的词汇。在下句预测任务中,BERT会随机选择两个句子,并让模型判断这两个句子是否为相邻的两个句子。标准版的BERT约有3.4亿个参数,基本结构为Transformer。BERT在11种NLP任务上都取得了当时的SOTA,是LSPTM的代表之一。
3)对比语言图像预训练(contrastive language-image pre-training,CLIP)
在多模态任务中,OpenAI于2021年提出了CLIP,用于实现图像和文本之间的交互理解[9]。CLIP同样采用了Transformer结构,其目标是通过预训练模型,在大规模的图像和文本数据上学习一个通用的视觉和语言表示,从而使得模型能够同时理解图像和文本的含义。CLIP的预训练任务是通过对图像和文本之间的对比学习来实现的。具体来说,CLIP会将一张图像和一段文本作为输入,然后让模型判断这个图像和文本是否相关。通过这种方式,CLIP能够学习到图像和文本之间的关联性,从而建立起视觉和语言之间的联系。CLIP可以应用于各种NLP和CV任务,例如:图像分类、图像生成、视觉问答、图像检索、文本分类等。与一般的单模态的NLP和CV模型相比,CLIP的优点在于它能够同时处理
文本和图像数据,完成更复杂的任务。
4)文心一言
文心一言(ERNIE Bot)是今年3月百度发布的一款知识增强大语言模型产品,能够与人对话互动、回答问题、商业文案创作、数理逻辑推理、多模态生成(协助用户创作和绘图),高效地帮助用户们获取信息、知识和灵感。文心一言在中文的NLP任务中具有一定的优势,其基础LSPTM是ERNIE5。根据文献[10],ERNIE中ERNIE 3.0 Titan约有2600亿个参数。ERNIE Titan采用了自监督对抗损失(self-supervised adversarial loss)和一个可控语言建模损失(controllable language modeling loss),使ERNIE 3.0 Titan产生可控且具有可信度的文本,ERNIE 3.0 Titan在68个NLP任务中取得了当时的SOTA。
5)盘古
盘古(PanGu)是华为推出的一系列人工智能LSPTM产品,包括NLP大模型、CV大模型、科学计算大模型。盘古系列大模型于2021年预先发布了NLP大模型和CV大模型,沉寂两年后,今年4月8号将正式发布相关产品,首次将Transformer的编码器和解码器同时用于LSPTM,保证模型生成能力和理解能力。文献[11]介绍了华为自然语言LSPTM盘古-α(PanGu-α),展示了盘古NLP大模型的技术。PanGu-α网络参数量为2 000亿。PanGu-α是在MindSpore2下开发的,并在2 048个Ascend 910人工智能处理器的集群上进行训练。训练的并行策略是基于MindSpore Auto-parallel实现的。此外,华为为增强模型的泛化能力,收集了1.1TB的中文NLP数据训练模型。
6)M6
M6是阿里巴巴推出的多模态大模型产品,目前模型参数达10万亿以上。M6通过将不同模态的信息经过统一加工处理,沉淀成知识表征,为各个行业场景提供语言理解、图像处理、知识表征等智能服务,其M6指多模态到多模态多任务巨型转化器(multi-modality to multimodality multitask mega-transformer)。根据文献[12],M6的工作包括构建了当时最大的中文多模态预训练数据集,其中包括超过1.9 TB的图像和292 GB的文本,并在一系列下游任务取得了良好的表现,例如电商图文商品检索、推荐;智能制造中设计图片生成、汽车3D图片展示;金融行业摘要和文本生成、数字感知、点评等等。
2ChatGPT的技术原理与功能分析
ChatGPT是OpenAI发布的第一款面向大众的LSPTM产品,也是GPT系列的代表作之一,发布即取得了全世界范围内的广泛关注,具有里程碑式的意义。本章以ChatGPT为例介绍其相关原理和方法。由于GPT-2以后GPT模型不再开源,且ChatGPT并无论文,所以主要参考InstructGPT[13]和ChatGPT的博客。
2.1 ChatGPT的技术原理
与RNN和CNN不同,Transformer在处理数据(尤其是时序数据)时无需按时间顺序来处理信息。Transformer利用自注意力机制,能够同时考虑输入序列中所有位置的信息,从而能够更好地捕捉长距离依赖关系。另外,Transformer还引入位置编码(position encoding)来保留输入序列中的位置信息。Transformer结构由编码器和解码器两部分组成。编码器负责将输入序列编码为特征表示,而解码器则将这些特征表示转化为输出序列。Transfomer更详细的介绍可参考论文[14]。
与其他深度神级网络不同,增加Transformer的网络参数可以提升其性能,这使得提升网络参数以突破网络性能瓶颈成为了可能,因而引领了LSTPM的人工智能潮流。ChatGPT基于Ttransformer框架,基础模型为GPT-3.5,并采用人类反馈强化学习(reinforcement learning from human feedback,RLHF)对模型输出进行优化,实现了真人的交流体验。
ChatGPT的训练流程如图1所示,其训练流程大致可分为3步:
Step 1 基于真人回复示例监督训练GPT-3.5;
Step 2 基于真人排序训练奖励模型;
Step 3 反馈优化监督训练后的GPT-3.5。
图1 ChatGPT训练流程
Fig.1The training process of ChatGPT
1)基于真人回复示例监督训练GPT-3.5
针对同一提示,该步基于GPT-3.5的回复以及人类给出的回复示例,再采用监督学习的方式训练GPT-3.5,使其初步产生与人类对话类似的回复。该步过后的GPT并不完美,但可初步提供具有人类对话感觉的体验。
2)基于真人排序训练奖励模型
该步是RLHF的核心步骤之一,其目的是通过神经网络去学习真人的价值偏好。针对所有的提示,如果都可以用真人去评价,自然也可以训练得ChatGPT,但这样无法实现自动化的训练方式,客观上实现也并不可能。因而需要有个符合真人价值偏好的奖励模型来评价监督训练后GPT-3.5的回复,以纠正其输出。该步通过对比学习的方式实现,即真人在多个回复中,任意对比其中两个,选出更为偏好的一个,为奖励模型提供标注信息实现监督学习。该步也是RLHF中引入人类反馈的关键步骤。
3)反馈优化监督训练后的GPT-3.5
一旦获得奖励模型后,监督训练后GPT-3.5根据奖励模型给出的奖励自动反馈优化模型,最终形成ChatGPT。该步是采用了近端策略优化(proximal policy optimization,PPO)强化学习算法,是实现ChatGPT的核心,也是与其他LSPTM不同的地方。
ChatGPT是一个典型基于平行智能Hanoi(integrated human, artificial, natural, and organizational intelligence)的LSPTM[4, 15-16],构成了人在回路的社会化大闭环(the grand socialization closed-loop of human in the loop)[4]。ChaGPT中各种要素在实际物理空间和虚拟空间基于中心化自主组织及全中心化自主运行(decentralized autonomous organizations and decentralized autonomous operations,DAO)通讯、组织和协调[15],形成了人类、人工、自然和组织智能的有机结合体,是语言智能范式的代表之一[16]。
2.2 ChatGPT的功能
ChatGPT是一款能够以文字方式进行自然对话的人工智能模型,其基本功能如图2所示[8]。可以从事各种复杂的语言工作,如自然对话、自动摘要、文本生成、自动问答等。在自动文本生成方面,ChatGPT能够根据用户要求生成论文、代码、剧本、企划等内容。在自动问答方面,它能够理解用户提出的问题,并给出相应答案。此外,ChatGPT的知识范围广泛,涵盖自然科学、人文社科、社会科学、文体娱乐、奇闻趣事等等领域,同时它还能够掌握用户的语气,正确分析文本情感。ChatGPT出色的自动摘要、文本生成能力在C2中会有出色的表现,例如:作战方案生成、敌方意图分析等等。该部分会在后面详细介绍。
图2ChatGPT的基本功能
Fig.2 Basic functions of ChatGPT
ChatGPT能出色完成上述任务的能力可能源自复杂系统涌现现象。复杂系统涌现现象是指在一个复杂系统中出现的新的特征或行为,这些特征或行为是由系统中各个组成部分相互作用和协同作用产生的,不能被简单地从单个组成部分的行为中预测或解释。复杂系统涌现现象在自然界和人工系统中都广泛存在,例如自然界中的蜂群、蚁群和鸟群等,人工系统中的交通流、股市和互联网等[17]。
在以LSPTM为代表的人工神经网络领域,涌现现象同样存在。总体来说,LSPTM的涌现能力可总结为如下两种表现:1)上下文学习;2)思维链(Chain-of-Thought,CoT),在较小的模型中,上述两种能力是不具备的。
上下文学习是指采用零样本学习(研究人员或用户给出几个示例)就可以使LSPTM在不调整深度神经网络参数的情况下很好地处理研究人员给出的任务。这与根据下游任务微调模型的方式有明显的不同。在上下文学习中,模型参数不变,说明LSPTM在预训练阶段根据基本的自然语言任务已经习得了特定任务的特征,仅需一些示例就可将该能力激发出来。
CoT可视为少样本提示(few shot prompt)推理,即对于某个复杂的问题,研究人员或用户分步给LSPTM展示出具体的分析/推导过程,LSPTM根据展示就可完成一些类似的复杂推理任务。CoT在数学、物理等自然科学等问题中表现良好。
3LSPTM在指挥控制领域的应用场景分析构设计
3.1 C2过程的基本范式及C2过程产品与技术分析
C2是军事体系的关键要素,直接决定战争的胜负。指挥控制活动过程机理存在尺度的关联性[18],战术C2、战役与战略C2有各自的活动过程机理。战术C2以经典理论观察-判断-决策-行动 (observe, orient, decide, act, OODA)环[19]为指导,在宏观战役与战略尺度上,其C2活动以筹划-准备-执行-评估 (planning, readiness, execution, assessment, PREA)环为指导,多尺度C2是军事体系的指挥控制过程的一般机理[20-21]。
多尺度C2过程可描述为多PREA环与OODA环的结合,PREA环负责军事体系C2活动的宏观指导,其C2活动过程从作战筹划、部署准备、执行监控到作战评估与转换活动4个主要环节构成3个反馈闭环,从态势角度,是对态势的谋划设计、部署和评估;OODA环负责军事体系的战术执行的C2活动指导,从态势角度上,是对态势演化的控制,其C2活动从观察、判断、决策到行动4个环节构成一个闭环。
PREA&OODA构成了军事体系各级指挥与控制活动的基本指导,如图3所示。
图3 军事体系C2过程的基本范式:PREA&OODA
Fig. 3 The basic paradigm of the C2 process of the military system: PREA & OODA
军事体系C2过程的基本范式涵盖各域的活动,并伴随相关产品。在物理域,体现为真实战场的各种形态,包括基于历史→未来设计的战场、构建引导的战场、实际的战场以及评估所需要的描述战场;在信息域,主要体现为演绎态势、直前态势、实时态势和复盘态势4种态势所需要的信息产品以及相关技术;在认知域,主要体现为基于意图的周密决策、基于预案的审慎决策、基于规则的快速决策和基于评估效果的转换决策;在社会域,主要体现为政治、经济、文化以及组织形态的相关活动,包括政治、经济、文化策略设计,组织结构关系设计,政治、经济、文化引导及军事组织关系构建,政治、经济、文化及军事组织协同,政治、经济、文化影响评估及组织结构关系效能评估,等等。军事体系C2过程的关键活动、技术与产品如图4所示。
图4 军事体系C2过程的关键活动、技术与产品
Fig. 4Key activities, technologies and products of the C2 process of the military system
3.2 指挥控制领域LSPTM的应用场景分析
在上一节中,C2过程的基本范式描述了C2在物理域、信息域、认知域和社会域的具体活动、技术需求及产品,从ChatGPT-4.0公布的功能看,LSPTM的潜在应用体现在C2活动的全过程和各域。
3.2.1 LSPTM在物理域的应用
在物理域,C2活动与LSPTM一样,需要有物理域的凭借和依托,包括真实的战场环境和支撑C2活动的算力所需要的计算与存储设备。
LSPTM作为通用人工智能工具,在物理域上有大规模计算与存储设备支撑其算力,同样,C2活动在物理域也需要相关的系统与设备支撑,LSPTM对C2活动在物理域的应用主要体现在3个方面:1)通用人工智能进入C2系统,可大幅度减少C2系统对一般算力的设备需求,如LSPTM能提供的翻译、自动对话、文本生成等通用智能都不需要C2系统再配置相应的计算与存储设备,LSPTM的应用为小型无人作战平台、小规模无人集群等轻量级C2智能系统的物理配置提供了条件;2)LSPTM的算力与存储设备的配置与应用,可为C2系统的设计提供借鉴和参考,尤其是跨域联合的大型有人与无人结合的C2系统;3)在战场环境方面,LSPTM可用于构建C2训练环境,支持C2对抗的战场环境从物理状态向描述战场、预测战场和引导战场的持续演化。
3.2.2 LSPTM在信息域的应用
在C2基本范式中,信息域的主要活动包括各类情报产品的获取、处理,历史数据的统计与分析处理,各类传感器数据的获取和融合处理,基于实时数据的预测与预报产品处理,以及行动过程的数据采集及态势复盘信息处理,等等,针对信息域的这些活动及产品技术,LSPTM的潜在应用有正向应用和逆向应用,正向应用以支持C2在信息域的相关活动,主要体现在3个方面:1)信息不完备条件下的推理,如根据动向情报进行关联分析,推理敌方的行动规律;2)信息在大规模条件下的挖掘,如对大数据的分析技术;3)信息在不确定条件下的分析,如情报信息的相互应证分析。相反,对确定的信息、完备的信息以及小规模数据的分析,LSPTM的应用与传统C2系统的相关技术并存在特别的优势,如小尺度的推算与推演、实时态势数据的融合以及行动过程数据采集与复盘技术,等等,在这些方面,传统C2系统仍然存在技术优势。
LSPTM在信息域还有另外一种重要应用,即逆向应用。LSPTM的逆向应用场景包括生成不同模态的虚假内容,包括文本、语音、视频等等,造成以假乱真的信息传播,以欺骗对手,其生成虚拟内容可以是动向情报信息、历史统计数据,也可以是虚拟的预测与预报数据,实时感知数据以及作战行动过程数据,等等。所有这些生成的虚拟数据,可对敌方的认知活动造成干扰,从而影响其决策的正确性或延误其决策时机。
3.2.3 LSPTM在认知域的应用
以ChatGPT为代表的LSPTM已经具备人类无法理解的推理能力。LSPTM在认知域的对抗是最具潜力的应用领域[23],认知战是LSPTM未来的主战场。LSPTM在认知域的潜在应用包括7个方面。
1)意图理解/识别
LSPTM的语言与文本解析功能可用于无人作战系统对有人指挥意图的理解,包括对作战构想的理解、作战命令或作战计划的解析或者作战指令的解码,等等。
另一方面,LSPTM的图形场景分析功能可用于对敌行动意图的识别,如基于作战情况图或作战经过图,识别敌方行动的意图,为指挥员的判断提供支持。
2)基于演绎态势的推理与周密决策技术
LSPTM具备事件关联与逻辑推理能力,这一功能可用于动向情报分析和历史统计数据分析,通过LSPTM的推理分析,从历史构建未来的演绎态势;同时,在构建演绎态势过程中,提出相关的假设;基于假设,提出相应的解决问题方案,即作战构想和作战预案。
3)基于预案匹配的审慎决策技术
在意图识别基础上,LSPTM可进一步支持基于预案匹配的审慎决策。一方面,LSPTM强大的逻辑推理可对态势进行预判,基于预判匹配各类预案,对匹配的预案进行风险和收益评估,为指挥员的决心提供支持。
4)基于实时态势的威胁判断技术
在计划执行的实时对抗过程中,LSPTM的强大计算推理功能可用于支持目标的快速跟踪识别和威胁判断,为不同主体的OODA环提供运行支持。
5)基于规则的快速决策技术
在计划执行的实时对抗过程中,LSPTM的强大算力可支持指挥主体的快速决策,如战术规则的快速匹配,或者实施平行推演,快速组织规则的重建,为不同主体的OODA环提供决策和平行行动的支持。
6)事件的识别与响应技术
当不确定事件发生时,LSPTM的意图理解与识别功能可用于支持事件的响应与处置,包括事件的观察、事件的识别、事件影响的评估,并提供事件处置的方案建议,辅助指挥员的临机决策。
7)基于复盘态势的行动效果评估技术
LSPTM在大(时间)尺度上的记录分析可用于作战过程的数据采集和复盘分析,其模式匹配与识别功能可进行初始态势和当前态势的一致性分析,从而支持指挥主体对作战行动效果的评估分析。
3.2.4 LSPTM在社会域的应用
C2在社会域的活动以解决多主体在任务上的高效协同为目标,其主要活动包括团队文化的宣传与思政教育、C2组织结构的设计以及协同计划的制定和实施等等。
1)组织文化的宣传与思政教育
LSPTM的方案编写、文本与视频制作等功能可用于组织文化的宣传与思政教育,指挥机构的政治工作在确定方案主旨的基础上,可运用LSPTM,根据战场实际情况快速编写宣传方案,并生成相应的文本或视频,进行战地宣传教育。
2)基于任务的团队设计构建以及敌方C2组织结构的识别
LSPTM强大的算力可替代传统团队设计技术,一方面用于己方团队的设计构建,根据作战任务的需求设计科学的团队组织;另一方面,可进行逆向设计,对敌方战场的C2组织进行结构的辨识,从而分析其关键的C2结构和力量。
3)多智能体的自适应编组、协同决策与协同控制技术
LSPTM的通用智能可用于支持群体智能技术,包括多智能体的自适应编组、协同决策与协同控制,如空中无人机群、海上无人集群以及陆上跨域无人作战系统等等,这些无人作战体系在完成复杂作战任务的快速编组与协同,LSPTM可替代传统的智能优化算法。
3.3 LSPTM在C2活动过程应用的潜力比较分析
在C2范式中,LSPTM对C2活动的支持并不均衡,在不同的闭环中有不同的应用潜力,如图5所示。
图5 LSPTM在PREA环的4个阶段运用的潜力比较
Fig. 5 Comparison of the potential applicationof LSPTM in the fourstages of the PREA loop
从图中可以看出,LSPTM应用更多潜力并不在作战计划执行环节的OODA环,而是在PREA环的作战筹划和准备环节,在作战筹划准备环节,其应用包括作战任务分析、作战意图的理解和识别、情报获取和处理分析、态势的预测与预判断、作战构想与作战方案的生成等等,这些应用的背景是战场具有太多的不确定性,存在各种假设,需要进行推演评估生成相应的方案预案,这些问题都是传统智能算法表现不佳或者根本无法解决的问题,只有LSPTM在强大的算力与数据支撑条件下才有可能突破解决。
从3.2节LSPTM在物理域、信息域、认知域与社会域4个域应用分析看,LSPTM的强大功能表现并不在物理域、信息域,而是认知域和社会域,其中认知域对LSPTM的需求最为强烈,究其原因在于认知技术是智能的终极体现,C2在认知域的活动最为关键,同样,对智能技术的支持也最为强烈,过去关于C2系统研发的关键和难点也在认知的辅助功能,包括态势与意图的理解、行动的规划以及辅助决策技术等等。
4C2领域发展的机遇与挑战
马克思主义认为科学技术是军事发展中最活跃、最具革命性的因素,每一次重大科技进步都深刻影响着世界军事发展走向,引发战争形态和作战样式的重大变革。人工智能领域LSPTM的技术突破将带来C2哪些方面的变革?
1)C2对抗形式:从真实战场转向虚拟战场,不战而屈人之兵成为未来战争的常态
LSPTM为虚拟战场的构建与对抗推演提供了条件,冲突双方可在虚拟战场展开C2对抗,既可实现实力的较量,同时又避免现实冲突的损失与伤亡。
2)C2方式:集中筹划与控制
未来战场,中心C2的集中筹划与集中控制将成为未来C2方式,LSPTM强大的算力与智力弥补了过去指挥主体——人的局限性,指挥员的参谋团队逐渐被各种角色的LSPTM替代,战场超强大脑可辅助指挥员实施集中筹划和控制。
3)C2手段:战术C2系统的无人化,中心C2系统实现有人与无人混合智能
LSPTM可替代战术指挥员,战术C2系统将逐渐退出人在回路的闭环,实现OODA环的智能闭环,边缘战术C2实现中心C2指导下的自主行为;同时,传统的中心C2根据角色和内容训练LSPTM,实现机构精简和业务活动的智能转型,实现有人与无人的混合智能。
4)C2技术:从领域细分转向融合通用智能
C2技术领域分布广,从物理域的计算设备,到社会域的网络分析,学科交叉与跨域是C2手段建设的难点所在。LSPTM通用智能可实现跨域技术的融合,未来C2技术将逐步统一至LSPTM的算力与数据。
人工智能时代,C2从对抗形式到技术的变革是未来军事制高点,抢占这一制高点需要加速LSPTM的建设与应用,LSPTM尽管不存在技术上障碍,然而,LSPTM所依赖的其他条件是C2领域未来发展的挑战。
挑战1:LSPTM通用智能发展的挑战。在LSPTM建设应用上,ChatGPT独占鳌头,尽管国内有百度的文心一言、华为的盘古及阿里巴巴的M6等产品,与ChatGPT的智能相比较,还存在较大的差距。
挑战2:LSPTM在C2领域发展的挑战。LSPTM在通用智能上的纵向突破是横向发展基础。军事C2领域的LSPTM需要通用智能的突破,这是基础和前提,国内LSPTM建设在通用智能产品上存在差距,其人机交互体验不尽友好。
挑战3:LSPTM的算力与数据支持。算力与数据是LSPTM发展的基础,在算力上,硬件芯片发展与C2系统的轻量化发展是矛盾对立面,在数据上,LSPTM需要大量的训练标注样本,军事领域的数据与互联网数据不同,存在孤立性、保密性,如何围绕LSPTM建设的需求展开军事领域的数据建设与训练实施,这是挑战之一。
挑战4:LSPTM的应用的伦理与安全。从测试看,ChatGPT已具备一定程度上的自我意识,与ChatGPT的沟通需要掌握对话技艺。LSPTM成熟产品一旦应用于军事C2领域,不可避免带来伦理安全问题。如何应用LSPTM获取未来C2对抗的优势,同时,减小LSPTM应用可能带来的安全风险,LSPTM在军事C2领域的挑战。
5结论与展望
本文以C2活动过程的基本范式为指导,分析了LSPTM在军事C2领域的潜在应用,包括物理域、信息域、认知域和社会域C2活动的主要应用,指挥与控制作为军事力量的关键要素,对人工智能建设的需求最为强烈,因此,LSPTM在指挥与控制领域的潜在应用是广泛的,涵盖了从PREA到OODA的全过程、多尺度。从应用场景分析看,LSPTM的关键作用突显在基本范式的“筹划准备”环节,大量的态势认知、研判、意图理解与任务规划等活动都是LSPTM应用的典型场景,从C2 4个域的维度分析看,最具潜力的运用在认知域,LSPTM可以成为C2主体认知活动理想的工具和手段。
C2领域LSPTM的建设既是机遇,同样也面临挑战。在机遇上,可以通过LSPTM的建设,弥补常规武器装备建设上的差距,以智能优势弥补装备技术劣势;在挑战上,需要解决LSPTM在C2领域的算力支持、领域数据与训练支持以及LSPTM运用带来的伦理安全等问题。这些问题是本课题研究的未来方向。
-
神经网络
+关注
关注
42文章
4771浏览量
100766 -
人工智能
+关注
关注
1791文章
47279浏览量
238493 -
数学模型
+关注
关注
0文章
83浏览量
11935
原文标题:超大预训练模型在指挥控制领域的应用与挑战
文章出处:【微信号:AI智胜未来,微信公众号:AI智胜未来】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论