如何从第一性原理看大模型Agent技术原理

随着大规模模型技术的兴起，我们正处于一个崭新的智能时代的黎明。我们有一个大胆的预测，未来的5到10年将可能带来一场大变局：99%的开发、设计和文字工作将被AI接管。这不仅仅是一个想象，而是对未来可能趋势的深思熟虑。

在互联网时代，我们目睹了大量网站的崛起，成为互联网时代的原生应用的主要载体，这个时代有了 Web 相关的新技术，这些技术承载着 Google、Facebook、Twitter 等互联网明星企业的崛起。进入移动互联网时代，App 成为了主要载体，它们占据了整个移动互联网时代人们注意力的中心。然而，当我们进入智能时代，开始思考：什么将会成为这个时代的核心载体？我们预测可能不再是 App，也不再是网站，而是 Agent，也许几年后的现实才能给出答案，但历史告诉我们一个新鲜事物的演进总会找到一个稳定的术语来概括这个载体，而今天我们看到 Agent 最具有这个潜力。

对于这个猜想，随着我们后面讲的越来越深入，大家可能体会也会越来越深，因为它可能抓住的一些智能时代一个非常本质性的东西，基于大模型把 Agent 的能力推高到了一个全新的水平，这个在学术界研究了几十年的全新物种才开始走入人类舞台的中央。在范式上我们也在思考是什么样的底层技术和架构会驱动 Agent 技术的快速发展，从现在的趋势来看，我们觉得在人类的智能原理处于核心地位的面向目标架构很可能会成为驱动这个 Agent 技术发展的主要范式。

而且现在全球对Agent的关注也是非常狂热的，几个月前，OpenAI 在内部就开始高度关注智能体（Agent）领域，Deep Mind的联合创始人最近也提到下一代 AI 技术走向并非是生成性 AI，而应该是交互性 AI。这种交互性 AI 在很大程度上类似我们今天提到的智能体，用户要求完成各种任务，智能体则可以对软件进行操作或者与人进行协作，完成相关的工作。

希望这些想法可以帮助大家在战略层面或者是产品和技术层面得到一个很好的思考框架，能够在各自的领域去推演未来。

导读

走马观花、抛砖引玉

整个 PPT 一百多页，内容繁杂。我给大家做一个简单的导读，主要还是梳理脉络，提出思考的框架和基点，起到抛砖引玉的作用，其中涉及的很多细节部分我们并没有做得非常细致。期望大家在看完这个分享之后，对智能体技术有一个新的认知，并能应用在你们自己的研究方向或者职业规划上。

我们将整个内容分为四个部分：首先，会对从大模型到现在的智能体的技术发展做一个串讲；接着，介绍通用智能原理和面向目标架构这个两个根本性问题；最后，基于这两个原理，分析现在的智能体架构仍存在的缺陷，以及未来可能的发展方向。

1. LLM Agents综述

如果你一直关注 AI 领域，你应该能看到一个清晰的技术脉络，一开始大家玩 Prompt 工程，接着是Prompt Chain或Flow，再到Agent，多Agent，很清晰的一个脉络架构，我们也会沿着这个脉络给大家分享相关的经典工作。

我们回到 Agent 这个概念上，实际上，人类是这个星球上最强大的 Agent。Agent是一个能感知并自主地采取行动的实体，这里的自主性极其关键，Agent要能够实现设定的目标，其中包括具备学习和获取知识的能力以提高自身性能。

Agent 的复杂程度各不相同，一个简单的恒温器可以是一个 Agent，一个大型的国家或者一个生物群体也可能是个 Agent。感知环境、自主决策、具备行动能力，设定明确的目标和任务，适应环境及学习能力，都是 Agent 的关键特点。

Agent 这一概念的起源并不明确，可以是学术界逐渐发展沉淀而来，但是我们可以考虑马文·明斯基80年代《智能社会》这本书中在人工智能领域发扬光大了这个概念。Agent 理论在大模型时代之前已经被学术界研究了很多年，甚至是汗牛充栋，许多理论研究都试图创造出具有人类智能水平的 Agent。然而，在大模型出现之前，Agent 的技术始终面对天花板限制，无法取得实用的进步，它的本质问题还是AGI问题，反过来说，只有AGI的技术进步才能让 Agent 技术进步。

在学术领域，最经典的案例可能是与机器人相关的研究，都涉及到了Agent 技术。在大模型时代之前，比较知名的垂直领域 Agent 的例子比如 Alphago，它有感知环境、做决策、采取行动的闭环，当时的主要研究方向还有使用强化学习打游戏的DeepMind的Agent57，后来更加通用的Gato，还有OpenAI玩“躲猫猫”的多智能体。

我们认为Agent技术是未来实现社会全面自动化的关键技术。在大模型出现之前，自动化更多的是一些偏结构化固定模式环境中通过实现固定算法流程来完成自动化任务，而大模型智能体的通用性带来了灵活性，使其可能应对人类在脑力劳动中面临的各种复杂长尾任务，进一步实现体力和脑力任务的全面自动化。

大模型和Agent技术开启了全面自动化的新时代。大模型是第一个可以自主学习并拥有广泛知识的模型，所以在大模型时代，Agent技术开始迅速发展。今天，我们可能只是在起点，我们看到的Agent还偏向于玩具，但是预计在未来几年，这个领域将产生极大的改变，它的发展速度可能会超越我们的想象，因为我们现在看到改进每天都在发生，天花板远未来到，甚至天花板可能不会再来了。

1.1 Prompt工程

在大模型刚出来的时候，大家都喜欢做的事就是Prompt工程，把大模型当成一种编程语言来看待。人们通过描述角色技能、任务关键词、任务目标及任务背景，告知大模型需要输出的格式，并调用大模型进行输出。这种方法就是经典的把大模型当做工具来调用，我们可以称为工具模式。

为此，大家也发展了各种各样的Prompt工程的玩法，如角色扮演、零样本提示和少样本提示。比如一个澳大利亚少年编写了一个15000个字符的提示词，成功地让他变身为人类的导师，教授各种知识。这种方式就像能直接构建软件一样，是我们将Prompt工程发挥到极致的一个经典案例。

https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor

1.2 Prompt外挂

仅凭Prompt工程根本无法满足人们日益增长的大模型需要，鉴于大模型本身的诸多缺陷，如不能及时更新知识，上下文有限等等，人们开始给大模型加入插件，如引入向量数据库，把数据索引进向量数据库，再召回数据，再提交给大模型做Prompt工程，这样就可以使用最新的知识和比大模型里的知识更准确的知识。

这些还不够，人们又开启了外挂模式，尝试让 GPT 调用函数和使用工具，一系列关于工具使用的实践开始出现，ChatGPT也推出了插件体系。当人们发现大模型的推理能力很差时，开始试图让模型自身清楚地描述问题，把问题转化为 PDDL （Planning Domain Definition Language）格式的描述语言，通过调用通用规划器来解决规划问题，再把解决方案转化为可执行的动作，以更好地逻辑推理和规划等任务。

更加经典的外挂形式当然是让大模型调用外部工具了，OpenAI也搞出了ChatGPT Plugins的开放体系，这些今天回头看都是非常顺理成章的形式，ChatGPT的爆发激发了全世界大量的Idea，这些创新很快就被OpenAI吸纳进产品迭代中。

此外，大模型虽然具备一定的推理能力和思考能力，在很多推理任务上依然力不从心，能不能让模型自己不做规划推理，让他把问题描述清楚，转化成一个 PDDL 的一个关于规划描述的语言，然后使用通用的规划器去做规划，再转化成动作执行，这就把大模型作为一个中转器，把规划器当做了一个外挂。

我们可能会思考，大模型或许真的就是我们以前想象的那样，会达到人类智慧水平的普适性机器么？显然从各项评测来看还有很多任务做不到，更何况这些任务评测本身的覆盖度也不够完备。

有一个经典概念被誉为"通用任务解决器"，在达特茅斯会议之后得名“GPS”，即General Problem Solver。这是由赫伯特·西蒙（Herbert Simon）和艾伦·纽维尔（Allen Newell）在早期提出的概念，他们尝试寻找可用于解决数学问题的通用解决方案。这套理念其实很简洁，可以看作是早期的面向目标架构。它的主要内容是将目标状态列出，然后在解空间中搜索可以将初始状态转化为目标状态的操作组合，这样的组合便是问题的答案。

1.3 分解与组合

然而，目前我们发现，在通用人工智能（AGI）的漫长旅途中，大模型虽显强大，仍存在着显著的技术天花板。许多人开始探索如何挖掘大模型在大任务执行能力上的可能性，其中一个基本策略就是能够分解和组合。例如，经典的 MapReduce 模式可以将一个大型文本进行摘要，因为它的上下文有限，一种解决办法是扩大 context 的范围。另一个解决方案是，在有限的 context 中，我们先将文本拆分成小片段，对每个片段进行摘要，然后再将其组合，从而得出结果。

大家也发现大模型直接给出答案似乎并不靠谱，那么是否可以让它像人类一样，一步一步思考呢？毕竟，人类在解决问题时，也是逐渐构建解决方案，而并非立即给出答案。因此，开始出现了一系列的尝试解法，比如思维链、多思维链、思维树和思维图等。

我们一一讲解，首先是思维链（Chain of Thought，CoT），它要求模型展示其思考过程，而非仅给出答案。这可以通过两种方式实现，一种是具体说明，即要求模型详细地、一步步地思考；另一种是示例说明，即通过给定问题和答案的同时，提供思考过程。这样，当询问模型时，模型会模仿此过程，逐渐思考并给出答案。再往后，我们发现一个CoT有时可能出现错误，然后开始尝试让它发散，尝试多种思路来解决问题，然后投票选择最佳答案，这就是CoT-SC了。

在这过程中，我们发现，这种发散的方法也有局限性，例如24点问题，它不能很好地解决，那么我们就会尝试把这个问题进行垂直分解，分成三步来做，每一步分解成多个子问题，类似于动态规划的做法，就好像把一个大任务拆解成了三个小的子任务，然后再一步一步地去实现它。

这就是思维树（ToT， Tree of Thought）的一个主要思路，它会根据当前的问题分解出多个可能，然后每一个树节点就是父节点的一个子问题，逐层扩散，遍布整个解空间，一些节点就直接会发现不合适而终止掉，达到了有效剪枝的作用。然而 ToT 的方式也存在问题，对于一些需要分解后再整合的问题，比如排序问题，排序你可能需要分解和排序，然后再merge，就不行了。

为了解决这个问题，一种名为思维图（Graph of Tree，GoT）的方法被提出。这种思维图既可以分解，也可以合并。

9月26日，清华姚期智团队又提出了更新的方法——累计推理，在24点问题上成功率已经达到98%的SOTA。他们方式很接近主流 Agent 的实现方式，具备一定的通用性。它首先会提出一个初步的想法，然后再对这个想法进行验证，看这个提案是否合适。如果提案合适，就将它添加到图的下一个节点，每一步都基于已经建立的图节点进行下一个思考节点的创建，这样发散、合并或删除直到达到最终目标状态，完备性和灵活性大大增强。

1.4 反馈

上述的讨论主要是任务分解和组合，他们尽管强大，却不能与外界进行互动，这就不得不讲到反馈机制了。反馈是整个控制论的基石，也是动物体从诞生之初就具备的基本能力。

最经典的方法实际就是 ReACT，这个方法非常经典，基本把智能体最核心的能力圈出来了，当然它也有它的缺陷，我们将在后面讨论为什么还会有 Agent 更多的复杂技术以克服它的不足。ReACT让大模型先进行思考，思考完再进行行动，然后根据行动的结果再进行观察，再进行思考，这样一步一步循环下去。这种行为模式基本上就是人类这样的智能体主要模式。

比如，询问一个关于科罗拉多造山带的相关问题，它就会去通过搜索工具进行搜索，如果搜索结果没有提到东部地区，它会继续搜索东部地区的数据，然后继续一步一步地思考，根据结果反复思考，直到完成这一项任务。

ChatGPT的代码解释器主要采用的就是这种模式。首先，代码解释器能够与用户进行简单的互动，如用户的问侧和解释器的回应。当用户的问题需要外部调用时，例如询问天气情况，解释器会生成相应的代码，利用代码调用外部工具获取结果。基于这些结果，代码解释器会将信息反馈给用户，如“今天天气很好”。下图是，我们调研的ChatGPT Code Interpreter 的主要实现方式。

然而，我们始终觉得这样仍然不够，我们希望大模型在完成每一个任务后，能够积累经验，故而产生了借鉴强化学习思路的"反射"机制。反射机制能够让机器记住每一次任务的完成情况，无论效果好坏，以供未来参考，提升模型的性能。

Agent的框架都会让模型输出JSON进行函数调用，OpenAI也就推出了Funtion Calling，将外部调用内化到模型中，变成了一种原生能力。

考虑到前面说的ReACT和Reflection这些不彻底性，更大的变革轰然袭来，这就是Agent，今天4月AutoGPT横空出世，短短数周Star数就超过PyTorch达到90k，赚足了眼球。

1.5 Agent

今天，全世界都在关注这个领域，Agent 模式的研究和应用都在迅猛发展，作为一个"共识"可预见的未来该技术的进步将势不可挡。AutoGPT模型刚在10月15日宣布获得1200万美金的资金支持，也小道消息称OpenAI将在11月份发布面向 Agent 的原生模型和规范。百度在发布"文心一言4.0"时也表示，他们考虑在升级系统时重点考虑了系统2的能力，这也是Agent 模式的关键设计。

下图是AutoGPT 发布的进行中的架构图，旨在实现对任务的有效管理。生成的任务将会被加入优先级队列中，随后系统会不断从优先队列中选择优先级最高的任务进行执行，整个过程中，任何反馈都会通过记忆进行迭代优化代码。

这个主要框架虽然相对简单，但其设计理念具有重要意义。首先，创建一个初始的计划，然后进入主循环。系统会让模型判断在当前计划下该进行何种行动，接着会执行行动。执行完毕后，结果会写入下一次循环中。如此，每次决策都会基于之前的结果、记忆和计划，从而制定出新的行动方案。

在该框架中，模型的决策过程涉及到动作选择，这也是主要的功能之一。此外，整个过程中我们主要关注的一些工具包括“Start Another Agent”以及“Task Complete”。这两个工具体现了Agent可以被调用，从而将大任务拆解为若干小任务进行处理，继而形成层次化的树状结构，这种结构与人类分工和协作的工作方式极为相似。

值得一提的是，微软的贾维斯 (Jarvis)一个深度学习任务调度系统，也采用了类似思想。他们主要关注如何调用模型来执行各种深度学习任务，涉及到了先做计划，再选择模型，然后执行任务，获取反馈，然后进入下一轮循环等环节。

有的研究者会尝试使用大模型写小说，借鉴LSTM这个经典深度网络的思想发明RecurrentGPT，还引入了长时记忆和短时记忆机制，使模型拥有了更佳的记忆和学习功能。

其他方向，我们看到把大模型视作一个虚拟世界中的智能体，如MineCraft游戏中所设定的角色。这个角色可以沿着指定的路线，完成一些在环境中探索的任务，如建房子、挖矿、打怪等。这个角色首先需要被告知怎样去执行任务，例如自动训练课程计划的使用。然后逐步的完成任务，形成自己的执行代码库、技能库等，这样就算是在以后遇到相似的任务，它都能快速调用已有的技能和经验来完成任务。某种意义上，这就是一种强化学习的方式。

这个方向的变化真的是一日千里，就在昨天，清华联合面壁发布了XAgent，提出了双循环机制在效果上碾压了AutoGPT。这种机制中，外循环负责宏观规划，而内循环则负责细节的执行。

双循环模式

在完成各类任务的时候，它的能力也大大胜过 GPT 4。这里需要解释一下，研究者为什么把 GPT 4 和 Agent 进行对比，看起来GPT 4只是 Agent 的一个组件，自行车的轮子怎么能和自行车对比呢？这是因为从任务完成的视角看，GPT-4也是一种Agent，Agent的概念是大模型的超集，这也是为什么我们说智能时代的核心载体是 Agent 而不是大模型的原因，这个事物的发展形态终将会走到一个最稳定的形态，这个形态目前看只有 Agent 最配这个颜值担当。当能不大众所接受的对等 Agent 含义的词汇可能还在发明中，至少目前看伙伴、助手这些命名的水平都不够高，让我们拭目以待。

1.6 Multi-Agent

进一步，人们很自然地想到了多智能体（Multi-agent）模式， "斯坦福小镇"开了一个好头。在这个虚拟的小镇里，每个角色都是一个单独的智能体，每天依据制定的计划按照设定的角色去活动和做事情，当他们相遇并交谈时，他们的交谈内容会被存储在记忆数据库中，并在第二天的活动计划中被回忆和引用，这一过程中就能涌现出许多颇有趣味性的社会学现象，我们成为群体智能的涌现。

再看今年7月份，一个被命名为MetaGPT的项目引起了广泛关注，这个项目中定义了产品经理、架构师、项目管理员、工程师和质量保证等角色，各角色之间通过相互协作，基本可以胜任完成500行左右代码的小工程了。

很简单的一个实现就能够完成500行，后续改进后，是否有可能完成5000行或者是5万行代码的项目呢？譬如前两天微软刚发布的 Code Plan 项目已经开始尝试实施大型工程的改造计划。

Meta GPT 最有价值的思想是借鉴人类社会中的协作方式，尤其是SOP，之于Agent 设计则平平无奇，也包括观察、思考、状态管理、任务行动以及结果反馈等等必备组件。

同样的思路，清华开发了一个名为ChatDev的系统，进一步引入了CEO等角色，这里就不再展开描述。

值得一提的是，Agent 的应用方向其实非常广泛。比如 RPA 公司实在智能把 Agent 用于他们的产品调用常见桌面软件，如淘宝网、钉钉，来自动完成桌面任务。

而任何一个 Agent 的实现，似乎共性都挺多，都需要有长短时记忆能力、工具使用能力、通信能力，甚至包括 SOP 的能力，自然而言就有人要做这样的框架了，如 agents。

1.7 简单的难题

尽管 GPT-4 等模型非常强大、Agent的发展似乎牛气冲天，它们仍然无法满足很多任务的需要，甚至一些在我们看来很简单的任务都完成不了，比如我们构造的这个任务：

给小学生展示一下两数相加的每一步计算过程，如1135 + 78
答：计算详细过程如下
5+8=13， 进位1
3+7+1=11， 进位1
一个数已经加完，剩余数11 + 1 = 12
结果为：1211
下面请列出以下两数的详细计算过程：
81728738271872871871672 + 28781729836746721

我们必须明白，尽管AI在一定程度上模仿了人脑的工作方式，但实际上，机器人和人脑在处理信息时采用的策略有很大的不同。因此，即使在未来，我们也需要继续改进 AI 框架，以解决这种差距。比如一个百万位数的加法任务，GPT-4囿于token数的限制是不可能完成这个任务的，但人类缺可以，这恰是人类和AI需要弥补的Gap。我们进行了一些简单的试验，还没有发现大模型和Agent能搞定这个任务。其中，ChatGPT4的Code Interpreter是表现最好的，因为它调用了外部计算器，但中间的过程描述还是发生了错误。如果你能做出来这个小作业，欢迎联系我。

至此，我们已经讲述了大模型到 Agent 的发展历程。接下来的时间，我们将从人类智能的视角，结合面向目标架构的理念，分析 Agent 技术的本质、存在的缺陷以及未来可能的发展方向。

2. 通用智能基本原理

首先我们来看看这个众人熟知的认知飞轮，感知、认知、决策、行动，今天的人工智能代理更像是基于这个认知飞龙构建的。但是从本质上，人类智能远比这复杂。

在漫长的进化历史中，生物神经网络从简单的条件反射逐渐进化到今天的主动预测，我们已经可以在大脑中构建世界模型，进行强大的推理和分析。看似繁杂的过程，实际上都发生在核心的架构上，并且逐步完善。无论是工作记忆，还是人类处理语言的能力的诞生，这些都是智能的必不可少的元素，尤其是符号能力，对人类智能的发展有着不可替代的作用。

因此，让我们先提出一个更为宏观的问题，智能究竟是什么？我强烈推荐这本名为《预测算法》的书，它在20年发表，那一年，GPT 3也刚刚问世，我在阅读之后，就有这样一个感觉：生成模型是战略正确的。在之前关于AGI的分享中，也提到过这个观点，智能是通过预测来解决应对世界的不确定性的，分享视频参见这里https://www.bilibili.com/video/BV16h4y1w79A/

让我们深入理解一下模拟的概念，当一个低等动物接触到外界的刺激，它会收缩来逃避潜在的风险。这其实是一种模拟，只不过这个模拟反射神经元对有些过于反应敏锐，它假设所有的刺激都是潜在的危险。然而，对于人类来说，我们的模拟则更为精细。我们对世界进行建模，把世界以实体、关系、属性描绘出来。然而，这也是我们认知的极限，我们只能理解一个对象化的世界，非对象化的世界我们无法理解。比如，当我们探索量子的时候，我们还常常用对事物进行对象化的方式去理解，但是发现我们的理解力有时候是有限的，因为量子世界的真相超出了人类认知能力的范围，我们智能使用低维空间的投影去推断它，就像我们无法在三维世界去想象十一维世界的样子。

在过去的四十年里，科学家对认知架构有很多深入的研究，并尝试据此研发出通用人工智能，但天地不仁以万物为刍狗，当前来看只有GPT系列模型距离实现通用人工智能最近，当然这些认知理论依然具有巨大的参考和指导意义。

深入地聊认知架构和智能原理之前，我们必须要聊的是绕不开的《思考快与慢》，这是一本畅销书，其后面的学术道理也十分受用。大脑中的系统1和系统2是我们所有人都熟知的，尽管在实际实现中，系统2可能由系统1涌现，但至少在表现上，我们的大脑看起来有两个系统，系统1和系统2，分别负责不同的功能。知识和情感的快速反应被称为系统1，而逻辑性强、思考速度慢的反应被称为系统2。

接下来我们看看这些认知架构中‍，有一个叫做GWT(Global Workspace Theory，全局工作空间理论)，如下图所示：

全局工作空间理论（GWT）是认知科学家伯纳德·巴尔斯（Bernard Baars）和斯坦·富兰克林（Stan Franklin）在20世纪80年代后期提出的一种意识思维框架。它被开发出来，以定性地解释一系列有意识和无意识过程之间的匹配。GWT在建模意识和高级认知方面具有影响力，认为它们是从广泛、并行的神经过程中信息的竞争和集成流动中产生的。

系统1涵盖了神经网络的外围连接，涉及长期记忆、价值系统、感知运动控制相关的神经网络，系统2则是一个高度集中的“舞台”，人类的有意识思考，如做数学题时，脑中想象数字相加的过程，都在这个舞台上进行。这个舞台叫全局工作空间，记忆在这个舞台上被拉进来加工，然后被扔出去。LIDA (Learning Intelligent Distribution Agent) 受到多种计算范例的启发，并且实现了GWT。认知模块包括知觉关联记忆，情景记忆，意识，程序性记忆和行动选择。由 LIDA 架构控制的认知机器人和软件代理将能够进行多种学习机制。

其实在大模型Agent技术出现之前，人们就已经意识到，试图集成各种深度学习模型以实现人工普遍智能（AGI）并不够，还需要更高层次的认知模型。Lecun在思考AGI时对大模型的出现也提出过意见，它认为世界模型才是关键，但前两天新的研究却认为大模型中有世界模型。但毫无疑问的一点是，世界模型对于我们对世界的认知是非常关键的，无论大模型中是否包含世界的认知，Agent都必须对世界有准确的理解才能做出正确的决策。当模型不能正确运行时，决策就会出错；只有当世界模型构建的正确，才能选择正确的模型，进而做出正确的决策。

总结一下，系统2包含意识、思考、符号主义、逻辑推理图灵、机制结构化和模型。而系统1包含快速思考、神经网络连接主义、长期记忆、深度学习、亚符号、潜意识和非结构化数据。在构建 Agent 时，可以参考这两种系统的思维框架。在理解智能架构的概念时，我们需要从记忆空间、符号系统、世界模型构建与加工三个方向去考虑。记忆空间是基础，符号系统是思考和推理的核心，而世界模型的构建和加工则是其中最重要的环节。在现在的大模型中，如 GPT，虽然很多人认为它没有符号系统，但我们认为，其内部的注意力机制可能已经在激活流转过程中模拟了世界模型的加工过程，只是这个过程并不显式，而且无法控制，只能通过Prompt工程引导它进行，但它会经常跑偏。

我们通过学习掌握了对世界的知识，并针对感知数据尝试在符号系统中构建世界模型，进行预测和行动。如弹钢琴这样的行动，我们需要通过反复训练，逐渐将运动序列内化，变成肌肉记忆和反射。这些在系统2中反复出现的行为，会逐渐沉淀到系统1中。这个过程可以理解为一个“快捷通道”的形成过程，称为Shortcut。

人的视觉识别过程是一个层次性的关系，从最初级的视觉皮层一直到更高级的皮层，从简单的视觉边缘特征到线条的方向性，再到线条之间的组合，如角等更高维特征的形成，直到形成物体的感知。这些物体的概念再对应符号系统和自然语言的绑定，当图像信息经过解码过程进入符号系统后，我们的关联记忆会帮助我们召回数字等语义概念。

以人类做加法为例，假设我们要解决“219 + 13”的问题，这个过程可能会遇到一个看似相同的图形，比如图中有"13"和"B"的歧义。这就打破了现在很多人的想法，通常我们喜欢做前向过程，先使用一个视觉模型处理输入，然后再将其输出传递给大模型进行处理。实际上，人在理解这个场景时是一个双向过程，首先有一些直觉的特征传入到系统2，系统2会推断这是一个做加法任务，并将看似“B”的图形解释为13，这个过程称为Projection。例如，我们经常从一些像素点中识别出人脸，这就是由上至下的功效发挥作用，这是对未来人工智能代理（Agent）的一种启发。

另一个关键的能力是关联记忆。当我们开始观察某个物体时，比如进行加法操作时，我们的大脑并不会以固定模式运作。相反，我们的神经网络会并行运行，有的神经网络开始将加法的概念、数字的概念以及加法规则等各种信息激活，所有这些信息都会基于一个关联网络唤醒出来，这样我们就可以开始下一步的工作。接下来就是所谓的结构推理，我们会开始将这些符号结构化，例如，如果它是一个三位数，我们就会开始理解它的每一位构成整体和部分之间的关系。

当我们已经理解到219 + 13是加法时，我们也会执行Structure Inference得到结构的认知A+B=C的两位数加法结构，并将219和A对应上，13和B对应上，这个过程就是Variable Binding了，我们将具体的实例与它的角色对应上了。

接着我们要遵循加法规则进行运算以实现我们的目标——完成加法任务。根据我们打算完成的目标以及现在的状态，我们需要规划出达成目标所需要的具体步骤，即执行加法规则。进入到这样一个循环过程之中，我们会额外提到两个概念，即"Shortcut"和"Exception"。

那么什么是Shortcut呢？当我们初次开始书写数字时，速度往往很慢，但随着练习，我们将逐渐写得越来越快。这个过程实际上包含了一个叫做“Recoding”的过程，我们会将熟悉的操作或流程用神经元重新表示，这样就把一个复杂的操作简化为了一个子任务，通过类似于传参的方式控制一个子神经网络完成任务。比如开车，一开始，每个动作都需要集中注意力，严重依赖系统2，但是开了一段时间之后，就可以自如地进行了，这就是因为系统2的控制能力已经被沉淀到了系统1里面，称为Shortcut。

另一个重要的方面是异常处理能力，人类最强大的能力就是能够随时应对异常。譬如，你在走路时突然被绊了一跤，你首先需要应对的就是摔倒这个状况，然后再回到原来的路线上继续走。

因此，在执行加法过程中，并不是由于一个细节被中断或遇到各种异常，才开始执行加法。我们会发现，在遇到各种问题时，我们总是会奔着目标勇往直前。人是一个运作着面向目标架构的复杂过程。面向目标架构是人类智能的一个核心机制，当然并不是唯一的。有时，我们也会没有具体的目标或者说目标不是显式的，比如citywalking，同时有一些底层的目标机制，诸如生存，这说明人的面向目标架构要复杂许多。这就是我们不得不说的智能核心的面向目标架构

3. 面向目标架构

我们的情绪系统其实也在解决目标问题，例如，你会因为目标无法达成而生气，因为目标可能无法达成焦虑，因为别阻碍你的目标而愤怒。显而易见，许多情绪都与目标机制有所关联。因此，这套面向目标的机制在人的智能运作中占有极其核心的地位。

让我们通过一个简单的模型来描述该机制。首先，我们需要对这个世界有理解，因此我们会在脑中构建一个关于世界的模型。这个模型在结构化之后，就会变成了当前世界状态。而我们的目标是对应的一个目标世界状态。因此，人类就是在不停地消除当前状态和目标状态之间的差异，这个消除的过程就是目标驱动的过程。

在目标驱动的过程中，你开始尝试去解决这个问题，消除这个差异，你也可能有现成的解决方案，直接动用已有的解决方案执行已知的运动序列，也可能需要进行一定的思考，做出推理分析帮助你解决问题。

一旦你找到了一些执行序列，这些序列可能会变成一个子序列，子序列里有子目标。每个子目标的执行有可能是直接完成的，也可能需要进一步思考才能完成。正如我们可以看到，GPS这段代码就是在为了达成某一个目标而工作，它会遍历所有的目标，尝试让每一个目标都能够达成，一旦达成就结束。有兴趣的同学可以读一下这个代码，就是做暴力遍历找出达到目标状态的操作序列。‍‍‍‍‍‍‍‍‍‍‍‍‍‍

不过，像GPS这种理想的解决方案在现实世界中可能并不奏效，因为真实世界的解空间过于庞大，想想AlphaGo的故事就理解了，这也是为什么虽然此想法在理论上看起来很好，但在实际操作时却无法实施。

但这种思考很有启发，在Newell和Simon1972年出版的《Human Problem Solving》一书中，他们研究了人类如何解决问题，并意识到我们经常进行手段-目的分析(means-ends)

举一个例子：

"我想把儿子送到幼儿园。我现在的状态和我想要的状态之间有什么区别？其中一个是距离。

是什么因素会改变距离？我的汽车。可是我的汽车坏了。要让它工作需要什么？一个新电池。

哪里能买到新电池？汽车修理店。我想让修理店为我安装一个新电池，但店里不知道我需要一个新电池。问题出在哪里？是沟通的问题。什么能让沟通变得容易？一部电话……以此类推。"

在计算机领域，有很多方法都与目标机制相关。例如，过程描述语言（PDL）就是一种经典的方法，主要用于解决机器人问题。我们可以描述世界上的对象，它们当前的状态是怎样的，目标状态是怎样的，有哪些可以采取的操作，然后我们可以基于这些操作，使用规划器寻找一个合适的运动序列来解决问题。

但在今天计算机领域的工程实践中，人们更多采用的是面向过程架构，无论是接口、函数、UI界面，还是组件，又或者是一个应用程序，都是以接口的形式存在的。而这个接口实质上是一种被调用的子流程，借此过程的完成，我们希望执行结果符合我们的预期，但程序并不为结果负责。它解决的是过程和流程问题，系统内没有目标的概念。

当然，也存在一些以目标导向为核心理念的的软件工程，例如声明式编程，它只需要你描述你想要什么，而无需关心执行的过程，像HTML和SQL便是其经典例子。在这样的架构下，程序能够自行寻找达成目标的方法。

然而问题在于，这种面向目标的架构只能应用于垂直领域，而无法普遍应用到所有领域，只有在特定的领域内才能发挥作用，这就限制了它的应用范围。

总的来说，尽管面向目标架构在计算机领域有一席之地，但由于其只能在特定领域发挥作用，而无法解决所有领域的问题，因此它的应用还是有所限制，更多出现在特定的DSL（领域特定语言）中，这种架构的确也发挥了巨大的作用。在软件工程的范式迁移中，我们发现面向过程架构与面向目标架构之间的重要区别点：随着人类的生产方式的变化，软件工程可能正逐步演化为智能体工程(Agent Engineering)；以前我们主导的生产方式是人类处于中心位，AI做辅助。而未来可能会变成以 AI 为中心，人类变为辅助。由此，整个产品形态和平台的构成可能会发生这样的转变。

在这一转变中，原本由人类主导的功能开发，逐渐演变为以智能体为主要驱动力。传统的用户界面，由于其垂直的任务层级架构，每一层都需要人类逐一生成，未来这个过程可能会被智能体自主生成并改良。此外，原本只能解决有限范围的任务，未来的架构则可以解决无限域的任务。就如同头条这样的平台，它是一个信息的分发平台。那么，是否会出现新的平台模式？比如一种知识和世界模型的分发平台。以前我们只能处理大量长尾数据，在未来可能能解决大量长尾任务。以前是廉价的规模化加昂贵的个性化，以后是廉价的规模化的个性化。

4. 前瞻性分析

根据上面的分析，我们能看到 Agent 技术在未来的发展还有很大的提升空间。我认为，这些提升主要可以从几个方向开始，包括引入中央执行机构、学习能力、输入感知、输出执行、世界模型和记忆等几个方面。这些构成因素是完备非正交的，都对提升 AI 技术至关重要。

4.1 Central Executive

首先，中央执行机构，这是一个核心的概念，但常常被人们忽视。现在的 Agent 只是一个规划器，它负责做规划。但实际上，这个流程中还存在很多未明确的问题，比如，是否存在一个内部加工过程，以及这个过程是否透明可控等。一种可能的解决办法是，将内部加工过程外部化，用系统2包裹起来，使每一步细粒度的思考都可以展现出来。

其次是世界模型，现在的大模型只能输入语言，显然这样是不够的，进一步理解世界需要多模态输入。这是我们在未来需要处理的关键问题。同样地，对于时间和自身的身体运动控制的认知也需要能够输入到大模型里面去。我们观察到，无论是自动驾驶汽车、大模型Agent，还是其他的诸多智能体模型，都已经在应用这种面向目标的架构。目前的挑战在于如何在细节上加以改进，如找出此架构未能完成某些任务的原因，以及这些缺陷是源于大模型底层的子任务能力不足，还是需要对框架本身做出改进，比如增加更多的思考层次，或加入更多的内部推演等。

另一个重要的问题是宏观注意力。由于大模型的上下文限制，是否可以让模型自身主动去探索外部世界，将其精力和注意力主动地投入到解答某些具有目标性的问题上去，实现主动的注意力机制？这不仅涉及到搜索和尝试的问题，如针对一些无法思考出解决方案的情况，模型应如何去进行尝试，而且这些尝试何时能够带来进步，以及如何去寻找更为优秀的解决空间，进行推理和规划。

4.2 Memory

值得注意的是，数学和逻辑学习也会涉及到上述问题，比如人类在很多情况下不擅长规划，那么我们是否可以利用网络和记忆机制来实现规划的功能？这其中就涉及到记忆的内化，也就是把大模型从外部世界获取的经验转化为内部参数，或者说把这些经验转化为内存。

目前，我们依赖的记忆机制主要是把所有的信息存储在历史记录里，然后在需要的时候进行召回。然而，这些信息并未经过整理，在一些试图整理记忆的尝试中，我们发现人类是具有这种能力的。人类在获得大量相关的知识后，不会简单地把它们堆积在脑中，因为人的神经元存储空间是有限的。相反，人脑会通过海马体进行整理，而在我们做梦时，大脑会重新构造这些相关的知识，使得记忆网络变得有序。

然而，现在我们怎么去实现这种能力？目前还未见到具有遗忘功能的模型，也就是删掉一些垃圾信息或错误的信息。在大模型训练过程中，产生了许多无用甚至是错误的信息，而我们在工作中只是采用了许多方式来规避这些错误的信息，但为什么不试图去删掉它们呢？如果能够将这些信息替换为有价值的信息，那将是一件有价值的事。我注意到在人工智能领域中，对于长短时记忆与工作记忆，以及它们之间的关系讨论并不深入，更常见的是，人们将长短时记忆简化为向量数据库。我想解决这个问题，尝试对这两者进行深层次的理解，并建立更完备，更正交的关系也很重要。

4.3 Sensory

当人工智能Agent融入人类生活后，它与我们的体验和经历能否成为Agent自身的存储内容？如果可以，那么在未来，我们与Agent之间的互动将会变得更加实用，更加贴近现实生活，更加有温度。

在输入的问题上，我明确地看到了多模态输入的必要性，同时，对于时间感知我认为也非常重要，时间性对于运动控制任务极其重要。引入多模态输入后，我们还要解决一个自上而下的机制问题，就是Projection启发的这个点，OCR嫁接术一定会在某类任务存在缺陷。

4.4 Motor

在交流方式上，我认为不应仅仅依赖于语言，虽然现在的交流基本都是基于语言的，但是，语言是一个低带宽且低效的通信工具。我在想，我们能否引入一种新的沟通方式 - 类似心灵感应的方式，让Agent在隐空间通信。

关于运动控制，当前的方式包括一些机器人应用，都比较结构化。但我认为，在未来，大模型的神经网络应该可以直接连接到运动控制的神经网络，实现层次化控制，使得运动更为流畅，甚至比人类更为灵活。

在另一方面，运动控制也应该是数据化的，而不是仅仅处于我们所说的”计划者“的层面。如果有一个命令下达，神经网络应该可以直接执行。

除此之外，还有一些亚符号的控制，在大模型直接对接神经网络时，我们应当避免通过语言来描述，因为我们可以通过这种方式得到的信息量会比通过语言描述来得多。

同时，也需要进行一些外部工具的优化，让现有的工具更适应我们的需求，比如一些愿意为了方便Agent调用进行改造的工具服务商将会在新的价值网络中占据一席之地，如一个旅游服务供应商，加入下一代Agent平台之后，Agent在完成用户旅游类任务时可能会有限调用它，并使用类似Web3的技术进行价值分配。

4.5 Learning

任何一个产品，或者说Agent，都需要学习。学习的过程是十分重要的，尤其是模型需要学会对自身的可靠性进行判断，知道自己知道什么，更重要的是，知道自己并不知道什么，不擅长什么，这将会对模型的发展产生重大影响。关于大型模型的优化，我认为最关键的问题就在于模型需要明确自己的能力范围。有些问题，大模型不能张口就来直接给出答案，过于逞能，它应该经过仔细的思考，保证任务目标的准确达成。

同时，我们也需要考虑模型的权威性问题。大模型可能从互联网和垃圾信息中学到很多知识，但这并不意味着它在解决问题时能提供最权威、最佳的做法。我们需要把这个模型训练到，即使是在面对垃圾信息输入时，它也能输出更好的、更有价值的解决方案。

另一方面，我们还需要考虑到模型的多样性。很多时候，为了保证任务的有效执行，我们往往会控制模型的温度参数，以保持其输出的稳定性。但是，在保证模型正确性的同时，我们也不应该忽略它的思维活跃度。我们应允许智能体在解决任务时有更大的解空间，以便找到最优的解决方案。

4.6 World Models

关于世界模型，我们需要注意的是，尽管模型的训练数据中可能含有很多垃圾信息和错误信息，我们还需要让模型具有辨别和整理这些信息的能力，以构建一个无矛盾、统一的实体网络，这一点鲜被提及，我认为现在黯然神伤的之前做知识图谱的同学可以重点考虑一下这个方向。‍‍‍‍‍‍

在此基础上，我们还需要让模型具备推理能力。一个优秀的智能体不应该仅仅依赖于内部推理，而应该有能力借助外部推理，当然这个外部推理可以当做工具来使用。

最后，我们还必须强化模型的内部思考机制。当调用一些有成本的接口时，模型不能只是“想到就做到”，而应该有自我觉知的能力，或者叫Mental Simulation，预判自己的行动可能会带来的结果，并在内部进行纠错，以保证行动的可靠性，这不同于Reflection是执行后根据执行结果再反思。进一步，我们可能更大的关注点应该是它在家庭生活及现实社会中的应用上，将其实现为实体化的机器人，那么动力学机制和时间性认知还是很重要的，而当前的大模型仅是一个简单的循环调用，无法实现这方面的任务。

好，以上就是我对一些方向的浅显思考。‍‍‍‍‍‍

最后，我们以伟人的一段话来结尾：Agent 技术，它是站在海岸遥望海中已经看得见桅杆尖头了的一只航船，它是立于高山之巅远看东方已见光芒四射喷薄欲出的一轮朝日，它是躁动于母腹中的快要成熟了的一个婴儿。

编辑：黄飞

阅读全文

机器人(200958) 机器人(200958)
神经网络(98386) 神经网络(98386)
运动控制(32363) 运动控制(32363)
Agent(26497) Agent(26497)
大模型(810) 大模型(810)

大模型的“第一性原理”：技术创新与社会价值的接轨

抱一而为天下式，产业大模型的价值公式

2023-07-14 09:07:44

504

AI Agent爆发在即！深剖AI Agent技术原理及发展趋势

中能够自主地进行学习和改进。 AI Agent的工作方式类似于人类代理，它能够接收输入数据（例如传感器信息、文本、图像等），通过分析和处理这些数据，理解环境和任务要求，并做出相应的决策和行动。 AI Agent 的技术原理及应用案例 AI Agent和大模型

2024-01-12 01:01:00

2146

一种电子系统测试性模型的研究

【作者】：宋东;胡立华;朱道德;王传清;【来源】：《测控技术》2010年03期【摘要】：测试性是系统和设备的一种便于测试和诊断的重要设计特性,对现代的航空电子设备、武器装备等复杂系统的维护性、可靠性

2010-04-22 11:28:58

从Qos看三大通信技术

优先级控制、流量控制、时延控制,同时分配一定的资源进行通讯补救，保证系统、信令、数据的可靠性。因此DDA技术有很高的QoS指标保证。QoS实时控制技术在了解整体网络资源运行情况和策略，掌握资源管理信息的基础上

2018-02-01 14:42:29

ARM系列 - - 存储模型（一）

开销。因为当某一个写入操作未执行完，其它的操作可能会全部暂停下来。所以现在大部分处理器都不会实现顺序一致性，而是实现一些较为松弛的一致性模型。下面将根据从强到弱的限制程度排序，列举几种典型的存储器模型

2022-04-11 15:42:37

【可靠性分析第一步】构造可靠性模型

其可靠性结构框图却是串联的，因为任何一个环节发生故障，则整个电路将不发生谐振。　　对于串联结构模型的系统，系统的失效率为各功能器件（部件）失效率的代数和。若系统中的每一个部件又由几种元件组成，每种

2016-09-03 15:47:58

何勉：第一性原理和精益敏捷的规模化实施

形式，而忘记了实质。这算是个开头，为第一性原理做一个铺垫。今天我主要分享敏捷的规模化实施，会从以下四个方面进行分享：1、第一性原理2、产品开发的第一性原理3、精益和敏捷的规模化路径4、以第一性原理检验

2018-01-26 10:10:13

基于模型设计的HDL代码自动生成技术综述

流程，一般包含几个步骤：图2-1 V流程设计步骤从整个基于模型的现代控制系统设计开发流程看，主要有两大特点：第一，以系统数学模型为核心，充分发挥仿真技术的优势。该流程可以分为离线仿真 → 快速原型

2021-06-08 09:29:26

基于CMMI-ACQ的信息技术和服务安全采购模型

。最后从过程的角度分析了利用该模型如何对对文献中的典型安全问题或风险等进行了问题解决和风险规避,可知SAMEC模型能够帮助组织进行安全的信息技术和服务采购从而保证采购成功地完成。【关键词】：软件工程

2010-04-24 09:51:13

基于多Agent的传感器管理系统研究与设计

瞬间的不一致，从而导致系统整体性能的下降。任务冲突和竞争使任务协调变得更加复杂。　　3 基于多Agent的传感器管理系统　　Agent是来自于分布式人工智能的一个概念模型，通常是指具有目标、行为和知识

2018-11-14 15:50:32

基于多Agent系统的智能家庭网络研究

基于多Agent系统的智能家庭网络研究在分析家庭网络智能化需求的基础上，提出一种基于多Agent系统的智能家庭网络MAIHN模型，用Agent实现不同功能单元的控制与管理，通过MAS技术的思想、方法

2009-06-14 00:22:04

基于移动agent虚拟仪器系统体系结构模型

技术、示例简单等优势，成为MAIVS系统研究设计的平台。Aglets用纯Java语言编写，具有较好的健壮性和移动性。作为最早基于Java的商业化系统，它提供了一套简单而全面的移动agent编程模型

2019-04-16 09:40:10

如何实现User-Agent

`最近在玩儿Labview做浏览器，发现个问题。首先默认浏览器是IE6的内核，用倒是能用，但是现在很多站点已经不支持了。所以会弹出对话框：所以想用User-Agent伪装成别的浏览器，这个如何实现？试了在调用节点的Header里面写User-Agent，然并卵，并没有任何效果。`

2016-09-12 16:02:31

如何实现基于Agent技术的嵌入式智能设备测试？

如何实现基于Agent技术的嵌入式智能设备测试？基于Agent的嵌入式智能设备测试系统是如何构成的？

2021-04-15 06:14:46

怎么看ST公司Linux MPU第一款芯片STM32MP157？

`怎么看ST公司Linux MPU第一款芯片STM32MP157？看到网络上有基于这款芯片的MYC-YA157C核心板及开发板，产品介绍如下：1、全新的STM32MP1处理器，为高端HMI类产品量身定制2、多种功能接口，提供完善参考功能参考3、软件资源及文档资源丰富，高效的技术支持加速产品开发`

2019-09-26 11:35:27

总结一下Agent 663系列电源的控制

VC++开发常用功能一系列文章(欢迎订阅，持续更新...）吉时利2306 KEITHLEY2306通讯测试程控电源程序控制支持双通道控制：直接上代码：自动化技术得到飞跃发展的今天，测试中各种仪表也

2021-12-31 07:23:17

数字IC验证之“典型的UVM平台结构”（3）连载中...

的passitage模式，从图中可以看出，每增加一个测试模块，平台中就会增加一个与之相对应的agent，因为这些agent在测试单个模块的时候已经完成了，所以这里只需要将它们集成到一个env当中即可，这体现了uvm测试平台的可重用性。　　本章内容就介绍到这里！！！　　未完（待更）.......

2021-01-22 15:32:04

树莓派如何开发Agent

，配置了JADE(基于java的Agent开发框架)。各项测试都正常，但是使用两台树莓派（都配置了JADE）进行远程Agent之间的通信测试时，一直提示通信失败。在尝试了各种办法（包括更改树莓派主机名、固定IP地址、禁用IPV6）后仍然不能进行远程通信。请高手解答！！！！！！大恩不言谢！！！！

2020-05-18 05:56:46

用IBIS模型对高速PCB进行信号完整性分析，出现报错显示没有有效的连接器插针模型

信号完整性分析使用的软件是Altium Designer ；我设计的PCB是一个连接板，器件包含三个不同型号的连接器，以及若干电容电阻，连接器分别连接了几个芯片器件；我使用的IBIS模型借鉴于芯片

2019-05-26 15:45:31

系统的电磁兼容性分析模型及设计方法

：�� 第一层为有源器件的选型和印制板设计;�� 第二层为接地设计;�� 第三层为屏蔽设计;�� 第四层为滤波设计;�� 第五层为瞬态骚扰抑制;3.3 自顶向下方法本文整理自电子元件技术网和我爱方案网（联手打造

2011-10-19 19:51:44

诚聘第一性原理计算兼职老师

企业培训公司面向单位员工培训，长期招聘第一性原理计算兼职老师，一般三天左右的短周期培训，周末为主，有2人左右的小辅导，也有30人左右的培训大班，待遇优，北京，上海，成都，广州，深圳等，如您想挣点外块

2018-01-11 15:33:07

诚聘第一性原理计算兼职老师

2018-01-12 17:56:27

超算世界第一，中国第一？你们怎么看

超算世界第一，中国第一？神威*太湖之光，凭借这台超算，中国又一次走到世界之巅，而且，这一次，中国凭借的是自己的技术。然而，中国真的是世界第一了么？我们来看一下：超算500强，中国上榜167台，美国

2016-06-22 11:15:58

轻量级Agent平台怎么测试？

多Agent系统是指由多个分布和并行工作的Agent通过协作完成某些任务或达到某些目标的计算系统。嵌入式多智能体是把嵌入式系统与多Agent相结合的技术，充分发挥了二者优势[1]。但是，多年来多

2019-09-27 06:26:11

MAS环境下实现Agent交互协作的关键技术

讨论了MAS环境下实现Agent交互协作的关键性问题。在分析Agent协同设计目标的基础上，将遗传算法应用于子任务的调度，提高了Agent协同工作的效率。应用Agent的通信语言建立了一个

2009-02-21 11:50:18

基于使命的Agent组织模型

Agent组织是一种灵活有效的多Agent系统求解方式。针对目前Agent组织模型主要以利己型Agent为基础的现状，提出适合政府及军事等领域使用的基于使命的Agent组织模型。模型以利他型Agen

2009-04-10 08:46:55

基于HLA和Agent的电子对抗仿真系统构建

综合运用基于HLA和Agent的建模仿真技术，设计开发分布式的仿真联邦，研究基于HLA的Ageng通信控制、本体模型在Agent知识水平通信中的应用以及提高HLA仿真效率途径等问题。研究结果

2009-04-11 09:50:37

移动Agent位置透明通信模型的设计

提出一种高效可靠的移动Agent通信模型――D-C通信模型，结合域名字解析器和移动Agent系统中的Communicator实现移动Agent之间的通信。通过引入一种基于全局的、与位置无关的命名方法

2009-04-16 08:53:03

基于决策论的Agent个性化行为选择

Agent 不同的主观态度对行为策略的偏好具有重要影响，但Agent 的个性化态度难于在量化或符号化的数值决策模型中体现。该文参照定性决策理论，在现有效用最大化决策模型基础

2009-04-18 08:39:18

一种用于多Agent系统的领域工程方法

现有的面向Agent的软件工程方法没有考虑多Agent系统中的横切关切并且存在Agent概念过于抽象，不能有效地指导详细设计和实现的问题。该文提出一个基于多Agent领域元模型MBGDE，开发

2009-04-21 09:35:33

一种基于多Agent系统的智能家庭网络研究

在分析家庭网络智能化需求的基础上，提出一种基于多Agent系统的智能家庭网络MAIHN模型，用Agent实现不同功能单元的控制与管理，通过MAS技术的思想、方法和体系建立智能家庭网

2009-04-26 18:17:51

Agent Technologies实现应用流程再造

论文旨在研究自助服务系统应用流程再造的设计与实现，并探索Agent 技术在其中的应用。关键词：Agent；流程再造；业务无关性；

2009-06-01 11:04:36

基于多Agent 技术的分布式测控系统研究

文章将智能Agent 技术应用于分布式测控系统领域，实现分布式测控系统的智能化。对Agent 技术、多Agent 系统、分布式测控系统进行分析，指出基于多Agent 技术的分布式测控系统需要

2009-06-01 13:42:53

基于多Agent的洪水预报系统研究

在分析洪水预报方法及研究进展的基础上，提出了一种基于多Agent（Multi-Agent）的新型体系结构的洪水预报系统模型，给出了系统的整体结构及预报节点MAS 结构。简要介绍了界面Ag

2009-06-06 14:05:14

基于Multi-Agent 的网络入侵取证模型的设计

在分析网络入侵取证和多Agent 技术的基础上，提出了一个基于多Agent 的网络入侵取证系统的模型，并详细描述了入侵检测与取证的过程和方法。将入侵检测和计算机取证技术结合在

2009-06-10 11:18:21

基于移动Agent 的新型分布式入侵检测系统

通过阐述入侵检测系统的基本概念和移动Agent 的优点，并将移动Agent 技术与分布式技术相结合，提出了一种基于移动Agent 的新型分布式入侵检测系统DIDSBMA，它具有传统入侵检测技

2009-06-13 11:08:27

基于遗传算法的多agent联盟的生成

联盟生成是多Agent 系统的一个关键问题，主要研究如何在多Agent 系统中动态生成面向任务的最优Agent 联盟。本文讨论了Agent 联盟的生成，并将遗传算法应用于Agent联盟生成中，对

2009-06-15 11:25:17

基于移动agent网络智能化服务模型

设计和实现了一个移动Agent 网络信息智能化服务系统模型，它能根据用户定义的要计算目标，自主地适应Internet 环境，能实现网上信息和用户信息个性化需求模式的自动匹配，

2009-06-17 10:31:01

Agent在数据分析平台中的应用研究

以数据分析平台的建设为背景，深入分析了数据分析平台的特点和需求，在此基础上，结合Agent技术，提出了具有智能化、个性化、平台化等特点的数据分析平台多Agent 系统的模型，

2009-06-18 08:20:56

基于有色 Petri Net 的多Agent入侵检测系统实现

在目前基于Agent 的分布式入侵检测系统的设计中，主要的设计思路是依赖多Agent 联盟合作机制，但在具体的工程实现中，却难以找到一种恰当的实现模型。本文针对此问题，提出了

2009-06-20 08:58:07

基于OCC 的Agent情感模型研究

Agent不仅要具有逻辑推理能力，还应当具有类似人类的情感能力。通过对情感理论的分析，提出了一个基于OCC的Agent情感模型，使Agent能够模拟像人类一样的认知能力和情感能力，从

2009-06-26 08:21:20

一个移动Agent安全旅行协议

本文提出了一种保护移动Agent 不受Agent 平台攻击的旅行协议。该协议基于Agent旅行的历史记录，在一定的条件下允许Agent 所有者检测对Agent 代码、状态和执行流的非法篡改。这个

2009-07-30 10:42:45

基于多Agent的MES任务调度的研究与设计

针对MES的生产管理的特征，利用Agent自主性、智能性等特点，提出基于多Agent的MES 任务调度模型，介绍该模型的结构以及各部分Agent 的功能和特点。并使用遗传算法对参与调度的

2009-07-30 11:20:58

基于多Agent的维修任务调度系统的研究

本文根据维修作业任务调度的复杂性，以及当前存在的问题,提出了基于Multi-Agent技术的维修作业任务调度系统，建立了基于管理Agent、任务Agent和资源Agent的系统模型，引入了规则调

2009-07-30 11:33:50

基于多Agent的智能网络交规培训系统设计

交规培训是提高驾驶人员素质、保证交通安全的前提。基于多Agent 技术构建的智能网络交规培训系统模型采用B/S 三层结构，其中的表示层和逻辑层分别由不同的Agent 群来实现，极

2009-08-05 09:24:53

基于Agent的分布式入侵检测系统的研究与实现

本文通过借鉴智能代理(agent)技术，并结合XML 和安全通信技术，提出了一种具有两层代理结构的分布式入侵检测系统模型，并设计实现了原型系统。该模型有多个域组成，域内采用分

2009-08-07 14:31:41

基于MVC 模式构建用户界面Agent 的应用研究

用户界面是应用软件的重要组成部分，将智能Agent 应用于用户界面的设计已越来越广泛。而使用面向对象模型MVC（模型—视图—控制器）可以提高设计效率。论文主要论述了基于Agent

2009-08-15 10:00:27

基于Agent的频繁模式挖掘

频繁模式挖掘是数据挖掘中的一个重要部分，现有的模型具有各自的优点，但在智能性方面表现较差。对于已经存在的Agent 系统，多数都是以语言的形式进行描述，本文对Agent 进

2009-08-21 08:23:34

基于XML、CORBA和Agent的分布式搜索模型研究

XML、CORBA 和Agent 各有优势，通过它们的结合，可以克服传统分布式系统的不足。论文分析了传统搜索引擎的不足，提出了一个基于XML、CORBA 和Agent 技术的分布式信息搜索模型。该系

2009-08-29 09:55:58

一种结合Multi-Agent的单点登录模型

本文针对单点登录技术（Single Sign-On SSO），结合网络安全机制分析并指出目前各种SSO 模型的不足，提出基于broker（经纪人）与Kerberos 混合认证的Multi-Agent（多代理）SSO 模型，采用

2009-08-29 11:24:22

基于Agent技术的决策模型协作问题研究

本文通过对模型进行Agent封装，以及模型之间的协作，将决策算法选择和算法中系数的确定问题通过评价模型的协作来解决，改变了传统决策者凭经验选择模型算法和算法系数的确定

2009-09-01 10:54:20

一个基于移动Agent的分布式入侵检测系统模型

本文分析了当前分布式入侵检测系统中存在的一般性缺陷，介绍了移动Agent的概念和优点，提出一种新的基于移动Agent 的分布式入侵检测系统模型DIDSMA。DIDSMA 采用分散的数据分

2009-09-03 08:12:39

一种面向Web服务复合的多agent协同系统设计

本文主要设计了一种新的Internet系统模型，面向Web服务复合的多agent协同系统（CoWEB）。首先，通过阐述“Web服务复合”这种新的分布计算应用所具有的特点和需求，提出了使用agent构

2009-09-03 09:28:32

基于多Agent的网络安全风险评估系统模型

本文提出了一种基于多Agent 的网络安全风险评估系统模型，详细说明了该系统中各Agent 的组成结构和功能，并对多Agent 系统模型运行流程进行了描述。最后通过Agent的通信机制说明了

2009-09-11 16:07:21

基于移动agent的信息协查业务仿真模型研究

根据移动Agent 在分布式数据查询中的优势，该文提出了一个基于移动代理的分布式信息协作查询仿真模型，有效的解决了服务端和节点端因为频繁的交互产生的带宽浪费问题，减

2009-09-12 16:17:44

Multi-Agent在工控系统中的应用研究

近几年来，Agent 和Multi-Agent 理论和现场总线技术有着快速的发展。本文对Agent 和Multi-Agent 理论和现场总线技术进行简单介绍。并结合Multi-Agent 理论和现场总线技术，构建一个基于

2009-09-12 16:45:35

基于移动Agent异构网络管理的分析与设计

本文结合目前国内外有关移动Agent 在网络管理中的应用状况，提出了基于移动Agent的异构网络管理结构模型，并进行了性能分析和模拟试验。实验结果表明，基于移动Agent的异构网

2009-09-14 14:18:42

多agent动态调度控制模型

结合多agent 理论和企业的生产实际，建立了一种多agent 动态调度控制模型MADSCM，详细探讨了MADSCM 中agent的逻辑模型和具体结构，通过引入等待时间，提出了一种可以减少协商次数的

2009-09-16 09:49:06

计算机辅助审计的多Agent协作模型研究

文章提出了一种基于计算机辅助审计的多Agent 系统模型，分析了该模型中各模块的组成特点，并着重探讨了系统中各Agent 的功能、Agent 之间的协作关系以及审计Agent 的内部结构。该

2009-09-23 10:52:22

基于移动agent的网格环境的安全技术研究

本文阐述了网格环境的特点、安全需求和移动agent。针对移动agent 引入到网格环境中的应用需求所产生的安全问题进行研究，提出了基于移动agent 的网格环境的安全体系结构模型

2009-12-25 16:44:57

基于人格理论的情感agent模型及应用

情感agent 的模型设计是人工智能领域的一个重要内容，是计算机信息科学与生物学、心理学和社会学等不同领域内容相结合的一项研究。通过对心理学中人格和情感概念的研究和探

2010-01-13 14:40:20

基于多Agent的I-MES在烟草企业中的实现

本文以面向敏捷企业的智能制造执行系统(I-MES)为研究对象，采用多Agent 技术作为系统的实现形式，对系统的多 Agent组织结构、系统中多Agent间的通信和协作机制以及多Agent的基于事

2010-02-22 14:42:58

基于多Agent的机车电路仿真及其实现

针对机车电路复杂的连锁关系以及现有仿真建模方法存在的问题,本文提出了基于多Agent机车仿真建模方法,构建了基于多Agent的仿真模型并在JADE平台上仿真实现,结果表明利用多Agent间

2010-02-24 15:55:49

基于移动Agent的P2P搜索方法研究

针对一般P2P网络资源搜索方法的搜索效率低等确定,通过引入移动Agent技术,提出了一种基于移动Agent的新的搜索方法。该搜索方法设计了一个确定Agent数量及路线的算法,并利用其进行

2010-02-26 14:29:16

一种基于Agent技术的入侵检测系统模型

本文首先指出了将Agent技术应用于入侵检测系统的优势,依据入侵检测系统的特点给出了主机的状态转换图,并提出了一个入侵检测模型,该模型的主机中有数据异常检测Agent、特征提取A

2010-02-26 16:11:02

基于多Agent技术的油田智能防汛系统

本文分析了基于多Agent 的决策调度在防汛系统中应用的可行性,给出了多Agent防汛决策调度系统的设计方案和软硬件体系结构，通过在油田防汛决策支持系统中的应用，说明多Agent的体

2010-03-02 16:19:11

张传奇 - Agent Faker TL-C一致性Cache的软件测试框架 - 第一届 RISC-V 中国峰会

AgentRISC-V

RISCV国际基金会发布于 2022-09-02 10:34:49

基于Agent的网络协作学习环境的研究与设计

通过对个别化教学中的协作学习和领域知识库的分析以及对多Agent协作技术原理进行研究，引入智能agent的网络协作学习环境，提出并设计了基于智能Agent技术的网络教学系统

2010-07-21 16:47:28

Agent在数据分析平台中的应用研究

2010-11-01 11:57:26

基于SNMP的OBS网络网管嵌入式Agent设计

基于SNMP的OBS网络网管嵌入式Agent设计图2所示给出了OBS网管的基本模型[1]。从图中可以看出，Agent主要负责处理3件事情[1,2]：1) Agent通

2009-03-04 11:20:33

1415

嵌入式移动数据库与Agent技术原理及设计

嵌入式移动数据库与Agent技术原理及设计概述：随着网络技术的迅速发展和不断渗透，在任何地点和任何时候都能接入网络获取各种信息，必

2010-03-07 12:47:28

500

Agent技术在装备维修人员保障决策模型中的应用

1 Agent 基本概述　　1.1 基本概念　　目前学术界对 Agent 的定义多种多样，难以形成一个统一确切的概念。Agent 的一般描述为:Agent 是一个具有自主性、社会性、反应

2010-08-16 11:32:21

1130

基于CSCW和多Agent的电网调度协同工作模型

分析电网调度运行管理系统的工作特点，根据系统内不同任务分工协作的要求，利用多Agent 技术将系统划分成不同功能的模块。提出了基于多Agent 的CSCW 环境下的一种电网调度协同工作

2011-05-28 10:57:43

基于Agent的远程教学模型

结合Agent、数据库、动态网页等技术，提出一个基于 Agent 的远程教学模型，较好地实现个性化学习和协作学习。这一模型将大部分Agent 散布放置在网络空间上，且能动态增删，合理地利

2011-06-07 16:59:07

Agent技术研究与分析

介绍了 Agent 和多Agent技术的背景和概念，比较了Agent系统和多Agent系统的体系结构，着重分析了Agent的结构，说明了多Agent系统中的各Agent之间用来进行知识交互的通信语言，最后列举了

2011-06-08 16:03:25

基于Agent技术的机群智能构造器的设计

提出了一种基于 Agent 技术的机群智能构造器CIB 通过一种系统构造机制CIB 实现了对机群系统的自动配置部署和引导从而构造出用户定制的机群系统同时它提供了遵循用户心智模型的GUI

2011-09-26 15:31:16

[10.3.4]--3.智能Agent技术-应用与平台

Agent

学习电子知识发布于 2022-11-23 16:16:57

Agent智能人机接口技术

本文将agent 技术和方法应用于人机接口, 并设计了一个决策支持系统中的基于Agent 的人机接口模型。

2012-01-10 11:46:11

1849

Agent制造系统的研究及应用

近来，Agent 技术已被认为是进行分布式工业系统建模的一种重要方法，一些主要的美国制造企业和政府机构认为基于Agent 的制造是美国制造业的未来。Agent 技术是设计与实施分布式智能制造环境

2017-10-12 14:31:17

基于多Agent的众包任务推荐系统

为了让众包平台用户更方便准确地搜寻到合适任务，促进其能力水平提升，解决众包任务推荐动态性等问题，提出了一种基于多Agent的众包任务推荐系统。首先，基于众包平台建立多Agent任务推荐模型，提出

2017-11-21 15:36:15

多移动agent协作规划模型

以agent负载能耗均衡度和网络总能耗为指标构建多移动agent协作规划模型，为了尽可能延长网络生存周期，给出基于网络覆盖率的节点休眠机制，在满足WSN网络覆盖率要求的同时，采用较少节点处于工作状态

2018-01-17 10:03:01

BMS如何按照马斯克第一性原理来设计？

既然马斯克利用第一性原理取得了诸多成功（除了特斯拉，还有SpaceX，最近猎鹰重型的发射回收也是这一理论的典型应用），我们不妨向成功者学习，按照马斯克的第一性原理，BMS应该如何设计？

2018-03-19 16:36:33

8070

针对固体可靠而准确的稳定性第一性原理的详细概述

可靠而准确的稳定性第一性原理计算对材料的合成、反应性和性质的研究至关重要，对于探索新的化学空间和难以观察的相结构来说也很重要。稳定性涉及化学稳定能力（不同化学环境中化学计量组成保持不变的能力）和结构选择（一定化学计量组成的晶体结构取向）两个方面，对于已知材料，可用实验测量生成焓来预测。

2018-04-29 17:41:00

2280

伯克利那个会“18般武艺”的DeepMimic模型开源了！

整个DeepMimic所需要的input分为三部分：一个被称为Character的Agent模型；希望Agent学习的参考动作（reference motion）；希望Agent完成的任务（task）所定义的reward function。

2018-10-19 09:06:28

4638

基于第一性原理计算高效获得高精度分子动力学力场

费力，即需要从第一性原理计算数据库中手动或随机选择数千个参考结构来拟合。另外，在分子动力学模拟中，由于缺乏对模型不确定性的评估方法，将难以确定力场何时是可信赖的，从而导致结果的不可靠。

2020-06-24 10:20:30

5286

基于机器学习的晶体结构搜索方法和第一性原理计算

孙建教授课题组用自行开发的基于机器学习的晶体结构搜索方法和第一性原理计算，对氦和甲烷在高压下的化合物，以及它们在高温高压下的物态进行了系统研究，得到了一系列令人惊奇的理论结果。他们预言，在高压下，氦和甲烷能形成氦-甲烷比例为 3:1的稳定化合物He3CH4。

2020-06-24 10:27:13

5436

互联网医疗的特性和内在动力/基石模型/第一性原理

第一性原理可以适用于任何行业任何领域，听说“互联网医疗”行业也适用这个，但究竟是什么呢？

2021-01-11 11:11:27

546

关于多Agent的容错中间件失效处理系统的研究

针对敏感行业中分布式应用的容错需求问题，分析介绍Agent、多Agent系统和容错中间件技术，根据Agent和中间件特性结

2021-05-20 18:16:36

1394

从马斯克的第一性原理，谈气传导蓝牙耳机的技术初衷

，莫过于他一直信奉的“第一性原理”。马斯克是怎么看第一性原理的呢？他有一句话是这样说的：“我们运用第一性原理，而不是用比较思维去思考问题，这是非常重要的。我们在生活中总是倾向于比较，对别人已经做过或者正在做的事情我们也都去做，这样发展

2022-01-17 09:25:42

1957

第一性原理软件携手曙光智算共同助推材料创新

　　新材料领域被定位为国家重要战略发展高地，而第一性原理计算则在其中承担举足轻重的作用。其从量子力学基本原理出发，实现材料模拟，无需真实实验即可预测材料性质。目前已经广泛应用于化学、物理、生命科学和材料学等领域，是新材料研发的利器。

2022-05-19 20:36:42

1460

Nanodcal第一性原理输运软件与Pd(100)_CO结构弛豫的展示研究

Nanodcal是一款基于非平衡态格林函数-密度泛函理论（NEGF - DFT）的第一性原理计算软件，主要用于模拟器件材料中的非线性、非平衡的量子输运过程，是目前国内拥有自主知识产权的基于第一性原理的输运软件。可预测材料的电流 - 电压特性、电子透射几率等众多输运性质。

2022-11-29 15:03:43

1270

人工智能的第一性原理是什么？

来源：清湛人工智能研究院这篇文章是郭平教授的一篇文章，本文采用“四问”的表述方式，解释了人工智能的第一性原理。提出了在基于物理的人工智能基础研究领域，运用第一性原理思维解决人工智能缺乏基础自然科学

2023-09-07 08:29:39

463

Java Agent的作用及原理

Java Agent是目前各种监测调试JVM的主要技术。Eclipse，IntelliJ,Visual VM ,JConsole 等都依赖于此技术。相信你们的Java 程序部署的时候肯定也会配置各种

2023-10-10 15:53:04

665

我们心中AI Agent的现在和未来

在大模型技术上领先的 OpenAI 同样对 AI Agent 十分感兴趣，它们的首席科学家 Ilya Sutskever 不止一次表达过 OpenAI 对 AI Agent 技术的关注，事实上这一点

2023-11-09 16:20:30

349

解析AI Agent的发展现状和技术难点

AI Agent 这项技术可以说是建立在大语言模型之上的一种全新技术。我们拥有了大语言模型之后，大家发现除了微调之外，还可以进行所谓的上下文学习。于是，引入了一个新的概念，即在处理问题时的“提示工程”。

2023-12-05 15:33:02

658

AGI时代的奠基石：Agent+算力+大模型是构建AI未来的三驾马车吗？

AI Agent的训练离不开算力，服务器作为一个强大的计算中心，为AI Agent提供算力基础，支持其进行复杂计算和处理大规模数据的任务，包括模型训练、推理和处理大规模数据集。

2023-12-21 13:34:30

419

已全部加载完成

搜索历史

如何从第一性原理看大模型Agent技术原理

评论