高明！OpenAI提出HER算法，人工智能可像人类一样认识错误汲取教训-电子发烧友网

失败是成功之母：HER有自我审视能力。

OpenAI的研究人员集中精力于构建具有更强的学习能力的人工智能。得益于他们的增强学习系统OpenAI baselines，机器学习算法可以进行自主学习。目前，这个新的算法保证人工智能可以像人类一样从自己的错误中汲取教训。

这个进步源于OpenAI的研究人员在近期公布的名为“后见之明经验复现（Hindsight Experience Reply, HER）”的开源算法。正如名字所示，HER帮助人工智能系统在完成一项任务后，具有自我审视的能力。OpenAI的博客中提到，人工智能认为失败乃成功之母。

研究人员写到：“构建HER的关键在于利用人类的直觉：在实现某个任务时，虽然我们没有成功，但是在这个过程中我们学到一些不一样的东西，既然如此，为何不能将我们最终学到的知识作为我们最初的目标呢？“

简而言之，这意味着每一次失败的尝试都是为了实现一个意想不到的“虚拟”目标，而非既定目标。

回想一下你学骑单车的经历，在最开始的几次尝试中，你无法掌握平衡。但是这些经验告诉了你怎么骑车是不正确的，怎么做不能保持平衡。就像在人类的学习过程中，每一次的失败让我们距离成功更进一步。

奖励每一次失败，并且失败也不沮丧

通过使用HER，OpenAI希望他们的人工智能系统可以利用上述的方法来学习。与此同时，这种算法也被作为增强学习模型中的奖励机制的替代算法。为了训练人工智能，使其具有独立的学习能力，它需要包含一个奖励机制：如果人工智能算法达到了预期目标，就可以得到一个小奖励，就像奖励给小孩子一块奶油饼干一样，否则就什么都得不到。另外一个系统根据人工智能距离预期目标的距离来给出奖励。

但是这两种算法并不是完美的。第一个算法会阻碍学习，因为一个人工智能算法在训练过程中要么得到奖励，要么没得到。另一方面，根据IEEE Spectrum报道的内容显示，第二系统在实现时，需要衡量与目标的距离并给出奖励，这个过程是很需要技巧的。如果把每一个任务都当作是后见之明的目标，即使人工智能系统没有完成指定的任务，HER也会提供一个奖励。这样帮助人工智能更快更好地学习。

OpenAI 在他的的博客中提到：“通过进行这种奖励机制的替换，强化学习算法在实现某些目标后会获得一个学习信号，即使这个学习任务不是它最初希望实现的。如果重复这个过程，系统最终可以实现任意的目标，包括最初的既定目标。

这种方法并不意味着使用HER方法可以完全简化人工智能系统学习某个任务的过程。研究者表示：“在机器人上使用HER进行学习仍然很难实现，因为这个过程需要大量的数据“。

无论如何，正如OpenAI的模型所显示的，HER有助于鼓励人工智能系统像人类一样从错误中学习，两者的主要区别在于人工智能在面对失败的时候不会像一些脆弱的人类那样伤心沮丧。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
47244

浏览量
238381
机器学习

机器学习

+关注

关注
66

文章
8414

浏览量
132612

原文标题：高明！OpenAI提出HER算法，AI系统学会从错误中学习

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

OpenAI投资道德算法研究

近日，据外媒最新报道，人工智能领域的领军企业OpenAI正在积极投资学术研究，致力于开发一种能够预测人类道德判断的算法。这

发表于 11-26 10:20 •332次阅读

嵌入式和人工智能究竟是什么关系?

领域，如工业控制、智能家居、医疗设备等。 人工智能是计算机科学的一个分支，它研究如何使计算机具备像人类

发表于 11-14 16:39

Vicor技术如何改进生成式人工智能的供电

生成式人工智能（genAI）带来的文化革命可能像互联网普及一样对人类产生深远影响。从您的角度来看，目前情况如何?

发表于 10-16 09:54 •311次阅读

《AI for Science：人工智能驱动科学创新》第6章人AI与能源科学读后感

和国际合作等多个层面。这些内容让我更加认识到，在推动人工智能与能源科学融合的过程中，需要不断探索和创新，以应对各种挑战和机遇。最后，通过阅读这一章，我深刻感受到人工智能对于能源科学的

发表于 10-14 09:27

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

农业、环保等，为人类社会的可持续发展做出贡献。总结《AI for Science：人工智能驱动科学创新》第4章关于AI与生命科学的部分，为我们展示了一个充满希望和机遇的未来。在这个未来中，

发表于 10-14 09:21

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

深刻认识到人工智能在推动科学进步中的核心价值。它不仅是科技进步的加速器，更是人类智慧拓展的催化剂，引领我们迈向一个更加智慧、高效、可持续的科

发表于 10-14 09:12

risc-v在人工智能图像处理应用前景分析

RISC-V在人工智能图像处理领域的应用前景十分广阔，这主要得益于其开源性、灵活性和低功耗等特点。以下是对RISC-V在人工智能图像处理应用前景的详细分析：一、RISC-V的基本特点 RISC-V

发表于 09-28 11:00

OpenAI在人工智能领域发展势头强劲

北京时间8月29日，彭博社援引知情人士消息，揭示了OpenAI即将完成其新一轮融资的重要进展。本轮融资由知名投资机构兴盛资本（Thrive Capital）领衔，预计估值将突破千亿美元大关，标志着OpenAI在

发表于 08-29 15:37 •453次阅读

FPGA在人工智能中的应用有哪些？

FPGA（现场可编程门阵列）在人工智能领域的应用非常广泛，主要体现在以下几个方面：一、深度学习加速训练和推理过程加速：FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和低延迟特性

发表于 07-29 17:05

OpenAI 深夜抛出王炸 “ChatGPT- 4o”， “她” 来了

当地时间5月13日OpenAI推出ChatGPT-4o，代表了人工智能向前迈出的一大步。在GPT-4turbo的强大基础上，这种迭代拥有显著的改进。在发布会的演示中，OpenAI展示

发表于 05-27 15:43

Meta高管称大语言模型永远无法像人类一样

Meta的人工智能主管杨立昆近日表示，尽管ChatGPT等生成式人工智能产品备受瞩目，但其背后的大型语言模型（LLM）永远无法实现像人类一样的推理和计划能力。

发表于 05-27 09:50 •438次阅读

Anthropic 声称其新的 AI 聊天机器人模型击败了 OpenAI 的 GPT-4

ABSTRACT摘要新的Claude3系列人工智能模型的性能与Google和OpenAI的领先模型一样好，甚至更好JAEALOT2024年3月5日Anthropic是一家由

发表于 03-06 08:24 •520次阅读

嵌入式人工智能的就业方向有哪些?

嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下，嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下，众多名企也纷纷在嵌入式人工智能

发表于 02-26 10:17

OpenAI发布人工智能文生视频大模型Sora

近日，人工智能领域的领军企业OpenAI宣布推出其最新的人工智能文生视频大模型——Sora。这款模型在继承DALL-E 3卓越画质和遵循指令能力的基础上，实现了对真实物理世界的深度模拟，为视频制作领域带来了前所未有的变革。

发表于 02-20 13:54 •863次阅读

OpenAI CEO称人类水平的AI即将出现

OpenAI首席执行官山姆·奥特曼（Sam Altman）近日表示，达到人类水平的人工智能（AI）即将出现，但他认为这种技术对世界的影响可能远没有人们想象的那么大。

发表于 01-17 14:59 •835次阅读

搜索历史

高明！OpenAI提出HER算法，人工智能可像人类一样认识错误汲取教训

评论

OpenAI投资道德算法研究

嵌入式和人工智能究竟是什么关系?

Vicor技术如何改进生成式人工智能的供电

《AI for Science：人工智能驱动科学创新》第6章人AI与能源科学读后感

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

risc-v在人工智能图像处理应用前景分析

OpenAI在人工智能领域发展势头强劲

FPGA在人工智能中的应用有哪些？

OpenAI 深夜抛出王炸 “ChatGPT- 4o”， “她” 来了

Meta高管称大语言模型永远无法像人类一样

Anthropic 声称其新的 AI 聊天机器人模型击败了 OpenAI 的 GPT-4

嵌入式人工智能的就业方向有哪些?

OpenAI发布人工智能文生视频大模型Sora

OpenAI CEO称人类水平的AI即将出现