可用指南旨在使 AI 更安全-电子发烧友网

介绍

人工智能 (AI) 领域准备进入一个新的领域——机器从补充人类用户的工具转变为自主智能代理，可以设定自己的目标，决定学习什么，决定如何学习，和更多。高度智能系统改变世界的潜力类似于以往工业革命带来的变化。问题不是智能系统是否会继续改变我们的生活；而是问题是以什么方式和在什么程度上。

什么是人工智能安全工程？

AI Safety Engineering（或简称“AI Safety”）是一个拟议的 AI 开发框架，它将机器伦理学与心理学、经济学、金融学和其他领域相结合，以：

扩大对机器伦理的讨论，以包括狭义的、一般的和超人的智能

将最近和正在进行的人工智能伦理讨论与开发具有通用智能的机器的可用工程指南、流程和标准联系起来

针对智能系统中已知和潜在漏洞的来源

作为一个新兴的研究领域，人工智能安全的出现有几个原因。首先，人工智能的成功不仅仅以实现目标来衡量；成功的人工智能是以符合人类价值观和偏好的方式实现目标的人工智能。回顾 60 多年的 AI 发展，我们可以看到机器目标与人类价值观和偏好之间的不一致迟早会导致 AI 失败。正如本系列中所探讨的那样，将这种失调作为一个关键漏洞是开发安全人工智能的核心。

其次，人工智能的最新进展已经开始达到人工狭义智能系统的边界，这些系统在给定的上下文中执行单一或狭义定义的任务。传感器、大数据、处理，尤其是机器学习方面的进步使这些系统越来越像人类，并扩展了它们的能力和用途。考虑到这一点，达到人工智能的下一个层次——通用人工智能——即将到来，如果安全人工智能不是优先考虑的潜在后果也是如此。

Safe AI 的核心是假设通用人工智能会给人类带来风险。AI Safety 不是通过尝试在任务或目标级别将人类价值观和偏好传授给机器来解决这个问题——这可能是不可能的壮举——AI Safety 旨在：

以符合人类能力和/或

优先考虑人类福利、合作行为和为人类服务

这样做，我们将确保人工智能流程和目标在宏观层面尊重人类，而不是试图在微观层面实现同样的目标——让机器倾向于对我们友好，作为智能核心的一部分。

作为一种工程开发理念，AI Safety 将 AI 系统设计视为产品设计，对产品责任的每个角度进行检查和测试，包括使用、误用和潜在漏洞。图 1说明了 AI Safety 的新兴原则和建议。

图 1：AI 安全工程强调开发智能系统，即使在递归自我改进的情况下也能证明它们是安全的。

在本系列中领先

AI 安全工程是一门新兴学科，有很多需要研究、讨论和编纂的内容。贸泽电子很高兴推出这个博客系列，让 AI 工程师了解关键概念并鼓励参与其持续开发：

本系列的第 2 部分重点介绍了我们从过去 60 多年的 AI 开发中学到的经验，即 AI 失败的原因是机器目标与人类价值观和偏好之间的不一致。它还讨论了为什么将人类价值观和偏好传授给机器是一个无法解决的问题，并指出了安全人工智能的必要性。

第 3 部分讨论了需要 AI 安全的另一个原因：AI 的进步正在突破人工狭义智能 (ANI) 系统的界限，并将人工智能 (AGI) 纳入视野。

第 4 部分探讨了实施 AI 安全的其他挑战：不可预测性、不可解释性和不可理解性。

第 5 部分描述了 AI 安全将改变工程的方式。开发深入用户价值核心的用例和检查情报漏洞是这里的两个关键主题。

第 6 部分以关于使用“人工愚蠢”来帮助我们开发安全人工智能的讨论作为结尾。限制机器能力以及理解认知偏差是这里的关键主题。

审核编辑hhy

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30887

浏览量
269075
人工智能

人工智能

+关注

关注
1791

文章
47274

浏览量
238473

C2000™第2代至第3代MCU功能安全使能器迁移指南

电子发烧友网站提供《C2000™第2代至第3代MCU功能安全使能器迁移指南.pdf》资料免费下载

发表于 11-28 15:08 •0次下载

C2000™第2代至第3代MCU功能<b class='flag-5'>安全</b><b class='flag-5'>使</b>能器迁移<b class='flag-5'>指南</b>

AI引擎机器学习阵列指南

AMD Versal AI Core 系列和 Versal AI Edge 系列旨在凭借 AI 引擎机器学习 ( ML ) 架构来提供突破性的 AI

发表于 09-18 09:16 •397次阅读

初创公司SEA.AI利用NVIDIA边缘AI和计算机视觉技术变革航海安全系统

总部位于奥地利林茨的初创公司正在利用 NVIDIA 边缘 AI 和计算机视觉技术变革航海安全系统，让每一次出海变得更安全。

发表于 09-09 09:32 •510次阅读

为什么加速数据处理对各行各业的AI创新都至关重要

病的新疗法；公共事业正在使用 AI 建设更清洁、更可靠的能源网络，汽车行业正在利用 AI 使自动驾驶汽车更

发表于 07-05 10:46 •679次阅读

智谱AI与OpenAI、谷歌等签署AI安全承诺

在近日举办的第二届人工智能安全峰会上，智谱AI与来自北美、亚洲、欧洲和中东地区的15家顶尖人工智能公司共同签署了一项重要协议——前沿人工智能安全承诺。此举旨在确保人工智能开发的

发表于 05-23 14:17 •450次阅读

英国AI安全研究所推出AI模型安全评估平台

据报道，英国人工智能安全研究院近日发布了名为“Inspect”的AI模型安全评估平台，此平台采用开源技术且对全球AI工程师免费开放，旨在提升

发表于 05-13 15:20 •416次阅读

亚马逊云科技宣布生成式AI助手Amazon Q正式可用激活企业内部数据并加速软件开发

Business旨在增强员工的数据驱动能力，帮助他们生成内容、构建报表，并利用公司的内部资源及数据做出更迅速、明智的决策。 Amazon Q Apps是Amazon Q Business的一个全新且强大的功能，它使员工能够利用

发表于 05-06 08:43 •334次阅读

开发者手机 AI - 目标识别 demo

功能简介该应用是在Openharmony 4.0系统上开发的一个目标识别的AI应用，旨在从上到下打通Openharmony AI子系统，展示Openharmony系统的AI能力，并为

发表于 04-11 16:14

NanoEdge AI的技术原理、应用场景及优势

NanoEdge AI 是一种基于边缘计算的人工智能技术，旨在将人工智能算法应用于物联网（IoT）设备和传感器。这种技术的核心思想是将数据处理和分析从云端转移到设备本身，从而减少数据传输延迟、降低

发表于 03-12 08:09

智慧路灯杆AI监测应用，让高速出行更安全

针对更好监测和管理高速公路上的交通状况，可以基于智慧路灯杆打造AI交通监测应用，通过智能感知高速路段的路况、车况、环境状况，实现实时风险感知、风险预警和协同处置，让高速出行更安全。

发表于 03-11 17:20 •451次阅读

是德科技推出AI数据中心测试平台旨在加速AI/ML网络验证和优化的创新

2024年2月29日，是德科技（Keysight Technologies,Inc.）宣布，针对人工智能（AI）和机器学习（ML）基础设施生态系统，推出了 AI数据中心测试平台，旨在加速AI

发表于 02-29 09:32 •637次阅读

汽车网络安全-挑战和实践指南

汽车网络安全-挑战和实践指南

发表于 02-19 16:37 •539次阅读

AI加入软件会更安全吗

“变化即常态”是技术领域的主旋律。随着新技术的飞速发展，软件安全的复杂性也在不断增加，不法分子总是能发掘出更隐蔽的手段进行网络攻击。虽然没有人能够准确断言未来软件安全的发展，但开发者们可以基于当下的

发表于 01-25 09:40 •702次阅读

Vitis AI用户指南

电子发烧友网站提供《Vitis AI用户指南.pdf》资料免费下载

发表于 01-03 10:51 •1次下载

AI引擎内核与计算图编程指南

电子发烧友网站提供《AI引擎内核与计算图编程指南.pdf》资料免费下载

发表于 01-03 10:50 •0次下载

搜索历史

可用指南旨在使 AI 更安全

评论

C2000™第2代至第3代MCU功能安全使能器迁移指南

AI引擎机器学习阵列指南

初创公司SEA.AI利用NVIDIA边缘AI和计算机视觉技术变革航海安全系统

为什么加速数据处理对各行各业的AI创新都至关重要

智谱AI与OpenAI、谷歌等签署AI安全承诺

英国AI安全研究所推出AI模型安全评估平台

亚马逊云科技宣布生成式AI助手Amazon Q正式可用激活企业内部数据并加速软件开发

开发者手机 AI - 目标识别 demo

NanoEdge AI的技术原理、应用场景及优势

智慧路灯杆AI监测应用，让高速出行更安全

是德科技推出AI数据中心测试平台旨在加速AI/ML网络验证和优化的创新

汽车网络安全-挑战和实践指南

AI加入软件会更安全吗

Vitis AI用户指南

AI引擎内核与计算图编程指南