四个顶级人工智能系统的仇恨言论检测能力依然很差-电子发烧友网

尽管人工智能（AI）技术领域在最近取得了进步，但它依然在大多数基本应用上暴露出很多问题。

在一项新的研究中，科学家们对四个顶级人工智能系统的仇恨言论检测能力进行了测试，他们发现所有系统在识别恶意、以及无害言论上都存在着不同程度的问题。

这一结果并不令人吃惊，因为构建可以理解自然语言细微差异的人工智能是一件非常困难的工作。然而，研究人员们诊断问题的方式却是非常重要的。

为了更加精确地找出系统故障的原因，研究人们针对仇恨言论的方方面面制定了 29 种不同的测试，这会让我们更容易地去了解克服系统缺陷的方法。同时，这些测试也正在帮助一项商业服务提升其人工智能的性能。

由牛津大学以及阿兰・图灵研究所科学家所领衔的论文作者们，对 16 家监管网络仇恨言论的非营利组织的雇员进行了采访。

研究团队利用这些采访将仇恨言论划分为了 18 个不同的种类，仅侧重于英语以及基于文本的仇恨言论，其中包括贬损用语、诋毁性文字以及威胁性词汇。

他们还发现了 11 种经常让人工智能监管者产生误判的不含仇恨情绪的情形，其中包括在不冒犯他人的情况下使用脏话、被目标群体所接纳的诋毁性词语，以及引用原始仇恨言论对仇恨言论进行谴责的行为（也被称为反面论证）。

研究人员针对 29 种不同情况中的每一种编写了数十个范例，并且使用了像 “我讨厌【某人】” 以及 “对我来说，你就是个【诋毁性词语】” 这样的 “模板” 语句，从而为七个受保护的群体生成相同的范例集合 —— 这些人都受美国法律的保护而不会遭到歧视。研究人员对被称作 HateCheck 的最终数据集进行了开源处理，该数据集中共含有近 4000 个范例。

之后，研究人员又对两项受欢迎的商业服务进行了测试：谷歌和 Jigsaw 的 Perspective AI、以及 Two Hat 的 SiftNinja。这两个服务都允许客户标记出帖子以及评论中带有仇恨色彩的内容。

Perspective 的用户包括 Reddit 以及像《纽约时报》、《华尔街日报》这样的新闻机构，根据其所处理的有害信息，人工智能服务会对帖子以及评论进行标记，以供人工审查使用。

SiftNinja 的检测标准过于宽松，进而没有识别出几乎所有的变化，而 Perspective 的标准则过于严格。它检测出了 18 个仇恨种类中的大部分，但同时也标记出了许多像被接纳的诋毁性词语以及反面论证这样的不含仇恨情绪的情况。

研究人员在测试谷歌的两个学术模型时也发现了相同的模式，这些模型代表了业界中顶级的语言人工智能技术，它们同时也是其它商业性内容审核系统的基础。学术模型还显示出，受保护群体之间的表现并不相同 —— 有些群体的仇恨程度比其它群体更容易被错误归类。

测试结果指明了当今人工智能仇恨言论检测方面最具挑战性的一个方面：审核太少，没法解决问题；而审核太多，就会删除掉边缘化群体用来强调和保护自己的话语。

牛津大学互联网研究院的博士候选人保罗·罗特格（Paul Röttger）是本篇论文的共同作者。罗特格表示，“突然之间，你就会成为那些在仇恨言论中首当其冲的群体的惩罚者。”

Jigsaw 的首席软件工程师露西·瓦瑟曼（Lucy Vasserman）表示，Perspective 利用人工审查来进行最终决策，进而克服了这些局限性。但是，这种方法无法扩展至更加庞大的平台上。当前，Jigsaw 正在开发一种基于 Perspective 的不确定性的，同时可以对帖子及评论变更优先顺序的系统。该系统可以自动移除带有仇恨色彩的内容，并将边缘信息标记出来。

瓦瑟曼说道，新研究最令人激动的地方在于，它为这种顶尖技术提供了一种细致的评估方式。她还表示，“论文中强调了的许多东西，例如对那些模型来说是一个挑战的被人们所接纳的诋毁性词语。我们早就认识到了它们的存在，但却一直很难对其进行量化处理。” 目前，Jigsaw 正在使用 HateCheck 来更好地了解自身模型间的差异，以及需要继续改进的地方。

学术界也对此次研究的成果感到兴奋。华盛顿大学语言人工智能研究员马丁·萨普（Maarten Sap）表示，“这篇论文为我们评估行业中的系统提供了一个优良且干净的资源，它会让企业和用户不断地去提升自己的系统。”

罗格斯大学社会学助理教授托马斯・戴维森托马斯·戴维森（Thomas Davidson）对此表示认同。戴维森表示，语言模型的局限性以及杂乱无章的语言现象意味着，人们总会在识别仇恨言论的过程中对过松或过紧的问题进行取舍。他还说道，“HateCheck 数据集让这些取舍变得可视化了。”

-End-

原文：

https://www.technologyreview.com/2021/06/04/1025742/ai-hate-speech-moderation/

编辑：jq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6168

浏览量
105368
人工智能

人工智能

+关注

关注
1791

文章
47274

浏览量
238452

原文标题：测试四个顶级系统，科学家发现AI的仇恨言论审核能力依然很差

文章出处：【微信号：deeptechchina，微信公众号：deeptechchina】欢迎添加关注！文章转载请注明出处。

2025年人工智能在工程领域的应用趋势

人工智能在重塑工程范式方面发挥着关键作用，它提供的工具和方法可提高各个领域的精度、效率和适应性。想要在人工智能竞赛中保持领先的工程领导者应该关注四个关键领域的进步：生成式人工智能、验证

发表于 12-27 15:40 •66次阅读

嵌入式和人工智能究竟是什么关系?

领域，如工业控制、智能家居、医疗设备等。 人工智能是计算机科学的一个分支，它研究如何使计算机具备像人类一样思考、学习、推理和决策的能力。人工智能

发表于 11-14 16:39

智能系统与人工智能的关系

在当今数字化时代，智能系统和人工智能（AI）已成为推动社会发展的关键力量。它们在各个领域发挥着重要作用，从提高生产效率到改善人们的生活质量。然而，许多人可能会混淆智能

发表于 10-29 09:57 •344次阅读

《AI for Science：人工智能驱动科学创新》第6章人AI与能源科学读后感

、优化等方面的应用有了更清晰的认识。特别是书中提到的基于大数据和机器学习的能源管理系统，通过实时监测和分析能源数据，实现了能源的高效利用和智能化管理。其次，第6章通过多个案例展示了人工智能在能源科学中

发表于 10-14 09:27

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

很幸运社区给我一个阅读此书的机会，感谢平台。《AI for Science：人工智能驱动科学创新》第4章关于AI与生命科学的部分，为我们揭示了人工智能技术在生命科学领域中的广泛应用和深远影响。在

发表于 10-14 09:21

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

的发展机遇。同时，这也要求科研人员、政策制定者和社会各界共同努力，构建一个健康、包容的AI科研生态系统。总之，《AI for Science：人工智能驱动科学创新》的第一章为我打开了一个

发表于 10-14 09:12

risc-v在人工智能图像处理应用前景分析

满足人工智能图像处理中对于高性能、低功耗和特定功能的需求。低功耗：在人工智能图像处理中，低功耗是一个重要的考量因素。RISC-V架构的设计使其在处理任务时能够保持较低的功耗水平，这对于需要

发表于 09-28 11:00

人工智能ai4s试读申请

目前人工智能在绘画对话等大模型领域应用广阔，ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题，本书对ai4s基本原理和原则，方法进行描诉，有利于总结经验，拟按照要求准备相关体会材料。看能否有助于入门和提高ss

发表于 09-09 15:36

名单公布！【书籍评测活动NO.44】AI for Science：人工智能驱动科学创新

芯片设计的自动化水平、优化半导体制造和封测的工艺和水平、寻找新一代半导体材料等方面提供帮助。第6章介绍了人工智能在化石能源科学研究、可再生能源科学研究、能源转型三个方面的落地应用。第7章从环境监测

发表于 09-09 13:54

报名开启！深圳（国际）通用人工智能大会将启幕，国内外大咖齐聚话AI

8月28日至30日，2024深圳（国际）通用人工智能大会暨深圳（国际）通用人工智能产业博览会将在深圳国际会展中心（宝安）举办。大会以“魅力AI·无限未来”为主题，致力于打造全球通用人工智能领域集产品

发表于 08-22 15:00

FPGA在人工智能中的应用有哪些？

FPGA（现场可编程门阵列）在人工智能领域的应用非常广泛，主要体现在以下几个方面：一、深度学习加速训练和推理过程加速：FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和低延迟特性

发表于 07-29 17:05

5G智能物联网课程之Aidlux下人工智能开发（SC171开发套件V2）

12分32秒 https://t.elecfans.com/v/25611.html *附件：芯片模组外观检测实训.pdf 人工智能 机器人：基于融合系统的机器人仿真实训 38分02秒 https

发表于 05-10 16:46

5G智能物联网课程之Aidlux下人工智能开发（SC171开发套件V1）

/25611.html *附件：芯片模组外观检测实训.pdf 人工智能 机器人：基于融合系统的机器人仿真实训 38分02秒 https://t.elecfans.com/v/25521.html *附件：机器人

发表于 04-01 10:40

创龙教仪基于瑞芯微3568的ARM Cortex A-55教学实验箱适用于人工智能 传感器物联网等领域

采用ARM架构的通用型SoC，主要应用于智能硬件和工业应用。CPU采用四核A55架构处理器，集成Mali G52图形处理器和独立的人工智能NPU处理器。RK3568J支持三屏异显，支持CAN、UART

发表于 03-22 14:29

嵌入式人工智能的就业方向有哪些?

嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下，嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下，众多名企也纷纷在嵌入式人工智能领域布局

发表于 02-26 10:17

搜索历史

四个顶级人工智能系统的仇恨言论检测能力依然很差

评论

2025年人工智能在工程领域的应用趋势

嵌入式和人工智能究竟是什么关系?

智能系统与人工智能的关系

《AI for Science：人工智能驱动科学创新》第6章人AI与能源科学读后感

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

risc-v在人工智能图像处理应用前景分析

人工智能ai4s试读申请

名单公布！【书籍评测活动NO.44】AI for Science：人工智能驱动科学创新

报名开启！深圳（国际）通用人工智能大会将启幕，国内外大咖齐聚话AI

FPGA在人工智能中的应用有哪些？

5G智能物联网课程之Aidlux下人工智能开发（SC171开发套件V2）

5G智能物联网课程之Aidlux下人工智能开发（SC171开发套件V1）

创龙教仪基于瑞芯微3568的ARM Cortex A-55教学实验箱适用于人工智能传感器物联网等领域

嵌入式人工智能的就业方向有哪些?