AI越来越推广普及，我们需注意机器模型中不断涌现的人类偏见-电子发烧友网

随着人工智能在企业和社会的应用变得越来越普遍，企业需要注意机器模型中不断涌现的人类偏见。企业可以利用人类的智慧来获取训练算法所需的各种数据和输入。

有一些方法可以避免数据集中的偏差。

在训练人工智能（AI）算法时，取决于数据的输入。在业务环境中尤其如此，在这种情况下，人工智能的目的可能是与客户互动，管理自动化系统或模仿人工决策。成果与目标相符至关重要。但是，至关重要的是，企业必须能够解决任何可能歪曲人工智能对指令或请求的响应方式的偏见。

任何新产品的设计和开发阶段都是至关重要的，因为它使企业可以运行测试、识别并消除任何缺陷。如果由于某种原因而忽略了设计缺陷或产品出现故障，则可以快速解决。可以召回有故障的设备，同时可以发布更新和补丁来修复任何软件问题。对于典型的软件版本而言，这一切都很好，但是处理人工智能算法并不是那么简单。

人工智能算法是高度复杂的系统，旨在基于机器学习（ML）执行非常具体的任务。试图消除人工智能投入运行后所产生的任何数量的偏差可能既昂贵又费时;对于“学习”的技术而言，这也违反直觉。在设计和开发阶段采用适当的流程来检测并消除偏差会更加有效。

偏见对企业不利

人工智能的基本目的和功能被引入其基础算法中。如果人工智能要发展出固有的偏差，它将对算法产生不利影响。这可能会严重影响人工智能预期提供的精度和效率，从而限制人工智能满足其商业需求的能力，所有这些都对业务不利。

尽管有开发人员的最佳意图，偏见总能找到一种渗透人工智能算法的方法。与任何学习过程一样，学生也会受到其老师的影响。认可机构的教育范围取决于其课程设置。毫不奇怪，课程越多样化，学生越开明。同样，更大、更多样化的数据集有助于产生更精确、更高效的人工智能算法，从而能够做出更明智的决策。

培训数据和测试结果

每个成功的人工智能算法都建立在训练数据的基础上。但是，采购满足业务要求的数据可能会给物流和间接费用带来巨大挑战，尤其是如果这些要求包括满足大众市场的需求时。

内部开发人员团队，软件工程师和质量保证专家通常来自相同的年龄范围，性别和背景。偏差经常发生在数据收集和数据标记过程中。因此，在构建人工智能算法时，最好不要依赖某一个人或一个小组来提供将用于训练算法的数据。为了正确地训练算法，需要不同类型的数据和输入。

使用为人工智能算法提供与最终服务的客户更接近的人员和体验的暴露能力的模型，将会更有效率。企业可以使用这一模型来训练他们的算法，以响应现实情况，检测出偏差发生的地方并减少其潜在影响。

社区构建的算法

培训数据的成功获取和实施取决于数据本身的数量、质量和多样性。企业获取和处理此数据的唯一方法是利用多样化的参与者。企业需要能够从向其提供特定人口统计信息的社区中进行选择，包括性别、种族、母语、位置、技能、地理位置以及其他适用的过滤条件。

实际上，开发有效的算法需要大量数据。大多数企业没有能力大规模地获取数据。他们需要专用资源的支持才能交付新的软件和服务。最近的一个培训用于媒体和广播服务的智能语音助手的项目需要超过10万种不同的语音。这些话语最终由972个人提供，这些人被远程组装以训练算法。令人难以置信的壮举是，尽管可以在实验室中对语音进行某种程度的模拟，但人工智能仍然需要暴露于各种真实的声音和口音中。

言语训练只是教学大纲的一方面。众包解决方案还可以帮助企业训练人工智能算法以读取手写文档。最近的另一个项目需要数千个手写样本。数量再次成为关键因素，因为该算法需要尽可能广泛的唯一样本。远程聚集了1，000多名参与者，以提供手写文档并满足对各种内容的需求。

公正的结果

删除可能会降低人工智能最终结果准确性的意外偏差很重要。它将永远不会是完美的，但是人工智能会不断学习，并且最好的机器模型是基于大量多样数据集的模型。最好的策略是从提供数量、质量和多样性的池中获取培训数据。如果训练数据没有多样性，该算法将无法识别广泛的可能性，从而使该算法无效。远程社区使企业可以访问此数据，并补充内部开发和测试功能。众包测试可用于训练人工智能算法以研究和识别语音、文本、图像和生物识别，从而为企业提供强大的输出，可满足不同客户群的需求。
责编AJX

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30763

浏览量
268917
模型

模型

+关注

关注
1

文章
3229

浏览量
48813
机器学习

机器学习

+关注

关注
66

文章
8408

浏览量
132580

【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮！

，为学生和研究人员提供系统的学习资源，培养更多的专业人才。同时，随着具身智能机器人技术对社会的影响越来越大，通过本书可以向公众普及相关知识，提升社会对新技术的认知和接受度，为技术的发展创造良好

发表于 11-11 10:20

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

人工智能在科学研究中的核心技术，包括机器学习、深度学习、神经网络等。这些技术构成了AI for Science的基石，使得AI能够处理和分析复杂的数据集，从而发现隐藏在数据

发表于 10-14 09:16

AI普及给嵌入式设计人员带来新挑战

。从监控和访问控制到智能工厂和预测性维护，基于机器学习（ML）模型构建的人工智能（AI）在工业物联网边缘处理应用中已变得无处不在。随着

发表于 08-22 14:20 •663次阅读

<b class='flag-5'>AI</b><b class='flag-5'>普及</b>给嵌入式设计人员带来新挑战

我们的城市为什么越来越热？

全球气候在变暖，我们焚烧石油，煤炭等化石燃料，产生了大量二氧化碳等温室气体，导致全球气候变暖，尤其大陆气温升高，城市变得越来越热。图：上海前滩的夜晚，被太阳晒热的建筑热岛效应夏天天太热，在阳光

发表于 08-03 08:14 •541次阅读

<b class='flag-5'>我们</b>的城市为什么<b class='flag-5'>越来越</b>热？

Al大模型机器人

和迭代来不断改进自身性能。它们可以从用户交互中学习并根据反馈进行调整，以提高对话质量和准确性。可定制性与整合性: AI大模型机器人可以根据特定需求进行定制和整合，以满足不同场景和应用的

发表于 07-05 08:52

【大语言模型：原理与工程实践】核心技术综述

中应用，需要考虑到性能、可扩展性和安全性等因素。大语言模型正在快速发展，新技术不断涌现。未来的研究可能集中在提高模型效率、理解和可解释性以及确保

发表于 05-05 10:56

【大语言模型：原理与工程实践】揭开大语言模型的面纱

，生成能力则使其能生成新的、连贯的文本，而涌现性则让模型能生成未曾出现但逻辑上合理的内容。从早期的统计模型到如今的大语言模型，AI领域

发表于 05-04 23:55

基于百度AI大模型生态支持，极越汽车机器人迎来一次全新进化

基于百度AI大模型生态支持，极越汽车机器人又迎来了一次全新进化。3月25日，极越在北京举办AI DAY 2024。

发表于 03-28 09:52 •675次阅读

AMR智能仓储机器人为什么会越来越受欢迎?

AMR智能仓储机器人之所以越来越受欢迎，主要是因为它们具有以下几个优势： 1.提高工作效率： AMR智能仓储机器人可以在仓库环境中自主导航和执行任务，无需人工干预。它们可以快速而准确地

发表于 03-25 16:56 •527次阅读

嵌入式会越来越卷吗?

嵌入式会越来越卷吗? 当谈及嵌入式系统时，我们探究的不仅是一种科技，更是一个日益多元与普及的趋势。嵌入式系统，作为一种融入更大系统中的计算机硬件和软件，旨在执行特定功能或任务。但这个看

发表于 03-18 16:41

我们该如何应对SOC中越来越庞大和复杂的SDC约束？

SOC设计变得越来越复杂，成本越来越高，设计和验证也越来越困难。

发表于 03-13 14:52 •1138次阅读

工业机器人应用中的AI边缘控制器：技术创新与效率提升的双重驱动

工业机器人应用中的AI边缘控制器：技术创新与效率提升的双重驱动随着科技的不断进步，AI边缘控制器在工业

发表于 03-08 10:45 •780次阅读

IC datasheet为什么越来越薄了？

刚毕业的时候IC spec动则三四百页甚至一千页，这种设置和使用方法很详尽，但是这几年IC datasheet为什么越来越薄了，还分成了IC功能介绍、code设置、工厂量产等等规格书，很多东西都藏着掖着，想了解个IC什么东西都要发邮件给供应商，大家有知道这事为什么的吗？

发表于 03-06 13:55

微软：打造负责任的人工智能确保技术创新造福全人类

在全球各界为OpenAI Sora展现出的非凡创造力叹为观止的同时，越来越多的人也不禁开始思考，随着五花八门的AIGC内容加速涌现，我们该如何保证A

发表于 03-01 15:18 •1084次阅读

人形机器人成为车圈“新宠”？

现在的人形机器人不仅形态更接近人类，而且具备更多的智慧。随着大型AI模型的不断推进，人工智能正在

发表于 02-22 09:22 •390次阅读