0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么将AI注入到IT运营中比数据本身更多的是数据

倩倩 来源:新经网 2020-07-14 16:44 次阅读

我与之交谈的几乎每个CIO都大胆地宣称他们的企业是“数据驱动的企业”。但是,毕马威会计师事务所(KPMG)最近进行的 全球CEO前景 调查却截然不同:全球67%的CEO(美国的这一数字跃升至78%)表明,他们忽略了由CIO /他们提供的数据驱动的分析和预测模型IT团队,因为这与他们自己的经验相矛盾;他们根据自己的直觉做出了重大的企业决策。

忽略了数据驱动的见解而遵循直觉的CEO

虽然结果有些令人震惊,但可以很容易地解释它。首先,尽管企业生产的数据量足够多,但是数据仍然在业务单元,域,平台和实现(例如云与私有数据中心)之间非常分散。根据Forrester的说法,多达73%的公司数据未用于分析和见解。难怪首席执行官仅使用总数据的27%生成的模型就获得了可怕的结果!其次,大多数当前的预测模型仅使用历史数据,而不使用流(实时)数据。这两个重要因素导致预测的准确性不高。首席执行官如果不信任模型,就无法做出决策,因为他们业务的成败取决于他们做出的决策。

更多数据可以带来更好的预测

尽管是IT运营使其他企业AI计划保持平稳运行,但实施AI以改善其自身的运营速度却很慢。原因之一是上述数据零散。当向AI / ML模型提供部分数据时,您只会获得企业的部分视图。另一个主要原因是因为当前大多数AI / ML实施都是为了创新,并且通常由BU资助。传统上,企业将IT视为成本中心,因此他们不愿意花钱来使用AI来改善运营。但是,随着大量的数据,以及当前的大流行病产生了更多的未连接的远程数据,这种感觉在开始淹没Ops团队时发生了变化。IT运营团队正在达到一个临界点,要处理的数据过多,这是AI的理想方案。这是AI和ML的最佳选择。人工智能在大量数据上蓬勃发展。实际上,向AI算法馈送的数据越多,模型就越好。

传统上,IT运营团队多年来一直监视IT基础结构监视(ITIM)和网络性能监视与诊断(NPMD)层。在过去的十年中,应用程序性能管理(APM)帮助提高了每个应用程序的可见性。但是,即使所有这些系统都表明它们正常工作,客户仍会根据位置,连接类型(移动/互联网),所使用的缓存/ CDN提供程序的类型等而遇到问题。现代应用程序及其组件的复杂性加载到客户视图中会使其变得非常复杂。数字体验监视(DEM)的概念已获得可见性,可以专门监视,分析和优化客户体验。但是,它们更像是监视工具,而不是诊断工具。

AIOps(IT运营中的人工智能)解决方案可以帮助解决此问题。一个好的AIOps解决方案应该能够从多个来源获取数据,消除噪声,关联事件序列并基于历史数据和实时数据的组合产生可行的见解。

数据采集

可以说,这是最重要的一步。不仅需要将历史数据馈送给AI进行模型创建,而且还需要将实时数据馈给AI进行推理和更新模型。仅像过去那样收集日志或SNMP并不能提供企业的全面情况。收集尽可能多的信息,包括事件,日志,时间序列数据,应用程序数据,性能数据,利用率数据等。新的基于事件的范式转移到发布/订阅或基于事件的消息传递。尽管这些消息非常重要,但它们对于收集实时数据以提供企业的完整视图并做出准确的预测绝对至关重要。大多数基于云的系统,无论是基于容器的还是基于虚拟机的,都通过API提供大量信息。

收集结构化,半结构化和非结构化数据。尽管现有的BI和分析系统在处理非结构化数据时遇到困难,但AI还是喜欢它。它可以解析几乎所有内容,包括音频视频,文本文件,图像,配置文件,文档,PDF文件等。

最后,大多数团队忘记将配置记录,变更管理系统,CMBD等作为等式的一部分。这对于每天有时会推动多个发布周期的敏捷团队尤其重要。除非IT运营团队意识到最近的变化,否则他们将浪费大量时间试图找出问题的根本原因。

数据质量和数据摄取

AI存在数据质量问题。创建AI / ML模型时,“垃圾填埋,垃圾填埋”是非常正确的。您的算法有多好或数据科学家有多好都无关紧要。如果您没有提供足够的质量数据,那么您将一无所获。当企业收集大量数据时,它仍然是不完整,不正确和/或不一致的。您还需要收集相邻和相关的数据。您可能会认为它们无关紧要,但是对于AI使用看似无关的数据所能找到的东西,您会感到惊讶。一个例子是,当NASA卫星破裂时,IBM的AI工程师和NASA科学家找到了一种方法,可以利用太阳光以98%的准确度来计算紫外线强度。我最近写了一篇关于此的文章,可以在这里看到。

如果您与数据科学家交谈,他们会告诉您他们花了多少时间准备数据。他们多达80%的时间用于准备数据,而不是分析数据或创建和微调模型。

数据分类和标签

数据需要正确分类,分类和标记,以便AI / ML从中学习。对于监督学习模型尤其如此。在训练,验证和调整模型之前,这是重要的一步。标签的准确性和质量是最重要的两件事。准确性衡量的是标签与真实情况之间的接近程度,或与您的企业事实和/或实际条件匹配的程度。质量与用于模型的整个数据集的标注准确性有关。当您结合使用自动,外包和内部标签工作时,尤其如此。所有组都会在整个数据集中一致地标记吗?

数据清理

如果使用偏差数据训练AI模型,则无疑会产生偏差模型。我写了一篇有关如何避免这种情况并使您的数据失偏的文章。原始数据可能包含隐性偏见信息,例如种族,性别,出身,政治,社会或其他意识形态偏见。消除它们的唯一方法是分析不平等并在创建模型之前对其进行修复。如果不从数据中消除歧视性做法,该模型将倾向于产生有偏见的结果。

仅当数据来自经验证,权威,经过验证和可靠的来源时,才应包括在内。来自不可靠来源的数据应该完全消除,或者在输入模型时应给予较低的置信度。另外,通过控制分类精度,可以以最小的增量成本来大大减少辨别力。这种数据预处理优化应集中在控制区分,限制数据集中的失真和保留实用程序上。

资料储存库

考虑到数据的数量,速度和种类,用于数据存储和数据管理的传统现场解决方案不适用于数字本机解决方案。许多公司已采用数据湖解决方案来解决此问题。尽管单个集中的数据源可以提供帮助,但需要对其进行适当的安全保护,管理和定期更新。它应该能够无缝处理结构化和非结构化数据。

结论

人工智能需要大量数据。正如我最喜欢的《短路》中的角色Johnny V(基于AI的机器人)说:“我需要更多的输入……”。如果您的高管要基于此做出重大的企业决策,请确保为AI提供正确数量和质量的数据。如果没有,他们将忽略您的模型输出/建议并做出自己的决定,从而最大程度地降低您的价值,并最终使您获得数字化和改善业务所需的资金。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30947

    浏览量

    269217
  • 数据驱动
    +关注

    关注

    0

    文章

    127

    浏览量

    12341
收藏 人收藏

    评论

    相关推荐

    数据驱动AI工具在哪

    数据驱动AI工具并不遥远,它们就存在于我们的日常生活中,只是我们可能没有意识。这些工具通常被嵌入各种应用程序、软件和服务中,为我们提供便利。接下来,
    的头像 发表于 12-09 10:52 138次阅读

    维智科技用数据+AI驱动业务增长

    在当今数字化时代,以数据驱动业务增长和品牌影响力提升成为企业竞争的关键手段,利用AI进行精准决策也成为企业降低运营成本的重要抓手。
    的头像 发表于 11-25 14:07 222次阅读

    LumenAI光纤交易链接亚马逊数据中心

    近日,据相关报道,Lumen公司计划在最新的AI光纤交易中,与亚马逊数据中心建立紧密的链接。这一举措无疑进一步提升数据传输的效率和速度,为互联网行业
    的头像 发表于 10-31 11:29 411次阅读

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    的深入发展。 3. 挑战与机遇并存 尽管AI在生命科学领域取得了显著的成果,但也面临着诸多挑战。例如,数据隐私、算法偏见、伦理道德等问题都需要我们认真思考和解决。同时,如何更好地AI
    发表于 10-14 09:21

    AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    和数量直接影响模型的准确性和可靠性。因此,数据获取、处理、分析和质量控制在AI for Science中至关重要。此外,数据驱动的研究范式也促使科学家从传统的假设驱动转向更加灵活和开
    发表于 10-14 09:16

    ALVA的AI+AR应用助力企业实现数据价值转化

    当下,工业正经历着从数字化、网络化向智能化发展的变革。AI 整合数据资源,深入分析和挖掘图纸文件、运行数据、运维资料等内容的内在价值。AR 复用
    的头像 发表于 08-29 15:08 406次阅读

    在FX3S上如何通过USB和GPIF数据存储eMMC中?

    我使用的是赛普拉斯 FX3S。 S0 端口连接了 eMMC,FX3S 还连接了 TI DSP(TMS320C28346ZFE)。 我想通过 USB 数据和/或文件从主机 PC 存储 eMMC,并
    发表于 07-23 07:57

    esp8266怎么做才能每秒发送更多数据包呢?

    在我的项目中,我需要通过WIFI实时传输大量数据。在 esp8266 参考手册中指出,我可以 UART 波特率提高 4 Mbits 左右,以实现更快的通信。 问题是,增加波特率不会改变整体发送
    发表于 07-22 08:00

    平衡创新与伦理:AI时代的隐私保护和算法公平

    ,如果医生和患者都能了解AI推荐治疗方案的原因,大大增加对技术的接受度和信任。 算法公平性的保障同样不可或缺。AI系统在设计时就需要考虑多样性和包容性,避免因为训练
    发表于 07-16 15:07

    AI时代,我们需要怎样的数据中心?AI重新定义数据中心

    超过60%的中国企业计划在未来12至24个月内部署生成式人工智能。AI、模型的构建,颠覆数据中心基础设施的建设、运维和运营。一个全新的数据
    发表于 07-16 11:33 716次阅读
    <b class='flag-5'>AI</b>时代,我们需要怎样的<b class='flag-5'>数据</b>中心?<b class='flag-5'>AI</b>重新定义<b class='flag-5'>数据</b>中心

    格式化数据存储char数组的最简单方法是什么?

    os_printf文本格式化为 UART 输出的函数。 格式化数据存储 char 数组的最简单方法是什么?
    发表于 07-11 08:01

    夏普与KDDI共同努力 堺工厂改建为英伟达AI数据中心

    近日,夏普公司对外公布其位于日本堺市的制造工厂将会暂停运营,这家工厂主要负责生产高端彩色电视液晶显示器用的大型LCD面板。据了解,为了适应市场需求的变化,夏普公司正计划与日本知名电信运营商KDDI携手合作,堺工厂改造升级成为一
    的头像 发表于 06-03 16:29 674次阅读

    如何数据传入单片机的模型中去输出?

    怎么数据传入移植单片机中的模型中去并输出
    发表于 03-25 06:26

    数据赋能:构建数据治理与AI的协同闭环

    在数字化浪潮中,数据已成为企业的新型燃料,而AI则是提炼这种燃料的精炼厂。数据治理与AI的协同作用,正在引领企业迈向更智能、更高效的未来。本文
    的头像 发表于 03-15 10:47 490次阅读

    NanoEdge AI的技术原理、应用场景及优势

    NanoEdge AI 是一种基于边缘计算的人工智能技术,旨在人工智能算法应用于物联网(IoT)设备和传感器。这种技术的核心思想是数据处理和分析从云端转移到设备
    发表于 03-12 08:09