0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

直播精彩回顾(四)| 虹科Flow——数据管道的可观察性解决方案

广州虹科电子 2022-03-16 09:54 次阅读

本期虹科云课堂直播课程即将接近尾声。3月10日,“【虹科云课堂】虹科Flow——数据管道的可观察性解决方案”直播课程圆满结束,感谢大家的观看与支持。虹小科为大家整理了课后笔记,请查收

导语

虹科云课堂

前面两节直播给大家介绍过我们的pulse和torch,pulse是一款计算性能监控产品,可以帮助企业消除计划外停机,降低基础设施成本并提高效率,torch是管理数据质量的一款产品,它超越数据监控,能对静态数据、动态数据进行自动分类、编目和管理业务规则,跨数据湖、存储库监控企业数据,助力企业数字化转型。那么今天给大家介绍一款产品,Flow,它是关于数据管道的可观察性解决方案。

那么它如何帮助企业优化数据管道性能呢?我们先不说答案,把文章看完,你就明白了,最后我们会总结这个问题的答案。

本文围绕3部分展开

虹科云课堂

1、Flow产品介绍

2、Flow介绍功能详解

(数据可观察性相关概念可见之前直播)

01

F产品介绍

虹科云课堂

5fa0cea6-a484-11ec-8b86-dac502259ad0.jpg5fbf7086-a484-11ec-8b86-dac502259ad0.jpg

这里列举了一些企业平时可能会遇到的业务挑战,首先是不可靠的数据管道和爆炸式增长的成本,为了满足企业内部数据供应的持续爆炸式增长,供应商发布了各种工具,使数据管道的创建比以往任何时候都更加容易。因此,现代数据架构迅速膨胀,在短时间内变得越来越大、越来越复杂。新形式的数据管道也更容易出现问题。例如,如果出现硬件网络故障,实时事件流很容易丢失数据。第二个数据工程师依赖于耗时的手动数据操作和故障排除过程,花费太多时间查找和修复错误,陷入与数据准备和管道相关的手动重复流程。

第三个是数据和业务策略的制定不准确,数据管道中断、数据损坏和其他问题可能会在更多地方以更高的速度发生。追踪根本原因和修复问题可能非常耗时。这让数据工程师没有时间来扩展或优化业务线要求的更具战略性的数据计划。还有就是在典型的大型企业中,数据处理的纪律性不足。由于缺乏对可用数据的可见性和理解,企业数据在大多数关键决策过程中都没有得到有效利用。

最后一个是数据投资的回报较低,如今大多数公司都运行着庞大的混合基础设施。他们将数据存储在本地、托管服务器和 SaaS 云中。他们使用老式 SQL 关系数据库、新式 NoSQL 键值存储和尖端云数据仓库(如 Snowflake)提供数据。使用 Kafka 流式传输实时数据,并从 Databricks 湖库中提供 ML 应用程序,所有这些都以成为数据驱动的数字企业的名义。然而,他们部署的云原生数据应用程序越先进,其基础设施就越复杂。云成本是动态的,使预测变得不稳定,基于利用率的定价,也使得预算比服务器等资本投资或托管虚拟机典型的固定月费更难。近乎无限的可扩展性和即用即付定价相结合,使云成本高度波动。以至于现在管理 IT 成本和最大限度地提高投资回报率非常困难。

那么我们应该如何才能利用好数据做出正确、并且控制我们的成本和回报率的决策呢,可以试试利用Flow帮助我们。

5fed8214-a484-11ec-8b86-dac502259ad0.jpg

Flow 是一种软件开发工具包,可让团队观察数据管道的健康状况和性能。Flow 通过集成和监控现有工作流平台的性能,帮助数据工程师解决管道问题并优化资源。该工具利用开源工作流平台,如 Apache Airflow,并使用 API、数据源和转换工具来构建自定义工作流。

数据质量问题和管道故障的一个主要原因是这些管道内的转换。今天的大多数数据架构都是不透明的——你无法知道里面发生了什么。转型正在发生,但当事情不如预期时,数据工程师并没有太多的背景来解释原因。

太多的 DataOps 团队花费太多时间尝试在没有上下文的情况下诊断问题。而且,如果您遵循您的第一直觉并使用软件应用程序性能管理工具 (APM) 来监控 DataOps 管道,那么它很少会奏效。

管道测试框架允许数据工程师测试二进制语句。例如,列中的所有值是否唯一,或者模式是否匹配某个表达式。当测试失败时,数据被标记为“坏”。有了这些信息,数据工程团队可以诊断出质量较差的数据并采取必要的步骤来解决问题。在管道中的不同步骤重复测试,这使数据工程师可以很容易地清楚地看到数据在管道的哪个阶段/层破坏,并找到最合适的人来解决问题。

Flow通过提供对底层数据管道的全面可见性,帮助企业优化业务流程性能、降低成本并最大限度地提高数据投资回报。由于它预先与 Pulse 和 Torch 集成,因此数据团队不仅可以评估数据管道的完整性,还可以通过统一的用户界面发现影响性能的底层数据处理或数据质量问题。

数据管道可观察性研究支持分析的数据管道的性能、可用性和利用率。数据工程师使用数据管道可观察性产品来优化数据交付以及支持管道的容器、存储、计算和网络资源的性能。

Flow可以帮助企业追踪数据的生命周期,并且能够监控管道中的数据交互、数据模式和业务事件等等。它有以下三个特点,首先他能提高数据的可见性,跨混合数据湖和仓库监控数据,以确保质量和可靠性。第二个特点是它能提高管道效率和可靠性,在问题影响性能之前预测并解决问题。最后一个特点是它使数据管道与业务目标保持一致,通过识别和消除瓶颈来降低数据管道成本,并针对资源、成本和时间等方面去优化数据管道性能,并且进行自动化操作,以更少的资源管理数以千计的数据管道。

6004d72a-a484-11ec-8b86-dac502259ad0.jpg

接下来看一下Flow的应用场景,第一个是电信、金融服务、能源、物联网电子商务行业以及任何依赖大量静止数据和动态数据以满足运营和分析需求的企业,第二个是使用 Airflow, Amazon Kinesis, Amazon Redshift, Amazon Web Services-Kafka, Apache HBase, Apache Spark的公司都可以考虑采用flow来检测我们的数据管道并确保跨混合数据湖和仓库的数据可靠性。

今天,数据工程师、分析师和数据科学家花费数小时和数天来调试数据管道问题。数据精度错误也可能被忽视,在解释仪表板时需要人工判断。错过的 SLA 可能会导致难以发现和修复根本原因。现有的监控系统可以帮助解决黑白问题,即基于症状的警报适用于明确定义的问题,例如对失败的作业或零行表的警报。大多数现实世界的问题都属于灰色区域,现有的监控解决方案是不够的,因为无法预测每一种故障模式或系统可能出现异常行为的每一种可能方式。例如,数据仓库超载导致作业完成延迟——依赖作业错误地开始处理数据,导致结果稍有不正确。任何监控事件都不会生成警报,但最终结果是数据不准确。

可观察性不仅仅是对监控的重新命名。可观察性侧重于提供对系统行为的高度精细的洞察以及丰富的上下文。可观察性侧重于分布式跟踪以生成用于调试的结构化事件。

Flow功能详解

虹科云课堂

02

602dcfc2-a484-11ec-8b86-dac502259ad0.jpg

我们希望帮助组织建成可靠的数据管道,我们希望帮助他们更快地扩展和创新,我们也希望帮助他们提高效率,降低他们的成本,所以基本上在流程中的两个部分,首先是可见性,然后第二个是能够查看不同的管道,能够做交易,或者查看一个管道和另一个管道之间的交易,然后是成本效益分析。你想确保运行速度快或准时,你想确保管道中的数据是健康的,质量好的,所以这是唯一一个真正将性能和质量结合到管道健康状况的单一视图中的产品,所以粉红色的气泡显示管道中发生的过程,绿色的盒子显示数据。我们可以在一个视图中向你展示处理过程的健康状况和数据的健康状况,然后基本上可以让你向下钻研,查看数据质量的Torch,查看处理过程的性能,所以这是在高层次上。关于我们的管道,我想说的是,有些产品可以让你在静态视图中查看线路或管道,但我们在每次运行管道时都会捕捉到围绕管道的每个执行的指标。

这里有一个管道视图,我们为管道每次运行的历史记录,当你运行时,当你看一个特定数据管道的执行过程,我们可以告诉你这是如何执行的,在整个过程中每一步的时间是什么,总体上是什么。我们还可以让你进行比较,所以如果你想知道为什么今天比昨天花的时间长,可以让你弄清楚流程中或管道中的什么地方。它的流程或你知道什么是可能运行得更快或不同的,它也有助于你在设计时,所以如果你设计,如果你正在寻找2个不同的架构和2个不同的管道与不同的技术,也可能是两种不同的云,比如一个在阿里云一个在华为云,你可以比较,看哪一个表现更好,哪一个更快和在哪些领域,哪一个性能更好,哪一个运行成本更低,这些都可以帮助你优化你的设计,以及从性能的角度解决任何问题,然后你可以深入到任何特定的过程,看看这个过程是在哪里执行的,围绕这个过程做进一步的分析。通过比较一种架构与另一种架构的价格和性能以及每种架构的相应迁移成本来优化设计。这也有助于权衡增加新技术的好处和技术蔓延的坏处。这使你能够合理调整现代化的短期投资,以获得长期的收益,同时最大限度地减少技术蔓延。

如果你想点击任何特定的资产,我们会告诉你它是什么时候被剖析的,如果它有数据质量应用或和解政策,基本上确保数据从a点到b点。我们让你全面了解该资产的健康状况,然后我们还让你深入了解数据质量,所以这是流量的一个快速视图,基本上是你的管道的运营视图的综合视图,能够看到每个执行,能够看到处理或计算性能健康,质量健康,并能够深入了解每个过程。

604a9a94-a484-11ec-8b86-dac502259ad0.jpg

Flow提供的价值和关键功能如图所示,

第一个是它能消除数据停机时间,在问题影响性能或导致计划外中断之前,预测和预防这些问题。通过监控 SLA/SLO 并轻松、即时地识别异常,并跟踪每个数据交易、握手和转换,实现实时监控数据模式、分布和业务事件;第二个是他能优化数据工程生产力,自动化管道检测,并通过数据传输、转换、数据移动和复制生成高保真的遥测数据。flow可以立即识别和修复数据管道问题,即时创建和跟踪自定义业务事件,并且与开箱即用的流行 ETL 工具集成;然后是它简化数据管道操作,使用统一控制台进行监控、调查和补救。最后一个是它可以与流行的工具和平台集成,轻松连接与常用的ETL和ELT工具,定制管道建立在Databricks,Snowpipe,Hive,Spark,and orchestration engines, such as Airflow and Oozie之上。

刚刚有说到一个问题,动态的云成本让我们的数据回报率比较低,那么应该如何解决这种问题呢,首先我们需要为数据工程师提供多维数据可观察性平台比如说Flow,让他们能够精细地了解云数据成本。让数据团队继续快速行动,同时保持在既定的财务范围内。

第二步是让成本优化成为数据工程文化中的一流指标。成本优化必须从设计阶段开始。在工程阶段之后,它不能被动地完成。

第三步是通过使用数据可观察性,节省调查支出异常的时间。这可以提供自动化的根本原因分析,以确定潜在的成本驱动因素,例如服务类型、特定的仓库计算成本等。假如公司需要迁移数据到云上,我们通过比较一种架构与另一种架构的价格和性能以及每种架构的相应迁移成本来优化设计。这也有助于权衡添加新技术的好处与技术蔓延的不利因素。这使您能够适当调整现代化的短期投资以获得长期收益,同时最大限度地减少技术蔓延。

第四步是通过电子邮件、Slack 和其他渠道的自动警报,让数据运营团队(DataOps) 随时了解意外成本事件

最后让数据团队与其业务线、FinOps、IT 等方面的合作伙伴安排定期财务审查。就有关云数据合同、预算和预测的所有事项进行沟通。

6077c852-a484-11ec-8b86-dac502259ad0.jpg

介绍一下虹科数据可观察性方案的特点:

第一个就是它可以快速、无缝地连接到你现有的堆栈,不需要修改你的管道,编写新的代码,或使用特定的编程语言。能够快速实现价值和最大的测试覆盖率,不需要进行大量投资。

第二个就是它监控你的静态数据,不需要从当前存储的地方提取数据。也就是说这个解决方案具有良好的性能、可扩展性和成本效益。它还能确保你满足最高级别的安全和合规要求。

它配置简单,实际上不需要设置阈值。它使用ML模型来自动学习你的系统环境和数据。并且使用异常检测技术,让你知道什么时候可能会出现问题。它不仅考虑到个别指标,而且考虑到你的数据的整体视图和任何特定问题的潜在影响,从而最大限度地减少错误的警报。你不需要花费资源去配置和维护复杂的规则。

它不需要事先对需要监测的内容和方式进行映射。它可以帮助你识别关键资源、关键依赖关系和关键不变量,这样你就可以用很少的人力精力获得广泛的可观察性。

它提供了丰富的上下文,能够快速分流和排除故障。

它通过公开关于数据资产的丰富信息来防止问题的发生,这样我们就可以主动地进行修改。

03

虹科方案为企业带来的好处

虹科云课堂

609da8a6-a484-11ec-8b86-dac502259ad0.jpg

通过我们这几次的直播,我们可以了解到企业在数字转型关键期面临的一些问题是可以通过我们的产品去解决的,这边也有一页PPT去总结我们这三个产品能够为企业提供的好处。

我们的产品可以从这四个层面对企业数据系统进行优化调整,它是监控和管理当今复杂数据存储和管道的一种全方位方法。它有助于预测、预防和自动解决数据性能问题及其相关的人工智能和分析工作负载。它使用自动化和机器学习来关联多个服务器、节点、集群、容器和应用程序中的数千个事件。

我们的解决方案提供了静态数据数据和动态数据数据、数据处理以及数据传输管道的360度视图。它创建解决方案并提供优化,以保持数据性能的准确性、一致性和可用性,因此数据操作和工程团队可以轻松满足其所有SLA。

真正的数据可观察性工具超越了传统的数据编目和质量工具,通过监控更广泛的数据风险,包括动态数据。他们还将更多任务自动化以减少手动工作,并使用机器学习来提高他们的检测能力——例如数据移动、结构变化(模式漂移)和数据趋势(数据漂移)等领域。总之,数据可观察性工具可以提供比其前辈更强大、更高效、更智能的数据管理能力。

我们不能忘记数据管道管理领域,数据可观察性工具在该领域是无可匹敌的。他们可以通过在整个过程中提供持续的数据验证来使管道更易于管理。它们还可以提高迁移到云的速度,降低数据存储和处理成本,同时实现您的 SLA。换句话说,减少云时代数据管道的管理时间和成本。

科技事业部

虹科电子

虹科在工业、制造业领域深耕了长达20年,随着云技术的全面发展和数字化工厂的逐步落地,虹科参与了越来越多的云主题的业务,从最初的所有数据先统一采集上云,到后续的边缘计算再上云,到现在的全面业务优化、洞察研究、成本优化等,虹科的云科技事业部已经为行业的用户实操并积累了丰富的解决方案和应用场景。它们包括:资源监控、安全保障、多云的互联互通、应用和数据牵引等。虹科云科技团队在不断顺应国家策略,从技术创新、标准制定、丰富生态、安全保障、节能减排等五个方面,不断创造出更好的产品,帮助工业制造业的用户实现数字化转型、实现基于数据的降本增效。

虹科云科技工程师团队不断参与美国和欧洲产业内先进的专家培训,学习和实践创新的技术手段、操作性强的应用案例,并不断引入到国内的项目中完成落地和推广,这让我们团队充满了自豪感与使命感,赋予了我们当今时代极大的技术价值、工作成就感。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6599

    浏览量

    87961
收藏 人收藏

    评论

    相关推荐

    直播 | 令你耳目一“新”的新能源车诊断分享

    上期直播回顾HongkePico6月20日晚,玉山连通车服技术总监,玩示波器的行者,应良卿老师做客Pico直播间,不仅与大家分享了采集从
    的头像 发表于 06-27 08:09 45次阅读
    <b class='flag-5'>虹</b><b class='flag-5'>科</b><b class='flag-5'>直播</b> | 令你耳目一“新”的新能源车诊断分享

    新品 | E-Val Pro Plus有线验证解决方案

    有线验证解决方案E-ValProPlus我们很高兴地宣布,我们将推出全新的
    的头像 发表于 04-19 08:04 156次阅读
    <b class='flag-5'>虹</b><b class='flag-5'>科</b>新品 | E-Val Pro Plus有线验证<b class='flag-5'>解决方案</b>

    方案 | 符合医药行业规范的液氮罐运输和存储温度监测解决方案

    在医药行业,液氮罐用于运输和存储敏感生物样本和药品,需保持极低温度。的液氮罐温度监测解决方案不仅符合行业规范,还解决了极端低温下的挑战。了解如何保障产品质量、安全,满足合规要求,
    的头像 发表于 04-17 13:08 138次阅读
    <b class='flag-5'>虹</b><b class='flag-5'>科</b><b class='flag-5'>方案</b> | 符合医药行业规范的液氮罐运输和存储温度监测<b class='flag-5'>解决方案</b>

    解决方案 | 经销商(OEM)解决方案

    免拆诊断解决方案在这里你可以找到我们汽车NVH测试产品的相关信息。Pico的汽车振动异响(NVH)测试仪可以捕捉汽车的所有振动和噪音
    的头像 发表于 11-18 08:08 226次阅读
    <b class='flag-5'>虹</b><b class='flag-5'>科</b><b class='flag-5'>解决方案</b> | 经销商(OEM)<b class='flag-5'>解决方案</b>

    方案 | 汽车CAN/LIN总线数据采集解决方案

    基于PCAN和PLIN设备,提供了一种高效、可靠的汽车CAN/LIN总线数据采集解决方案,旨在帮助您轻松实现数据采集和分析,为您的汽车创新项目提供支持。欢迎联系
    的头像 发表于 10-09 11:07 1387次阅读
    <b class='flag-5'>虹</b><b class='flag-5'>科</b><b class='flag-5'>方案</b> | 汽车CAN/LIN总线<b class='flag-5'>数据采集解决方案</b>

    方案 | 车辆总线数据记录仪解决方案

    的车辆总线数据记录仪解决方案,能为您轻松记录车辆中的CAN/LIN数据,并通过SD卡/WiFi/3G/4G提取、使用开源软件或API处理
    的头像 发表于 09-27 09:49 469次阅读
    <b class='flag-5'>虹</b><b class='flag-5'>科</b><b class='flag-5'>方案</b> | 车辆总线<b class='flag-5'>数据</b>记录仪<b class='flag-5'>解决方案</b>

    圆满收官!请查收今年份的工博会精彩~

    中国国际工业博览会CHINAINTERNATIONALINDUSTRIALFAIR为期5天的第23届中国国际工业博览会于上海国家会展中心圆满落下帷幕。本届工博会,五大团队携20+领先解决方案
    的头像 发表于 09-27 08:04 351次阅读
    圆满收官!请查收今年份的<b class='flag-5'>虹</b><b class='flag-5'>科</b>工博会<b class='flag-5'>精彩</b>~

    太赫兹技术趋势及应用论坛光电精彩演讲

    部分:以太赫兹技术为切入点,介绍了太赫兹工业应用以及提供的太赫兹解决方案,并针对太赫兹应用领域做了最后的总结与展望。本文将带您回顾本次论坛演讲中的
    的头像 发表于 09-14 08:07 745次阅读
    太赫兹技术趋势及应用论坛<b class='flag-5'>虹</b><b class='flag-5'>科</b>光电<b class='flag-5'>精彩</b>演讲

    9月6-8日深圳光博会光电精彩回顾

    和下游九大应用领域之间打造集商贸洽谈、国际交流及品牌展示为一体的专业交流平台。光电团队在此次展会中为大家带来了的最新产品和解决方案
    的头像 发表于 09-14 08:06 469次阅读
    9月6-8日深圳光博会<b class='flag-5'>虹</b><b class='flag-5'>科</b>光电<b class='flag-5'>精彩</b><b class='flag-5'>回顾</b>

    在上海汽车测试展和IME的精彩表现

    电压采集方案等给前沿产品和技术,让我们一起来回顾一下精彩表现吧!精彩展品
    的头像 发表于 08-18 08:07 501次阅读
    <b class='flag-5'>虹</b><b class='flag-5'>科</b>在上海汽车测试展和IME的<b class='flag-5'>精彩</b>表现

    上海慕尼黑电子展光电精彩回顾

    的横跨产业上下游的专业展示平台。展示领域紧跟行业重点,并根据行业实时热点融入新的展示领域。光电团队在此次展会中为大家带来了的最新产品和解决方
    的头像 发表于 08-01 00:06 461次阅读
    上海慕尼黑电子展<b class='flag-5'>虹</b><b class='flag-5'>科</b>光电<b class='flag-5'>精彩</b><b class='flag-5'>回顾</b>

    CANopen设备开发方案

    6月13日晚2000,科技术工程师张工为大家分享了“CANopen设备开发方案”主题直播课程,课程的主要内容包括CANopen协议概述
    的头像 发表于 07-31 17:51 474次阅读
    <b class='flag-5'>虹</b><b class='flag-5'>科</b>CANopen设备开发<b class='flag-5'>方案</b>

    直播回顾多功能电流电压采集方案

    5月23日晚,云课堂【多功能电流电压采集方案】圆满结束,感谢大家的观看与支持。本文将对直播
    的头像 发表于 07-31 17:06 436次阅读
    【<b class='flag-5'>直播</b><b class='flag-5'>回顾</b>】<b class='flag-5'>虹</b><b class='flag-5'>科</b>多功能电流电压采集<b class='flag-5'>方案</b>

    新闻 | 与CTC正式合作,致力于提供工业加速度计解决方案

    近日,与CTC正式建立合作伙伴关系,与CTC将致力于为更多客户提供更加广泛、优质的的加速度计和振动分析硬件解决方案,以实现各行各业的
    的头像 发表于 07-28 16:49 369次阅读

    活动 | 2023慕尼黑上海电子展精彩回顾

    解决方案,感谢您前来探讨与交流! 精彩产品一览 毫米波智能超表面RIS测试解决方案 在外场测试RIS对毫米波信号的影响时,由于高频信号
    的头像 发表于 07-21 15:28 695次阅读
    <b class='flag-5'>虹</b><b class='flag-5'>科</b>活动 | 2023慕尼黑上海电子展<b class='flag-5'>精彩</b><b class='flag-5'>回顾</b>