0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IT技术厂商说的“5个9”到底有多牛?

工业互联网前线 来源:美国容错技术有限公司 作者:美国容错技术有限 2021-04-07 11:06 次阅读

从事信息化产业研究多年,身边不乏熟悉的IT技术厂商。在与他们的技术专家交流过程中经常会聊到产品可用性问题。这时他们会说自己的产品有多好,可用性高达“5个9”。那么,“5个9”到底有多牛?

按照年度可用性计算:365天x24小时x60分钟x99.999%=5.256分钟。换句话讲,他们的产品允许一年非计划停机时间约为5分钟,厉害不厉害?当然厉害。可用性够吗?我看未必。随着企业数字化转型升级,更复杂的业务需求对服务器可用要求将越来越高,甚至根本不允许任何非计划停机。因此,仅仅是高可用性,其实是满足不了日趋智能化的工业时代需求。

按照高可用性的定义,本质是允许非计划内停机出现的,只是尽可能通过技术手段来减少停工时间,保持服务的高度可用性。

目前高可用性对停机划分分为两种,一是不可修复系统,系统的平均寿命指系统发生失效前的平均工作(或存储)时间或工作次数,也称为系统在失效前的平均时间,记为MTTF(Mean Time To Failure)。二是可修复系统,系统的寿命是指两次相邻失效(故障)之间的工作时间,而不是指整个系统的报废时间。平均寿命即是平均无故障时间,也称为系统平均失效间隔,记为MTBF(Mean Time Between Failure)。可修复产品的平均修复时间,就是从出现故障到修复中间的这段时间记为MTTR(Mean Time To Repair)平均修复时间。MTTR越短表示易恢复性越好。

那么,容错性和高可用性有什么区别?容错性指的是故障容许度(Fault tolerance),是使系统在部分组件(一个或多个)发生故障时仍能正常运作的能力。容错性能保障即使系统组件出现故障,也能快速的切换到备用系统,并保证系统的正常运营能力。对比高可用性强调恢复能力,容错性是不允许这种情况发生,其目标是预防故障,做到即使出现故障也能快速切换,保证业务系统正常运行。

在传统信息化时代,服务器主要承载的是对可用性和可靠性要求不高的业务应用,如ERP、OA、CRM或MES等。随着智能制造的推进,传统业务系统向工业现场延伸,服务器正在承担起越来越多的场景功能,这些场景不仅智能化程度越来越高,计算需求越来越密集,而且对实时性要求也很高。

比如在工业智能化控制系统中根本不允许出现任何故障问题,因为这可能带来一系列重大工业安全事故。在无人自动化驾驶系统中,时刻需要采集和分析周边环境数据并进行实时分析,及时反馈到中控系统以保障自动驾驶过程的安全。因此,时代对硬件性能的要求不同了。作为服务器厂商,必须适应由故障恢复到故障预防的趋势变化,打造容错性能更好的服务器平台。

在早期计算机系统不是特别可靠的情况下,为做到故障预防,企业通常采用的是双机容错机制,即购买两台配置完全一样的服务器冗余级联,一旦主机出现故障,就快速切换到从机上,从而保证业务的正常运营。但这种部署方式不仅成本高、效率低,而且实施过程十分复杂,一旦出现断电等意外情况,就完全无抵抗力。

那么,怎么才能保证在部署成本更低、实施更简单的前提下,让系统具备更好的容错性能?全球容错技术领导厂商Stratus是这么做的!

上图是Stratus公司打造的一种全面集成的持续可用性平台——ftServer,为企业关键应用提供更稳定可靠的平台。

为保障平台的高可靠性和可用性,ftServer通过部署一对冗余节点,两个相同的客户可更换单元(CRU)——其中每一个客户可更换单元均有自己的处理器、内存和存储。所有冗余组件和子系统打包为单一系统,从而降低了许可成本并简化了管理。

Stratus具有独特的冗余现场可编程门阵列、数据路径和同步固件,即使硬件组件出现故障,也能够提供确保持续可用性所需的处理器同步、数据复制和逻辑,系统会在不同节点间自动复制数据。一个节点发生故障时,运行在上面的虚拟机会自动在另一个节点上重启(高可用性模式)或恢复(容错模式)。

同时,为增强平台的兼容性并降低成本,ftServer不仅使用通用化的x86芯片组、DIMM和驱动器,还使用标准分发包装的操作系统和虚拟化软件,从而简化了管理并缩短了价值实现时间。ftServer自动化的自监控、告警、自诊断和补救功能是通过主动服务架构实现的。通过简化ftServer监控和管理,以及筛选需要釆取行动的问题,Stratus可节省公司时间以及减少工作量。

为尽可能减少停机维护时间,ftServer旨在实现服务性,它的可热插拔CRU无需关闭系统即可拔下,并且无需使用特殊工具即可更换。这一点以及自动数据重新同步使ftServer适于在远程制造位置或IT资源有限的位置部署。

对IT硬件系统而言,没有绝对的可靠性,只有相对的可用性。容错性的目标是预防故障,可用性的目标是恢复故障,目标虽然不一致,但是殊途同归。随着工业智能化时代的开启,就当前企业需求看,“预防故障”显然比“故障恢复”更有吸引力,因为在不确定、复杂性的时代,企业更希望能提前掌握不可预知的风险,让一切可控。

原文标题:观察|漫谈高可用性与容错性

文章出处:【微信公众号:工业IoT】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IT
    IT
    +关注

    关注

    2

    文章

    862

    浏览量

    63504
  • 容错
    +关注

    关注

    0

    文章

    28

    浏览量

    14923

原文标题:观察|漫谈高可用性与容错性

文章出处:【微信号:IndustryIOT,微信公众号:工业互联网前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    差分输入和和单端输入在本质上到底有什么区别?

    和和单端输入在本质 上到底有什么区别? 因为,ADC采集的信号说到底是AINP - AINN,不管单端还是差分,采集的信号都是这两pad的差值。 2:将单端信号接在ADC的差分输入接口上可以用
    发表于 12-23 07:31

    TFP401APZP到底有没有HSYNC输出?

    请教下TI的大牛,TFP401APZP这颗IC到底有没有HSYNC输出?实测发现HSYNC无输出,是要做什么设置么?!
    发表于 12-20 07:28

    高铁站网约车数智出行到底有智能‌

    在当今这个科技飞速发展的时代,智能出行已成为我们日常生活中不可或缺的一部分,而高铁站网约车数智出行更是将这一理念推向了新的高度。那么,这种数智出行方式到底有智能呢? 首先,从预约叫车开始,高铁站网
    的头像 发表于 11-14 14:48 206次阅读

    RTOS与Linux到底有什么区别

    很多做嵌入式开发的小伙伴都存在这样的疑惑:RTOS与Linux到底有什么区别?
    的头像 发表于 10-29 09:53 427次阅读

    功放和运放到底是什么区别?

    想请问一下功放和运放到底是什么区别,感觉只要接一小负载,运放的输出电流也可以很大啊?到底有什么区别啊
    发表于 09-10 07:00

    CMOS运放的输入阻抗到底有多高呢?

    都说CMOS运放输入阻抗高,到底有多高呢?可有一量化指标?
    发表于 09-06 06:59

    求助,这个电路U1A运放同相端的R1电阻到底有什么作用啊?

    想问下这个电路U1A运放同相端的R1电阻到底有什么作用啊?很郁闷。
    发表于 08-27 07:09

    EWSTM8-2201 or 3101安装说明上有的选“是”,有的选“否”,二者到底有什么区别?对工程什么影响?

    the installation. ......... 安装说明上有的选“是”,有的选“否”,二者到底有什么区别?对工程什么影响?
    发表于 04-28 08:08

    你知道激光钻孔技术吗?看完这篇文章你就明白了

    你知道激光钻孔技术吗?看完这篇文章你就明白了
    的头像 发表于 02-29 17:09 959次阅读

    网线到底有多少种连接器

    我们在谈论网线的时候,聊得最多的,一定是它的连接器,它在连接过程中扮演着极为重要的角色。网线到底有多少种连接器?本期我们将从工业级使用出发,来看看这根似乎普通的网线,在连接器上有多么努力。
    的头像 发表于 01-26 10:06 608次阅读

    NUC123的USB外设到底有没有DMA功能?

    下载最新的TRM 1.07: 在最先前的描述以及USB的寄存器章节都有DMA相关的内容。但是DMA那一章节里的框图没有USB外设。同时关于USB外设DMA的用法也没具体说明。所以USB外设到底有没DMA功能,若是该怎么用?
    发表于 01-16 08:26

    全固态电池到底有哪些闪光点?

    全固态电池到底有哪些闪光点? 全固态电池是一种新型的电池技术,相比传统液态电池,具有许多闪光点。下面我将详细介绍这些闪光点。 首先,全固态电池具有更高的安全性。传统液态电池中使用的有机电解液容易引发
    的头像 发表于 01-09 17:09 753次阅读

    AD7280AWBSTZ和AD7280ABSTZ之间到底有什么区别?

    替代吗?在网上找到的两芯片的相关数据都是一样的,AD7280AWBSTZ和AD7280ABSTZ之间到底有什么区别?
    发表于 01-08 06:36

    个大事:问界 M9 来了!

    董事长余承东表示,千万元内最好的 SUV,马路上能看到的最强大 SUV——问界 M9 来了。 图片来源:问界 M9 及华为冬季全场景发布会直播 问界 M9 到底有何过人之处,小知帮你
    的头像 发表于 01-05 16:57 2397次阅读
    <b class='flag-5'>说</b>个大事:问界 M<b class='flag-5'>9</b> 来了!

    COB与SMD到底有什么不同?

    COB与SMD到底有什么不同?  COB和SMD是两种常见的电子元器件封装技术。它们在电子行业中被广泛应用,尤其在LED照明领域。虽然它们都用于将芯片连接到电路板上,但它们在封装技术和应用方面有一些
    的头像 发表于 12-29 10:34 1729次阅读