风河的TOPICS,是云平台,主要是面向于工业。现在面向于工业,我们的虚拟化方向会是什么样的,针对于比较重要的几个行业,它们现在的趋势以及面临的挑战是什么。针对这些行业提出来的需求,风河提供的产品能够给我们带来哪些价值帮助大家。
为什么要虚拟化?因为现在我们有这么多的嵌入式设备,我们怎么把我们的设备放到虚拟化的系统当中去?因为现在老式的设备固定的盒子都是固定的功能,前面几十年大家看到的产品形态。以后,大家都希望设备越来越简化,做成一个非常瘦的设备,只负责执行单元和数据上传单元就够了,对于一些算法、管理、通讯就由上面的业务软件来做,这样就非常方便的部署一个系统。就像我们平时上线的业务一样,很方便就起来一个业务,不需要再加一个专用的设备,并且这个执行单元可以一直留下去。
现在嵌入式设备由于现在维护起来很难,产品的生命周期,由于现在的IT技术,移动技术发展那么快,传统的设备一些特有的功能不能从里面提取出来,是固化在里面的,每次要进行系统升级就意味着要采购一批新设备。我的想法是把IT和移动这一块的技术放到工业领域来,只需要一个通用的设备就可以了,通用的设备很多软件可以随时整改。华为推出的家里用的AI,就是一个固定的功能,但是以后会把里面虚拟化的设备放在里面,家里面可以建自己的服务,起自己的一些媒体中心的服务。以后这个盒子想让它是什么功能就是什么功能。
从风河公司来看,对这个行业风河是怎么理解的,比如说对电力行业,它们现在面临的问题,它们希望大规模的部署整个系统,但是又不希望整个系统有档期的时间,希望是持续的运行。同时,希望整个系统在升级的时候用现代化的设备,能够让它们很灵活的部署特别的应用,或者说针对于这个行业特殊化的服务,整个系统不希望受到安全的威胁,谁都可以登录到这个系统当中来操控设备。
现在提出的要求,整个系统要达到电信级别一样的72小时的运行,并且整个系统的升级不能像以前一样,哪个设备需要升级的时候去替换就行了,底下的整个系统跑流转件,想这个设备是轮转功能就是轮转功能,就像电脑一样是普通的设备,想装window就装window,这个是一直变化的,可以一直用下来,不像以前要装一个东西要换一个设备,或者是重新加入到系统里面来。
对于制造行业,因为制造行业现在由于人力成本的提升,都希望在制造行业里面能够全线的实现自动化,并且要替换现有的场景不希望增加成本,同时不要让产品质量有所下降,这是工业想要走的方向。典型的系统是什么样的呢?不管是对于制造厂商还是对于普通的客户,都希望看到这个产品的全流程的过程,比如说我们买汽车,我们希望下订单之后手机APP上可以看到这个汽车的制造过程,当前是在组装还是什么样的过程,对于制造厂商来说,希望可以把数据管理起来进行分析。
对于医疗行业,它们很多设备希望组网,同时收集大量的数据,因为它的设备放到市场上保证正确性,希望前期进行一些数据的分析,分析完之后放到市场上去的时候是已经经过验证的设备,而不像要通过手工大量的临床实验,手工收集数据的方式不太科学的处理这些应用。
对于智能楼宇,我们希望能够把所有的电器设备连接起来,连接起来之后可以对整个楼宇的行为使用习惯、电力设备、使用的数据,包括这些电力设备的寿命都进行管理,根据要求可以进行一些能耗消耗的预估,以及进行成本的控制,对整个楼宇的安全都可以进行数据的监控。
在使用虚拟化的过程中,我们怎么虚拟化,能够给我们带来什么好处,根据ICA95的开元自动化控制系统的定义,从Level1到levvl3都可以进行控制虚拟化,但是Level是数字执行单元,比较困难,实施性比较强,但是对于数据单元采集的数据,对上或是对下,上面给下面发控制指令,这一块服务是可以由虚拟化来做。我们可以看到,在基于软件这一块可控制起,分布式控制系统,人机结合,这一块可以虚拟化。希望整个系统都是属于开放平台,这个开放平台可以跟很多第三方继承,要变成通用设备比较困难,只有开发的厂家才能往里面写入一些程序。对于安全这一块,利用现有IT技术利用防火墙增加系统的安全性,不容易让别人嵌入系统里面来。
Level是属于数字控制单元,左边是传统的,数字单元往上,可以看到有一些操作系统的软件,如何根据相应的服务,怎么下达指令到下边的数字控制执行单元。对于历史处理的数据,Level1是属于企业内部的,又希望生产加工的数据给Leve3的客户来访问,就有很多的APP部署在上面让他们来使用,这一块访问是为了保护生产系统不被客户系统入侵。
系统被虚拟化之后是什么样的场景?(PPT),下面的数字执行单元还是保持不变,数据往上传或是往下传通过网络,下面的功能,从Level1到Level3是完全的虚拟化,只有负责执行和上传数据。
风河对现在所有这些设备进行归纳总结之后,希望我们在进行工业虚拟化的过程中系统能够给我们提供的功能,或者说我们需要这个系统的一些要求是什么样的,第一是可靠性,我们希望这个系统达到ICAT的要求,持续不间断的7×24小时的服务,都不会宕掉,同时不会有单点故障的出现。
可管理性,在工业的系统里面,大家都是不作操作系统的,也不是做云操作系统这一块的,希望管理这一块像普通软件一样,方便安装,管理的时候只需要在界面上进行配置,整个系统就可以运行起来。
对于业务编排,我们希望提供通用的接口,对第三方软件可以控制整个底层的云系统。对于性能和配置性,可拓展性,对实施性要求很高,比如说可编程控制器,我们希望终端的延时很少,以前是跑在硬件上,我们希望算法软件或接受服务处理的软件也希望得到实时性的要求,就会对整个系统提出实时性的要求。包括5G对通话实时性要求,在高铁或基站切换的时候,5G已经虚拟化了,从这个点高速运转切到另一个基站,通话不会断掉,完全不会感觉出来,这是在一个系统里面完成切换,所以对实时性要求很高。
对于安全性,整个生产系统对外,我们不希望整个系统被入侵,包括物联网系统,不是说所有的设备都可以接入进来,只有经过签名或授权的设备才可以接入进来。
基于开元软件,接口都是通用的标准,里面根据风河嵌入式设备的经验,对系统进行了实时性和可使用性方面做了一些改造。
系统要进行虚拟化,虚拟化了之后,整个云的形态是什么样的,数字执行单元基本上都是在最下面的,当然这些设备都已经网络化了,可以通过空间级的网络接到服务器上面来。这个服务器就负责了以前所有的一些算法、处理、服务、接口等等功能,都放在这个服务器上,我们叫计算节点,负责计算服务,操作系统跑的进程服务一样,当然跟进程相比安全性、可靠性不一样。在这之上,提起来的系统再跑分布式控制系统、人机接口,要跑实时操作系统也是没问题的。
前面这边最主要是虚拟化面临的挑战以及怎么部署,接下来介绍一下风河的产品软件组成是什么样的。风河这个产品,下面的架构不变,其他的执行单元是符合下面的。风河的云控制系统是跑在标准的服务器上面,标准的服务器上面就涉及到虚拟化这方面的东西,虚拟化的软件架构,可以从下往上看,第一步是增加了整个系统硬件的虚拟化管理,提供了工业级的,这个是基于开源的CPM(谐音)做的,上面跑的是虚拟机,虚拟机跑的就是服务,我们跟服务之间要进行数据的交换,还有进行业务的编排,逻辑的控制,就会通过一个基于DK的风河开发的加速虚拟交换机,可以把它当成物理的交换机放在这里,可以实现二层快速的转发,基于工业级的要求。
之后,整个系统我们希望在管理其他的时候,有故障的管理,还有虚拟机的管理,整个系统能方便的管理起来,有故障管理和业务管理的开发模块。存储,因为执行单元很多数据都希望把它放在系统里面进行存储,后面的业务可能从存储系统里面把相应的数据拿出来进行第二次的加工或处理。
把我们的系统搭建起来之后,在我们的系统就可以跑你的服务,也可以跑你的操作系统,或者说就是我跑你的应用程序也可以,你的应用程序作为集成在上面也可以隔离起来。作为工业标准的网络协议,这是面向于工业控制方面的,对于低延时都进行过处理。
刚才说到提供的几大点,第一点就是可靠性,我们都知道可靠性对我们系统肯定很重要,我们的服务不能终断,是否宕机就看系统是否稳定可靠,整个系统是不允许宕机的。在这种情况下,我们怎么保证整个系统非常健壮的运行起来,主要是从几大方面。
第一是对虚机的侦测,可以理解为对每一个业务的侦测,每个业务是不是在健康的运行,我们可以随时侦测到,并且在500ms以内进行恢复。我们还可以进行整个节点进行监控,节点可以理解成一台设备或一台服务器,希望一秒之内侦测并恢复。对于节点侦测失败的恢复是25秒之内。对于网络的连接,因为这边随时有实时的任务在运行,或者要获得数据,我们希望在50ms之内网络能恢复起来。
传统的IT服务,对于服务的侦测大于1分钟,节点的侦测大于1分钟,这是满足不了工业的要求。这边是指工业的要求,最后一个是风河这块能达到什么要求,根据工业的要求,风河提供的系统经过测试可以完全满足工业系统进行虚拟化的要求。
(PPT)动态演示服务是怎么样进行故障恢复的,这边是一台服务器,这边也是一台服务器,把它当成平时用的一台笔记本,一台PC电脑,两台放在这里,作为1:1的备份,这边可以启动很多业务,很多业务跑到这里,可能有人机接口的,有防火墙的,在这里跑,系统可能不稳定,有时候可能是因为硬件的原因,可能会造成系统突然断电或宕机,比如说故障发生了,这台机子完全断电,完全出了故障。在这种情况下,因为我们是1:1的备份,右边的系统会主动的变成一个激活的状态对外提供业务。之前业务是跑在第一台服务器上的,DM会做动态的迁移,把1里面的服务自动的在2里面提起来了,在2里面提起来之后,对于外面的用户根本就看不到整个的过程。体验是什么呢?就像我们打电话一样的,你在通话的时候,在高速路上可能都已经经过很多个基站,但是你的通话是随时保持的,没有感受到是停断的感觉。
当系统故障恢复的时候,相应的服务会再相应的恢复回来,继续对外进行提供服务。这就是刚才说的凭什么达到7×24小时不间断的服务。对于VM,业务出现故障,由于其他的误杀或是其他原因,这个业务已经宕机了,系统对VM的监控可以随时切换过来,切换过来就可以在一秒钟之内自动的启起来,不会影响这边的系统。
讲完可靠性讲一下可管理这一块,对于工业这边要进行云化系统,相当于平时用window操作系统一样,希望拿盘过来直接安装就行了,不需要了解里面是什么样的,不需要做配置。如果用开元的系统,当然还得在熟悉的工程师,没有一周的时间是不能把整个系统部署起来的。我们是很方便的拿过去直接把第一个节点装好就行了,后面不管有多少台机器都会自动的部署,发现一台新设备加入到系统里面就可以了。
安装方面,自动发现新的设备,自动发现设备的资源,新加入的设备资源有哪些网络,有哪些加密算法的硬件,都会在这里呈现。整个业务在跑的时候会通知这个系统,现在需要跑在一个有加密的节点上,那这个业务会自动的跑在一个带加密算法的节点。
对于配置,只需要在界面上把系统需要的一些资源配好,整个系统就加进来了。监控这一块,风河的软件提供的都是基于外部的可视化系统,对于本地操作可以直接登陆操作系统,通过外部来查看操作信息,包括系统的使用率,系统的告警,也可以让业务重启,或者是宕机,或者是进行迁移。比如说现在觉得两台设备都跑了我的业务,但是我会发现第一台设备的业务用的业务比较少,第二台用的也比较少,为了降低功耗,把第一台设备迁移到第二台设备,第一台设备宕机,就会迁过去,然后把第一台机器宕机,对维护和维修也是同样的道理。
对于管理接口,我们自己一个云系统,我们希望对上层除了客户通过JAY(谐音)操作系统,也希望这个系统是开放式的系统,能够让上面的人进行编排和处理,上面的编排是由第三方软件提供的功能,这里是实实在在的业务,想搞生产的,想搞加工的,多个虚机,还有对外防火墙的VM,还有数据处理的VM,会进行编排,到时候启几个负责执行单元的,启几个数据收集的,启几个算法、业务处理的。可以提供顶层的编排软件,编排软件会根据业务软件启多少个,告诉系统,系统自动给里启起来。
在性能和可扩展性方面,我们用VM的时候,都对资源进行了限制,有时候觉得启的这个VM用了两个CPU,或者是用了多少G的内存,但是业务随着访问量的增加,希望更多的资源,但是又不希望业务在中途断掉,希望是动态的加大硬盘,硬盘就加大了,要加大处理器,处理器就随时放进来了,4核变成8核,系统很容易进行扩展。
部署方面,可能是属于一个小系统,就只一台服务器,希望把系统部署起来,也希望两台服务器做1:1的备份,可能这边是属于大型的系统,控制节点只需要一个,所有的全部其他服务器都变成技术上的。在单服务器上面我们可以直接部署,计算、控制、存储所有都在一个服务器上对外提供服务就行了。但是这个系统唯一不能解决的问题,当这个系统出现故障的时候不能对外提供可靠性的服务,只能是低成本的,类似于现在看到的PCE的设备。
对于第二个系统就可以做成1:1的备份,两台服务器,控制、计算都放在一起,但是1:1的备份,只要一台出了问题,就可以把业务动态的迁移过来,动态迁移过来之后,另一台设备就可以进行换设备,或者说是换部件,修只好后系统再过来。这边是属于大型的生产系统,大部分控制节点只需要两个就行了,1:1的备份,因为业务特别多,希望特别多的计算节点都管理起来,上面跑我的业务。
终端延时,这个软件跑在嵌入式设备里面,有的时候接受一个终端要求很快,可能是在2-3微妙就希望收到终端,然后再做处理,这个对实时性要求是非常高的。但是虚拟化之后就会发现一个问题,因为是虚拟化,终端是先到Host系统,Host系统还要把终端转到guest的服务,这就要进行实时化的改造,能够保证在虚拟机里面和服务器达到基本上相近的实时性。我们看到的2-3微秒Host和guest系统是在低延时的节点里面,我们提供两个由你来选择,如果说你的系统有一些计算结点是处于实时性的,有些是低实时性提供普通服务的,可以装标准系统,Host是5US,guest是7us,一些关键的业务是用低实时性来替换。
对于网络加速这一块,因为我们进行整个系统处理,每个业务会进行数据的交换,前面收集的数据给第一个VM处理完之后,经过加工,希望给第二个业务软件系统进行处理,处理完之后给第三个,之间的数据量交换量是非常大的,并且要求延时很低。风河提供Linux对于底下的执行单元,对于包的传输,对于包的带宽效率很高,网络延时也非常低。
对于资源的可配制性,或者说对于资源动态的调配,这个业务,比如说现在看到的情况,对于Fos-A当成平时系统跑的业务,某一个时间段对外连接的客户特别多,要求对这个业务的系统量特别大,这个时候就会发现这个业务占用处理器非常的高,说明这个资源完全不够用了,不够用的情况下怎么办呢?希望动态的加大硬盘,也希望处理的能力多加几个处理器,这个时候外面有比较大的压力服务请求,这个地方变大,需要更多的资源。这个时候就会把相应的资源全部调配过来,比如说增加处理器,增加内存,增加硬盘的容量。等它处理完之后,觉得业务的潮汐效应的数据现象已经下去了,再把它恢复到原状,还是占很小的资源继续运行。
(PPT)这是一个服务的分组,因为有很多服务器,希望有些业务隔离起来只跑在其他的服务器上,还有一些业务希望是跨服务器的运行,跨服务器的运行是干什么用的呢?假如说我要进行设备1的维修,只要在一个组里面,所有的业务是可以动态迁移的,把这个服务器一关,VMP的业务会自动的到这里面找资源运行起来,第二台服务器就可以进行关机减少功耗,或者说需要维修,把硬件出了故障的修复好,整个业务又自动的回来就行了。整个系统都是自动感知的,不需要人的干预。
还有一个业务,强依赖的,希望在一个服务器跑,组好组只会在一个服务器上跑。云对于客户来说感知不到,除非说有明确的制定策略。就像平时说的云盘,不知道自己的存储数据到底在哪个服务器,它会根本自己的策略放在不同的服务器上,比如说高有级的用户会放在高性能、低延时的服务器上。
对于安全性这一块,我刚才提到在系统里面不希望受到外面系统的干扰,第二,属于本身系统的设备到这里面来。按照传统的设备方案,可以通过硬件提供TPM,比如说在系统起来的时候就可以对上面的软件进行数字签名的验证。同样是一台服务器,你也装Linux,他也装Linux,不行,这个系统里面只有自己签过名的会启动到硬件那边算硬件签名,签名是你的设备,才可以在这上面装这个软件。
现在业务是跑在虚拟机的,虚拟机也可以当成一台服务器,这个服务器也希望要提供VM或TPM的功能,相当于虚拟机是一个进项,是签过名的,跑到另外的系统是运行不起来,把别人的进项放到这里也不能运行起来,只有经过数字签名的可以运行起来,可以杜绝其他的嵌入系统把它的程序或密码放在这个系统跑起来。
开放标准这一块,风河从底下的基础平台,是基于Linux的;对于虚拟化是基于KVM;对于云这一块是基于OpenStack;对于存储是基于safety;对于网络加速是基于DPDK。但是这一块系统全部从操作系统实时性改造,KVM实时性改造,OpenStack可靠性级别改造;Safety这边是进行工业级的存储进行改造,DPDK网络加速满足工业的要求。
这套系统还需要进行对接,因为我们说标准的接口,我自己部署了这个云,我希望云里面的一些数据可以放到亚马逊上面的云,或者说放到腾讯,或者说放到微软的云。别人上面跑的业务,我们可以把我们的数据通过标准的接口直接提供给上面就行了。终端的客户想要分享一些数据,哪怕说医疗的数据需要和企业之间进行同步或诊断,他们会把核心数据保护在私有云,对于可以公开的可以分享出去。
(PPT)风河这一块的可以把它当成风河的操作系统一样,这个操作系统要真正的用起来,必须要在这个操作系统中跑一些定制化的服务软件,这些服务软件比如说专有云,这个地方的服务软件必须是标准的。在电信里面叫虚拟化的网络功能,防火墙是一个亿米级,想放在哪里跑调度的时候放在那里跑起来就行,带有防火墙的功能,交换机也一样,不需要买实体的。
(PPT)底下是风河对硬件做了认证的,云操作系统可以跑在这上面。风河操作系统是在中间这一层,对这个操作系统之上,我们要跑一些虚拟化的应用,有可能说这个企业需要有一个防火墙,不然的话不能进来,这个地方也希望有一个分布式人机的接口,也有PMC的算法,做成标准处理放在这里(PPT)。对于业务的编排,对于大的系统有一些很多业务是关联在一起进行编排的,也需要第三方进来,风河实际上还是只提供了云操作系统更可靠的。
风河提供的系统有两个版本,一个是用于电信的,一个是用于工业控制,电信这一块,目前在国内的电信系统用的很好了。这一套系统是工业过程中云化,有一个Cloud版本,最主要是让工业软件能够方便的部署到这上面来。
当然,对于有些很多执行单元里面的服务应该跑在哪里,这个可能都需要根据厂家真正的需求来看业务怎么进行解藕Linux满足6个9的要求,让系统的安全性和可靠性得到加强,不会被入侵或者是数据泄密。我今天的演讲到这里,谢谢大家!
该活动的主办单位博闻创意将于2018年12月20-22日举办第七届深圳国际嵌入式系统展IEE2018,作为国内专注于嵌入式系统领域唯一的大型专业展,展览将涵盖嵌入式与物联网技术、工业4.0和工业物联网、汽车新技术与车联网等八大板块;今年的展览也将特设“物联网专馆”以及“汽车智能技术专馆”,在开展前主办单位将举行系列线下活动,与业界一同跟进和研讨嵌入式以及物联网领域最新动态!
-
服务器
+关注
关注
12文章
9138浏览量
85369 -
虚拟化
+关注
关注
1文章
371浏览量
29794 -
工业4.0
+关注
关注
48文章
2012浏览量
118614
发布评论请先 登录
相关推荐
评论