0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

曙光4000A大规模机群监控系统的功能特点及应用分析

电子设计 来源:微计算机信息 作者:刘佛,李伟生 2020-12-24 10:30 次阅读

嵌入式系统是以应用为中心,以计算机技术为基础,并且软硬件可裁剪,适用于应用系统对功能、可靠性、成本、体积、功耗有严格要求的专用计算机系统。它一般由嵌入式微处理器、外围硬件设备、嵌入式操作系统以及用户的应用程序等四个部分组成,用于实现对其他设备的控制、监视或管理等功能。它具有小型化、低成本、高可靠、高灵活性等特点。

由于上述优点,曙光4000A大规模机群监控系统在信息数据流的传输过程中,采用嵌入式系统作为数据信息汇总并且发送到监控节点的平台。

本文介绍了首先介绍了曙光4000A大规模机群监控系统的功能和结构,然后介绍了嵌入式系统在其中的应用,最后提出了这个实例今后的发展方向并总结全文。

一:曙光4000A大规模机群监控系统

1.1 背景分析及项目意义

随着机群系统的发展,机群的规模越来越大。当机群的节点数达到几百个以上时,对这种大规模机群的管理和维护就会有很大的困难。一种解决方案就是对机群从硬件上配备监控系统。这种监控系统一方面需要收集所有节点机的硬件和软件的实时信息,另外一方面需要随时登陆出问题的节点机上进行管理,或者进行远程安装操作系统等工作。有时监控系统还需要远程启动机器或者远程对机器进行热启动。

曙光4000A超级计算机由640个计算节点构成,这样的大规模机群监控系统中,针对上述问题,可以在节点机上安装专门负责收集节点机信息以及节点机鼠标键盘和VGA信号的节点卡。这样大大简化了系统的连接方式,使系统管理员可以在控制室监视整个机群系统的运行情况并可以对任意一台节点进行类似本地的操作,而不需要进入机房。

1.2监控系统的各部分功能划分

曙光4000A大规模机群监控系统从硬件上分成四部分,包括节点卡、采集卡(多路器)、监控屏幕、终端机等四个部分。整个系统架构如图1所示:

曙光4000A大规模机群监控系统的功能特点及应用分析

图1 系统结构图

采集卡(多路器)最多支持8组节点机,每组最多可支持128个节点机。节点卡安装在节点机内部,每个节点卡有两个RJ45接口,作为数据总线接口,负责传送键盘鼠标操作信息、KVM命令信息、以及监控信息。同时由于主板提供开机、重启等电信号的接口,可以通过KVM系统来进行节点机的开机、重启等工作。

该监控系统需要完成以下功能:

1.收集所有节点机的硬件信息并发送给监控节点;

2.实现机群最大1024节点任意节点的KVM切换和登陆,KVM支持OSD操作;

3.通过KVM系统可以进行对任意节点进行开机,重启(冷启动)等工作(按需求待定);

4.节点机监控屏显示,节点号设置,自动顺序开机等(按需求看是否需要监控屏)。

二:嵌入式系统的引入

2.1 采集卡(多路器)的结构

曙光4000A大规模机群监控系统的核心是采集卡,采集卡集成多路器功能。一方面,采用8×1的模拟开关,支持1个终端盒,通过终端盒就可以操作整个机群中的任意一个节点,从而实现了多路器的功能。另一方面,采集卡还要运行应用程序,分别收集8路总线上节点的监控信息,然后通过采集卡集成的8路网口把收集的节点机的信息通过以太网传送给监控节点,最终由监控节点显示在监控屏幕上。

虽然采集卡总的数据流量并不是很大,性能的要求也不是很高,但是考虑到系统的可移植性、易用性和系统的可扩展性,这个环节最好用一个嵌入式系统来实现。

每个节点机上的信息由节点卡收集,这些信息在汇总的过程中,采取轮循的方式收集,可以避免遗漏节点机信息。如果直接使用采集卡主芯片轮循收集,不但占用了采集卡的大量资源,更重要的是不能保证采集卡及时响应监控节点命令,从而不能把汇总的信息及时发送给监控节点,这样会在监控屏幕上显示错误的节点机信息。因此在采集卡中还集成了一个单片机,这个单片机的作用就是收集相连的这一组节点机的信息,保存在本地缓冲区中,然后通过IIC总线发送给采集卡的主芯片。

对于采集卡主芯片的选择,由于需要支持TCP/IP网络,需要支持IIC接口,同时还可以支持内存控制以及Flash控制器,因此选择了三星公司ARM芯片S3C4510B,该芯片采用ARM7TDI内核,32位RISC架构。对于嵌入式操作系统的选择,uClinux具有免费、开源、可裁减性好、对TCP/IP网络协议支持的较好并且稳定性高等优点,因此选择uClinux作为嵌入式操作系统。同时由于IIC总线技术有连接简单、数据传输速率高、高可靠性等优点,所以采集卡的主芯片和采集单片机使用IIC总线相连。

2.2 采集卡(多路器)的功能

采集卡的主要作用,一方面是从与每组节点机相连的采集单片机中通过IIC总线读取节点机的信息,另一方面*自身的事先约定的端口,当有连接请求并收到发送数据的命令后送出从采集卡中读取的数据。硬件上已经有了IIC和网络接口,软件方面,可以从网上资源中获取S3C4510B芯片的IIC控制器和网络驱动程序,然后集成到uClinux嵌入式操作系统中。此外还需要一段采集程序实现系统的主要功能。

采集程序根据系统需要的功能,分为两个部分,一部分定时从IIC总线读取数据,另一部分*某个约定端口、收取命令并发送数据。这两个部分分别由两个线程来执行。两个线程共享同一块数据缓冲区。线程一通过IIC总线读取采集卡中的数据,写入缓冲区中,线程二一方面读取缓冲区中的数据发送,另一方面在发送完毕后,把已经发送了的缓冲区填写为无效数据。由于数据缓冲区属于临界区域,这两个线程在使用缓冲区的时候要严格互斥。

程序的主体结构如下:

read_iic(){ //线程一运行的函数

打开iic设备;

while(1) {

读取iic设备的数据;

写入全局缓冲区中;

休眠一定的时间;

send_data() { //线程二运行的函数

绑定本地端口;

*本地端口;

while(1) {

收到命令;

发送全局缓冲区中的数据;

填写无效数据;

main() {

初始化全局缓冲区;

创建线程一;

创建线程二;

2.3 运行情况以及发展方向

在实际运行1周后,曙光4000A大规模集群监控系统运行状况良好,其中采集卡功能良好,在规定的延迟内数据传输流畅,没有出现数据漏传、丢失等现象,说明监控系统中的嵌入式系统运行很稳定,发挥了预期的作用。

在将来的监控系统升级工作中,可以考虑在这个采集卡中加入嵌入式数据库技术,把收到的数据存储起来,并且和uClinux提供的Web服务结合,在Web服务中显示监控系统的数据,这样就可以在任何一台机器上以浏览网页的形式监控整个集群,从而节省了监控节点的开销,提高了采集卡的利用率。

三:结束语

嵌入式系统体积小、灵活性高,已经被应用到各行各业,例如汽车、家电、航空、精密仪器等等。本文介绍的嵌入式系统在曙光4000A大规模机群监控系统中的应用,结合了ARM技术、IIC总线技术,采用了uClinux嵌入式操作系统,体积小、可扩展性好、成本低,数据流向清晰明确,现在已经作为配套产品提供给用户。

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5063

    文章

    18990

    浏览量

    302504
  • 计算机
    +关注

    关注

    19

    文章

    7389

    浏览量

    87671
  • 监控系统
    +关注

    关注

    21

    文章

    3853

    浏览量

    173465
收藏 人收藏

    评论

    相关推荐

    Pico Technology宣布推出基于PC的新型PicoScope 4000A系列示波器

    Pico Technology 今天宣布推出基于 PC 的新型 PicoScope 4000A 系列示波器,它是对公司高分辨率、深度内存产品系列的第二代升级和扩展。
    发表于 01-13 10:08 1131次阅读

    Veloce平台在大规模SOC仿真验证中的应用

    随着现代集成电路技术的发展,尤其是IP的大量使用,芯片的规模越来越大,系统功能越来越复杂,普通的EDA和FPGA仿真在速度和性能上已经无法胜任芯片仿真验证的要求,功能验证已经成为
    发表于 05-28 13:41

    大规模集成电路在信息系统中的广泛应用

    、可变化特等的编码、码元变换、话音分析与合成、图像处理等将起重要的作用。上述信息系统使用的大规模集成电路用于特殊目的的逻辑运算较多,因此,应达到功能的最佳化,但因产生
    发表于 09-11 11:27

    大规模MIMO的利弊

    IEEE Transactions on Information Forensics and Security上的一篇论文探讨了这种类型的攻击。他们发现,在某些情况下,当使用大规模多入多出技术
    发表于 06-18 07:54

    大规模MIMO的性能

    轨迹产生的容量斜坡仍然比需求线平坦。面对此挑战,3GPP 标准实体近来提出了数据容量“到2020 年增长1000 倍”的目标,以满足演进性或革命性创意的需要。这种概念要求基站部署极大规模的天线阵
    发表于 07-17 07:54

    大规模区域监控与通信系统的SOPC芯片组,看完你就懂了

    大规模区域监控与通信系统的SOPC芯片组,看完你就懂了
    发表于 05-26 06:46

    车载监控系统功能特点是什么?

    车载移动监控由哪几部分组成?车载监控系统功能特点是什么?车载监控关键点是什么?
    发表于 06-01 06:56

    嵌入式系统曙光4000A大规模机群监控系统中的应用

    嵌入式系统体积小、成本低、可靠性高、可定制性强,和其他外围设备可以很灵活的组合,这些优点使它应用在各行各业。本文简要介绍了曙光4000A 大规模机群
    发表于 08-29 09:32 14次下载

    基于MATLAB的大规模电路分析

    基于MATLAB的大规模电路分析:介绍了用MATLAB软件实现对大规模电路进行节点分析的一种通用方法: 该方法可以实现输入数据和计算结果的文件存储,具有简便、直观、高效的
    发表于 04-27 08:25 69次下载

    机群系统的可用性分析计算

    结合设计应用于金融领域的,由曙光天阔服务器搭建的高可用机群系统,从硬件、系统软件和应用服务软件三个方面进行分析,提出对系统可用性进行估算的一
    发表于 06-29 10:44 0次下载
    <b class='flag-5'>机群系统</b>的可用性<b class='flag-5'>分析</b>计算

    机群系统中对硬件监控方法的研究

    提出了一种针对 机群系统 中硬件的监控方法。在机群系统中,对硬件监控信息的采集采用了通过硬件直接读取被监控硬件信息的方法。在传枪方面,考虑到
    发表于 06-29 16:06 0次下载
    <b class='flag-5'>机群系统</b>中对硬件<b class='flag-5'>监控</b>方法的研究

    基于曙光4000A的BLAST并行算法

    曙光4000A 实现了对每秒10万亿次运算速度的技术和应用的双跨越,成为国内计算能力最强的商品化超级计算机。作为国家863计划的最新成果,曙光4000A将作为中国国家网格最大主节点落户
    发表于 06-29 16:36 0次下载
    基于<b class='flag-5'>曙光</b><b class='flag-5'>4000A</b>的BLAST并行算法

    一体化机群操作系统Phoenix

    从操作系统的角度完备地定义了一体化机群操作系统Phoenix的体系结构,将机群操作系统分为异构资源,Phoenix在
    发表于 06-29 18:02 26次下载
    一体化<b class='flag-5'>机群</b>操作<b class='flag-5'>系统</b>Phoenix

    4000A系列高分辨率USB示波器的特点优势及应用范围

    PicoScope 4000A系列高分辨率USB示波器提供2、4 或 8 通道三款示波器, 可轻松地分析复杂系统的音频、超声波、振动和电源波形,分析复杂
    发表于 01-14 09:32 713次阅读

    曙光助力山西大学建设校级规模计算中心 满足大规模科学计算需求

    近日,曙光携手山西大学,助力山西大学建设校级规模计算中心,面向全校提供计算支持,满足各学科领域对于大规模数据处理和大规模科学计算的需求。曙光
    的头像 发表于 11-11 17:37 2052次阅读