0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Intel和Linux技术带来分布式计算的高潮?

我快闭嘴 来源:CSDN 作者:Just 2020-09-30 16:44 次阅读

回顾计算机发展的历史,任何一个计算架构的成功都离不开强大的硬件,但这背后更需要繁荣的软件生态。

1960年的集中式计算出现后,诸多基础软件应运而生,随后进入“Win-tel”独霸PC的时代,近年来,IntelLinux又带来了分布式计算的高潮。

如今,随着5G的到来,移动互联网业务进一步发展,大数据、物联网人工智能等创新应用场景层出不穷,应用场景的多样性催生出数据的多样性,导致原有的单一计算架构明显跟不上庞杂的业务需求,业界对提出一种全新计算架构的呼声愈烈。

很快,华为瞄准了多样性算力架构。在去年9月的华为全联接大会上,他们提出了“鲲鹏+昇腾”的双引擎计算战略以应对算力需求的爆发式增长。

这是一个全栈协同创新的过程,需要硬件提供算力,软件释放算力,尽最大可能让上层应用使用算力,并且最终创造价值。硬件是整个生态的基础,但决定多算力架构能否取得成功的关键枢纽是软件,这是华为需要啃下的另一块硬骨头。

四大基础软件再升级

要想充分释放硬件的算力,需要先了解其瓶颈究竟是什么。

华为鲲鹏计算领域副总裁江大勇告诉CSDN,在硬件方面,ARM这样的主流处理器从百核甚至到千核的多核方向发展,但问题在于,核数的线性增长并不意味着算力的效能会随之增长,因为算力的分配和调度复杂度的增加反而会消耗一部分算力的效能。与此同时,端边云协同的趋势对ARM计算架构也提出了相应需求,而X86、ARM和xPU的异构计算框架的趋势也正在形成。

如此,多核多算力的硬件架构转变相应地迫使基础软件架构做出调整。

去年以来,趁着国内开源的热烈气氛,华为也相继开源了四大基础软件:openEuler(欧拉)操作系统、openGauss(高斯)数据库、openLooKeng(罗庚)高性能数据虚拟化引擎,以及MindSpore全场景AI计算框架。

操作系统是所有计算机系统软件的“根”,但目前的操作系统并不能很好地支持多样性算力和ARM等架构。华为则希望面向未来的场景,通过openEuler创建一个创新平台,能够全面支持ARM,X86,RISC-V 等现在主流计算机架构。openEuler已于去年12月31日正式开源。

而在9月24日的HC大会分论坛上,江大勇发布了openEuler 20.09版本,包括极致性能、安全可信、生态引擎三大特点,背后提供支撑的项目主要是轻量级虚拟机StratoVirt 1.0和云原生容器iSula 2.0,secGear机密计算框架和IMA完整性度量架构,自动化测试平台Compass-CI和UKUI桌面。OpenEuler21.03及后续版本,将在云、边、端全场景协同上持续创新,支持应用一次开发,多场景部署。

目前,openEuler操作系统,代码量超过100万行,代码贡献者数量已超过1000个,下载量超1.4万次,社区访问量超过150万次,已有多家伙伴基于openEuler做了商业应用。

同样,数据库是基础软件皇冠上的明珠,也是客户业务系统的核心,所有应用软件的运行和数据处理都要与其进行数据交互。虽然以MySQL, PGSQL为代表的开源数据库已成为主流选择,但真正的企业级用户对企业关键数据、核心业务的承载体,有着性能、安全和运维的更高要求。江大勇认为,现在开源的数据库没有完全达到企业级的能力。

今年6月已经开源的openGauss数据库则具备企业级性能,包括高性能、高可用、高安全三大特性。openGuass第一个开源版本聚焦在与鲲鹏协同性能优化上,基于2路鲲鹏服务器,性能可达到150万tmpC,相对业界主流产品的 性能超过50%。

而在今年12月底,openGauss还会进一步迭代企业级特性,包括行列混合存储引擎,支持混合负载,內存引擎MOT达到250W tmpC,有512个功能参数推荐的智能运维以及安全审计。明年3月底,openGauss则会关注企业安全,实现全密态数据库和智能增强功能。江大勇称,未来,openGauss将在每6个月发布一个新版本,每年发布一个稳定版本。

面向海量数据,尽管目前有HBase、Hadoop、Hive,MySQL等各种数仓,但缺乏统一的SQL接口,支持多数仓的软件,这是大数据使用的一大难题。

今年3月,华为开源的openLooKeng则是一个数据虚拟化引擎,致力于为大数据用户提供极简的数据分析体验,让用户像用“数据库”一样使用“大数据”。

openLooKeng具备引擎归一、多样分析,生态引擎以及高可靠、易用性特点,可以进行跨格式、跨仓、跨域使用,让开发者做数据治理更加简单。江大勇称,百亿级的数据量可以做到10秒级的分析处理。未来,openLooKeng将在极致性能、全场景高效融合分析、批流交互式方面持续突破。

此外,华为正式发布了端边云全场景的AI计算框架MindSpore 1.0:支持模型、算子及硬件处理单元级全自动并行;对端边云设备如手机、摄像机、服务器等全场景自适配;开发流程极简,开发者可基于MindSpore快速实现模型导入、灵活调试。

为什么要开源基础软件

开源软件的商业模式早已被验证。华为也希望通过开源的方式快速构建上述基础软件能力,并繁荣软件生态。

事实上,在Linux最新的内核5.8版本中,华为在全球范围对内核的贡献排名第二,修改代码量全球排名第一。另外,华为还为ARM架构打通全栈能力,贡献了全球超过40+的主流开源社区。

这些基础软件能开源也主要得益于华为过去10多年的技术积累,比如openEuler、openGauss数据库在开源前,就已在运营商业务中广泛使用,背后凝结了数千名工程师的技术研发投入。

由此也不难看出,现在的华为在贡献开源和引领开源上是齐头并进。

当然,华为也并非能完全参考英特尔厂商的开源模式。江大勇对CSDN称,与原来其他厂商做产品和解决方案不同,华为做计算产业更强调“生态”,这就决定了华为“有所为有所不为”。

这一点也让华为在基础软件的开源策略上更加清晰,华为所做的即是为开发者和合作方提供开发工具和应用实践等底层支持,帮助后者应用快速迁移到整个鲲鹏平台,以此促进计算产业的发展。

在江大勇看来,现在应用的发展已经远快于以前做应用标准的方式,所以开源可能是当下更能被认可和接受的一种趋势,而通过这种方式也更能促进社会效率的提升。更重要的是,通过开源社区的协作模式把底层的基础技术做好后,差异化应用也会更快落地,社会效益也会更大,这也会形成事实上的统一标准。

最具挑战的是开源意识

对华为来说,开源上述四大基础软件只是开始。因为应用、处理器、新的项目需求还在不断发展,江大勇认为,只开源这些软件并不足够。

“openEuler刚开放的时候大约有30多个SIG组,但现在已经有70多个,因为不断地有开发者提出了新的业务需求或创新想法,也有开发者主动把RISC-V等能力开放到了社区。”

他预计,在分布式方面,未来可能还会增加一些新的能力,在元函数方面,可能在今年年底或明年年初也会有相应能力开放。而要壮大软件功能和生态,更重要的是依靠开发者社区的力量。

作为一家公认的执行力强悍的企业,华为在社区建设上也卓有成效。近期的鲲鹏开发者活动首次进行18个城市同步联动,采用线下+线上的方式进行,吸引了上万名开发者参与。

在江大勇看来,中国的开发者软件开发者数量并不少,但需要形成一种活跃的开源社区文化,而不只是把社区当做代码托管的地方。

而通过华为在构建开发者社区和生态过程中的经历,他也总结了中国开源需要提升的地方:

首先,开源社区本身的代码托管等基础设施服务要加强;其次,中国需要有更适合的开源协议;最后,最具挑战的是拥有开源意识和文化,他认为,应该鼓励高校学生和研究机构参与到开源中,加快社会性的协同创新,持续性支持和发扬开源协作精神。最终,让中国开发者实现从贡献开源进一步在全球范围内引领开源。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19134

    浏览量

    228915
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9034

    浏览量

    366603
  • Linux
    +关注

    关注

    87

    文章

    11216

    浏览量

    208789
收藏 人收藏

    评论

    相关推荐

    浅谈屋顶分布式光伏发电技术的设计与应用

    【摘要】为了缓解城市用电紧张袁降低人们的用电成本,可以在工业园区、办公楼屋顶等场所应用屋顶分布式光伏发电技术进行就近转换、并网发电袁充分利用建筑物屋顶的太阳资源。概述屋顶分布式光伏发电技术
    的头像 发表于 11-11 15:10 220次阅读
    浅谈屋顶<b class='flag-5'>分布式</b>光伏发电<b class='flag-5'>技术</b>的设计与应用

    分布式光纤测温是什么?应用领域是?

    分布式光纤测温是一种先进的温度测量技术,它利用光纤的拉曼散射原理进行温度监测。以下是对分布式光纤测温的详细介绍: 一、基本原理 分布式光纤测温的原理基于光纤的拉曼散射效应。当光纤某处的
    的头像 发表于 10-24 15:30 189次阅读
    <b class='flag-5'>分布式</b>光纤测温是什么?应用领域是?

    分布式光纤声波传感技术的工作原理

    分布式光纤声波传感技术(Distributed Acoustic Sensing,DAS)是一种利用光纤作为传感元件,实现对沿光纤路径上的环境参数进行连续分布式测量的技术
    的头像 发表于 10-18 14:50 309次阅读
    <b class='flag-5'>分布式</b>光纤声波传感<b class='flag-5'>技术</b>的工作原理

    基于分布式计算的AR光波导中测试图像的仿真

    (10201次模拟):大约43小时。 模拟结果:不同视场角的辐射通量。 注: 21个×21个方向的结果存储在参数连续变化的光栅的查找表中。 使用分布式计算 参数运行用于改变当前视场模式的角度,这允许将
    发表于 08-07 14:13

    OpenHarmony开发案例:【分布式计算器】

    使用分布式能力实现了一个简单的计算器应用,可以进行简单的数值计算,支持远程拉起另一个设备的计算器应用,两个计算器应用进行协同
    的头像 发表于 04-11 15:24 977次阅读
    OpenHarmony开发案例:【<b class='flag-5'>分布式</b><b class='flag-5'>计算</b>器】

    智慧物流中心建设:讯维分布式智慧终端技术的核心作用

    ,包括订单信息、货物信息、运输信息等。讯维分布式终端技术通过其强大的分布式计算能力,能够实时处理这些数据,提取有价值的信息,为物流决策提供科学依据。 其次,讯维
    的头像 发表于 04-08 15:29 279次阅读

    智慧物流中心建设:分布式智慧终端技术的核心作用

    ,包括订单信息、货物信息、运输信息等。讯维分布式终端技术通过其强大的分布式计算能力,能够实时处理这些数据,提取有价值的信息,为物流决策提供科学依据。 其次,讯维
    的头像 发表于 04-07 15:29 313次阅读

    分布式运维管理平台在云计算环境中的实施案例分析

    引入分布式运维管理平台,以实现对云计算环境的全面管理和优化。 二、平台实施与优势 资源统一调度与管理 分布式运维管理平台能够自动识别、监控和管理云计算环境中的各类资源,包括虚拟机、容器
    的头像 发表于 03-26 16:16 512次阅读

    分布式存储与计算:大数据时代的解决方案

    分布式存储和计算技术应运而生,并迅速成为处理大数据的首选方案。本文将深入探讨分布式存储和计算的概念、优势及其在各个领域的应用情况。 1.分布式
    的头像 发表于 03-07 14:42 680次阅读

    得瑞领新参编团体标准《高性能计算 分布式存储系统技术要求》正式发布

    得瑞领新参编的《高性能计算 分布式存储系统技术要求》团标由中国电子工业标准化技术协会正式发布,这标志着得瑞在高性能计算
    的头像 发表于 03-01 10:00 412次阅读
    得瑞领新参编团体标准《高性能<b class='flag-5'>计算</b> <b class='flag-5'>分布式</b>存储系统<b class='flag-5'>技术</b>要求》正式发布

    分布式大屏控制系统的工作原理

    分布式大屏控制系统是一种基于分布式计算、云计算和大数据技术的控制系统,具有高效、稳定、灵活的特点。该系统通过将各个子系统进行模块化设计,使得
    的头像 发表于 01-29 14:24 672次阅读

    什么是分布式架构?

    分布式架构是指将一个系统或应用拆分成多个独立的节点,这些节点通过网络连接进行通信和协作,以实现共同完成任务的一种架构模式。这种架构模式旨在提高系统的可扩展性、可靠性和性能表现。 一、分布式架构的特点
    的头像 发表于 01-12 15:04 1139次阅读
    什么是<b class='flag-5'>分布式</b>架构?

    分布式系统硬件资源池原理和接入实践

    把各个设备的硬件外设抽象为外设信息单元,外设信息在各个可信设备之间自动同步,如此,实现了外设信息的全局可见;结合分布式硬件虚拟化技术,实现任意设备之间的硬件外设能力跨设备调用;分布式硬件资源池作为系统
    发表于 12-06 10:02

    zookeeper分布式原理

    Zookeeper是一个开源的分布式协调服务,可以用于构建高可用、高性能的分布式系统。它提供了一个简单且高效的层次命名空间,可以用来存储配置信息、状态信息、命名服务等。Zookeeper的设计目标
    的头像 发表于 12-03 16:33 602次阅读

    分布式通信是什么 分布式网络搭建

    智能机器人的功能繁多,全都放在一个计算机里,经常会遇到计算能力不够、处理出现卡顿等情况,如果可以将这些任务拆解,分配到多个计算机中运行岂不是可以减轻压力? 这就是分布式系统,可以实现多
    的头像 发表于 11-27 15:49 731次阅读
    <b class='flag-5'>分布式</b>通信是什么 <b class='flag-5'>分布式</b>网络搭建