0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让开发者更轻松 英特尔oneAPI加速统一跨架构编程

硬件设计 2019-12-23 17:25 次阅读

数据洪流下,AI5G等新技术催生的创新应用带来更加多元化的计算需求,这就要求多样化的计算架构。为此,英特尔提出了“xPU”策略,也就是英特尔不再局限于CPU(向量计算),而是向GPU(矢量计算)、AI(矩阵计算)和FPGA(空间计算)进行延展。

基于此,我们看到英特尔构建了一个包含CPU、GPU、AI加速器、FPGA,以及如神经拟态计算等面向未来的计算架构。在这样的计算架构支撑下,我们正在迈入超异构计算时代。

在超异构计算时代,英特尔确立了制程和封装、架构、内存和存储、互连、安全、软件六大技术支柱,全方位推动计算创新发展。在这其中,英特尔软件是推动未来计算创新的隐形力量。

软件加速硬件指数级创新

毋庸置疑,英特尔在硬件层面的创新是有目共睹的。但是进入到超异构计算时代,计算力指数级上升的实现一定是基于硬件与软件的结合。所以英特尔借助“软件先行”的战略,推进硬件和软件的共同创新,来引领异构计算的整合和创新,实现计算力指数级增长,满足未来多元化的计算需求。

在以数据为中心的战略指引下,英特尔不光在硬件层面进行创新,还在软件层面进行投入。因为整个计算架构不是原来的单一CPU架构,需要针对不同的架构和负载进行整合,软件在中间起了一个最关键的桥梁作用。

其实,英特尔在软件领域的投入是巨大。英特尔在全球大概十万到十一万人,软件工程师占到15%左右(15000名左右)。而在中国,英特尔亚太研发中心正式员工超过2000人,是涵盖英特尔各个产品部在中国最大的、最完整的综合性研发机构,拥有世界一流的工程研发能力。

英特尔通过软件实现软硬协同、生态共赢:提供简便可扩展的工具,来加速应用开发部署;坚持客户至上,针对不同类型的工作负载进行优化;秉承开放理念,推动开源、开放生态系统协作;产学研对接,培育面向未来的创新人才。

在软件生态构件中,开发者是重要一环。英特尔已经深入开发者生态领域超过20年,并有10000项与客户紧密合作的软件部署,是Linux Kernel最大的贡献者,每年修改的代码超过50万行,为100多个操作系统进行过优化,并且拥有超过两千万活跃开发者的生态,而这些只是英特尔庞大的软件实力的一部分。英特尔跨基础架构、网络、操作系统的开发经验,开发工具和SDK以及其所参与并影响的标准制定组织的数量在业界是无与伦比的。

基于这样深厚的积淀,英特尔希望通过“统一架构编程”,围绕架构创新进行扩展,并且让所做的一切都是简便和可扩展的。英特尔软件所做的事情使所有的硬件的每一个晶体管都能够能力充分发挥起来,使得开发者能够非常容易地把软硬件充分用起来。

oneAPI打造统一架构编程

跨架构(CPU、GPU、FPGA及其他加速器)开发能力对于处理数据密集型工作负载极为重要,因为这种工作负载需要多种架构,这也将成为未来的常态。不过多架构编程面临诸多挑战比如专用工作负载日益增多、尚无通用编程语言或 API、不一致的跨平台工具支持、每个平台需要单独的软件投资、需采用不同的以数据为中心的硬件等。

在今天,每一个硬件平台往往需要开发者维护独立的代码库,这些代码库需要使用不同的语言、库和软件工具进行编程。这是一项极其复杂和耗费时间的工作,会大大降低开发速度、抑制创新。

为了解决这样的业界难题,英特尔发布了一项全新软件行业计划oneAPI。oneAPI为异构计算提供了一个统一和简化的应用程序开发编程模型,这种统一性为开发者提供了一个统一的开发体验,因为其面对不同的异构硬件,他们不需要学习不同的编程方法。

具体来说,oneAPI基于标准的跨架构语言Data Parallel C++和SYCL功能强大的API,旨在加速特定领域的主要功能底层硬件接口,可为供应商提供硬件抽象层,支持针对不同的架构和供应商重复使用代码。也就是说oneAPI支持直接编程和API编程,并提供统一的语言和库,可以在包括CPU、GPU、FPGA和AI加速器等不同硬件架构上提供完整的本地代码性能。oneAPI的简单易用和高性能让开发者不再需要维护不同的代码库、多种编程语言以及不同的工具和工作流程。

英特尔对于未来计算的展望和承诺是:SVMS架构(S是Scalar标量,V是Vector向量,M是Matrix矩阵,S是Space空间),也就是我们前面提到的超异构计算。而在SVNS架构之上,英特尔构建oneAPI,对这些硬件进行了抽象。开发者针对的是这个抽象来写程序,而不是具体的硬件。在oneAPI是框架和中间件框架提供了更高一层的抽象和语义,开发者可以在上面快速开发,高效部署。

我们可以将oneAPI理解成英特尔的中间件层,上面有各种不同类型的行业应用,如果你要调英特尔底层的硬件,就统一用oneAPI进行研发。比如面向视觉计算的OpenVINO就是构建在oneAPI之上,支持CPU、FPGA、Movidius、GPU等,编写一次以后可以通过异构的接口支撑跑在其他的硬件平台之上。

oneAPI以开发者为中心,是为多架构并存的世界重新定义的一种新编程方式,让开发者可以自由选择架构,无需在性能上作出妥协,也大大降低了使用不同的代码库、编程语言、编程工具和工作流程所带来的复杂性。oneAPI产品为开发者提供了全套的开发工具,包括编译器、编程库、分析器等,并把这些工具封装为特定领域的工具包。

oneAPI保留了现有软件投资,包括支持现有语言,同时为开发人员创造更多丰富的应用程序提供了灵活性,帮助他们在保留现有软件投资的基础上,搭建一座无缝连接的桥梁,从而为未来的多架构世界创造更多丰富的应用程序。比如oneAPI支持高级移植、分析和调试工具,包括英特尔Vtune分析器、英特尔Advisor等,其中英特尔DPC++兼容性工具支持CUDA代码迁移。

除此以外,oneAPI包括了一项基于开放规范的行业计划,该规范包括一种编程语言、强大的API函数库以及底层硬件接口。比如Data Parallel C++可提供跨平台数据并行性支持,而SYCL是全行业开展的一项标准化工作,旨在定义面向C++的跨平台数据并行性支持。这就意味着各个不同加速器提供商可以在oneAPI框架里提供对它自己硬件的支持,其实已经有第三方通过oneAPI对于NVIDIA的CUDA进行上层的封装,这样对于开发人员来讲,他也可以oneAPI支持NVIDIA的GPU,其想象空间巨大。

开发人员从现在开始就可以在英特尔DevCloud for oneAPI上对基于多种英特尔架构(包括英特尔至强可扩展处理器、带集成显卡的英特尔酷睿处理器、英特尔FPGA如英特尔Arria、Stratix等)的代码和应用进行测试。它是一个开发系统,支持使用英特尔的oneAPI测试版软件在所有英特尔CPU、GPU和FPGA上开发、测试和运行工作负载。用户无需下载,无需购买硬件,无需安装,无需设置和配置,即可使用英特尔oneAPI工具套件,了解 Data Parallel C++,评估工作负载,构建异构应用,设计项目原型。

目前oneAPI还是Beta测试版,预计2020年Q4发布正式版。毕竟oneAPI是一个全新的开发编程模型,足够长的测试期可以收集更多开发人员的反馈,完善产品。只有更多的开发者使用oneAPI,其价值才会凸显出来。

oneAPI的发布源自英特尔数百万小时软件工程开发的努力,并且标志着一个行业内的变革,从今天受限、封闭的编程方法演变到一个开放的、基于标准的模式,助力开发人员实现跨架构的参与和创新,为全球开发人员提供一座从现有代码和技能过渡到即将来临的xPU时代的桥梁。

oneAPI是英特尔借助软件力量充分释放硬件性能这一长期探索之旅的第一步,也是重要一步。目前英特尔正在与高校、合作伙伴等通过将oneAPI引入学校课程、线下Workshop等让更多开发者认识和使用oneAPI,同时通过开发人员指南、培训、英特尔工具支持论坛、ISV和应用支持等加速oneAPI的落地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏

    评论

    相关推荐

    使用英特尔哪吒开发套件部署YOLOv5完成透明物体目标检测

    英特尔的哪吒(Nezha)开发套件是款专为边缘AI和物联网应用设计的高性能计算平台,搭载了英特尔 N97处理器、内置英特尔 UHD Gra
    的头像 发表于 11-25 17:15 206次阅读
    使用<b class='flag-5'>英特尔</b>哪吒<b class='flag-5'>开发</b>套件部署YOLOv5完成透明物体目标检测

    英特尔考虑出售Altera股权

    近日,英特尔(Intel)正积极寻求出售其可编程芯片制造子公司Altera的股权,并考虑引入战略投资或PE投资。据悉,英特尔对Altera的估值约为170亿美元,而英特尔于2015年以
    的头像 发表于 10-21 15:42 422次阅读

    英特尔将携手AMD共同捍卫x86生态

    Advisory Group)由英特尔和AMD共同创立,其目标在于推动x86架构的未来发展,简化软件开发流程,保障互操作性和接口的致性,并为开发
    的头像 发表于 10-16 13:49 455次阅读

    英特尔中国开源技术委员会成立周年

    开源已成为技术和产业生态发展的重要趋势。英特尔秉持着开放、选择、信任的原则贯彻开源,并在社区、开源项目、开发者等方面贡献力量,带动更多参与共同实现生态繁荣。2023年2月,英特尔中国
    的头像 发表于 08-16 15:35 455次阅读

    从运动员到开发者: 英特尔以开放式AI系统应对多重挑战

    打造的生成式AI(GenAI)检索增强生成(RAG)解决方案。该成果深度展示了英特尔如何通过基于英特尔®至强®处理器和英特尔® Gaudi AI加速器的开放式AI系统及平台,帮助
    的头像 发表于 07-25 09:28 271次阅读
    从运动员到<b class='flag-5'>开发者</b>: <b class='flag-5'>英特尔</b>以开放式AI系统应对多重挑战

    英特尔确认Ponte Vecchio GPU将以云服务形式推出

    英特尔在公告中强调,随着AI技术需求的不断增加,公司重点利用Gaudi AI加速器的性能优势及有竞争力的价格,实现其迅速拓展。同时,至强系列CPU依然是HPC解决方案的首选,而数据中心GPU Max亦可在英特尔
    的头像 发表于 05-18 17:14 1052次阅读

    BittWare提供基于英特尔Agilex™ 7 FPGA最新加速

    BittWare 当前的加速板产品组合包括最新的英特尔 Agilex 7 FPGA F、I 和 M 系列,包括 Compute Express Link (CXL) 和 PCIe* 5.0
    的头像 发表于 04-30 15:22 820次阅读
    BittWare提供基于<b class='flag-5'>英特尔</b>Agilex™ 7 FPGA最新<b class='flag-5'>加速</b>板

    英特尔开发套件『哪吒』在Java环境实现ADAS道路识别演示 | 开发者实战

    本文使用来自OpenModelZoo的预训练的road-segmentation-adas-0001模型。ADAS代表高级驾驶辅助服务。该模型识别四个类别:背景、道路、路缘和标记。硬件环境此文使用了英特尔开发套件家族里的『哪吒』(Nezha)
    的头像 发表于 04-29 08:07 544次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>开发</b>套件『哪吒』在Java环境实现ADAS道路识别演示 | <b class='flag-5'>开发者</b>实战

    英特尔面向AI PC软件开发者与硬件供应商新增助力计划

    英特尔公司近日宣布“AI PC加速计划”再添两项人工智能(AI)新举措,即新增“AI PC开发者计划”,并吸纳独立硬件供应商(IHV)加入“AI PC加速计划”。
    的头像 发表于 04-02 10:09 332次阅读

    英特尔宣布AI PC加速计划新增两项AI举措

    首先,“AI PC 开发者计划”面向软件研发人员和独立软件开发商,为他们提供便捷的开发环境,助力加速大规模运用新型 AI技术。此计划包含
    的头像 发表于 03-27 16:03 375次阅读

    【转载】英特尔开发套件“哪吒”快速部署YoloV8 on Java | 开发者实战

    OpenVINO 工具套件基于OneAPI开发,可以加快高性能计算机视觉和深度学习应用开发速度的工具套件,适用于从边缘到云的各种英特尔计算平台上,帮助用户更快地将更准确的真实世界数据的
    的头像 发表于 03-23 08:05 546次阅读
    【转载】<b class='flag-5'>英特尔</b><b class='flag-5'>开发</b>套件“哪吒”快速部署YoloV8 on Java | <b class='flag-5'>开发者</b>实战

    基于英特尔哪吒开发者套件平台来快速部署OpenVINO Java实战

    OpenVINO 工具套件基于OneAPI开发,可以加快高性能计算机视觉和深度学习应用开发速度的工具套件,适用于从边缘到云的各种英特尔计算平台上
    的头像 发表于 03-21 18:24 1471次阅读
    基于<b class='flag-5'>英特尔</b>哪吒<b class='flag-5'>开发者</b>套件平台来快速部署OpenVINO Java实战

    英特尔旗下FPGA公司Altera正式亮相

    日前,英特尔 FPGA Vision线上直播中发布,将英特尔编程解决方案事业部 (PSG) 作为独立的FPGA公司——Altera。
    的头像 发表于 03-18 14:11 545次阅读

    英特尔 DLB 的硬件实施方案加速数据传输

    英特尔 动态负载均衡器(英特尔 DLB)是全新英特尔 至强 可扩展处理器中内置的加速器,可提高网络、在线游戏、金融交易以及入侵检测和防御
    的头像 发表于 03-09 16:34 2053次阅读

    新思科技与英特尔深化合作加速先进芯片设计

    近日,新思科技与英特尔宣布深化合作,共同加速先进芯片设计的步伐。据悉,新思科技的人工智能驱动的数字和模拟设计流程已经成功通过英特尔代工的Intel 18A工艺认证,这突破性的进展标志
    的头像 发表于 03-06 10:33 650次阅读