为进一步帮助开发者利用英特尔硬件的先进功能,近日,英特尔宣布英特尔® oneAPI工具包的2023年版本已在英特尔®开发者云平台(Intel® Developer Cloud)上线,并正在通过现有的渠道推送。
新的oneAPI 2023工具包支持即将推出的第四代英特尔®至强®可扩展处理器、英特尔®至强® CPU Max 系列和英特尔®数据中心GPU,包括Flex系列和新的Max系列。这些工具可提升性能和生产力,并增加了对新的Codeplay1插件的支持,使开发者能更容易地为那些非英特尔的GPU架构编写SYCL代码。这些基于标准的工具提供了硬件方面的选择,也让在跨架构系统上运行的高性能应用的开发变得更加轻松。
英特尔oneAPI 2023工具包包括一套完整的最新编译器、库、分析和移植工具,以及优化后的AI和机器学习框架,让开发者能为oneAPI支持的CPU、GPU和FPGA构建高性能、跨架构的应用。开发者可使用这些工具快速实现性能目标,并通过单个代码库节省时间,从而将更多时间用于创新。
新版本的oneAPI工具包可帮助开发者利用英特尔硬件的先进功能:
· 第4代英特尔至强可扩展处理器和至强CPU Max系列,内置英特尔®高级矩阵扩展(英特尔® AMX)、Quick Assist 技术(QAT)、英特尔®AVX-512、bfloat16 及更多。
· 英特尔®数据中心GPU,包括内置基于硬件的AV1编码器的Flex系列,以及Max系列。Max系列提供灵活数据类型的支持,内置英特尔® Xe矩阵扩展(英特尔®XMX)、矢量化引擎(vector engine)、英特尔®Xe-Link互联扩展和其它功能。
oneAPI 2023工具包具有先进的软件性能:
· 英特尔® Fortran编译器(Intel® Fortran Compiler)提供了完整的 Fortran 语言直至 Fortran 2018标准的支持,并扩展了对 OpenMP GPU 分流的支持,加快了符合标准的应用程序的开发。
· 英特尔® oneAPI数学内核库(oneMKL)包含OpenMP 分流能力的扩展,提高了可移植性。
· 英特尔® oneAPI 深度神经网络库(oneDNN) 支持第四代英特尔至强处理器和Max系列CPU处理器的高级深度学习功能,包括英特尔®AMX、英特尔®AVX-512、VNNI 和 bfloat16。
通过丰富的SYCL支持,以及代码迁移和分析工具的强化,让面向多架构系统的代码开发变得更轻松,进而提高开发者的生产力。
· 英特尔®oneAPI DPC++/C++编译器增加了Codeplay为英伟达和AMD GPU开发的新插件的支持,以简化SYCL代码的编写,并提高代码面向这些处理器架构的可移植性。这提供了一个统一的构建环境,并整合了工具,以提高跨平台生产力。作为该解决方案的一部分,英特尔和Codeplay将为英伟达GPU的oneAPI插件开始提供商业化的优先支持(priority support)。
· 基于开源 SYCLomatic的英特尔® DPC++ 兼容性工具增加了100多个新的CUDA APIs支持,让从CUDA到SYCL的代码迁移变得更容易。
· 用户可以使用英特尔®VTune™ Profiler识别大规模MPI应用中的不均衡问题。
· 英特尔® Advisor为英特尔数据中心GPU Max系列添加了自动化roofline分析,以识别内存、缓存或计算瓶颈,确认其原因并进行优先处理,同时提供可操作的建议,以优化从CPU到GPU 的工作负载分流中的重复数据传输成本。
48%4的开发者面向使用多种处理器的异构系统进行开发,因此需要更高效的跨架构编程来应对现实工作负载日益扩大的范围和规模。结合使用oneAPI 的开放、统一的编程模型与英特尔基于标准的多架构工具,开发者能够在CPU和加速器的硬件、性能、生产力和代码可移植性方面自由地进行选择。相反,为专有编程模型(如 CUDA)编写的代码,缺乏面向其它硬件的可移植性,让开发实践变得孤立,将企业困于一个封闭的生态系统中。
此外, 开放生态系统也在继续扩大对oneAPI的使用,新的oneAPI卓越中心正在陆续成立。剑桥大学Open Zettascale 实验室正致力于将重要的百万兆级的备选代码(candidate codes)移植到oneAPI上,包括CASTEP、FEniCS和AREPO。该中心还提供课程和研讨会,由专家讲授oneAPI使用方法和工具,用于编译和移植代码以及优化性能。目前,在全球总共已经建立了30个oneAPI卓越中心。
*可前往英特尔新闻发布室了解更多产品性能具体细节
审核编辑 黄昊宇
-
英特尔
+关注
关注
60文章
9855浏览量
171229
发布评论请先 登录
相关推荐
评论