0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

协处理器的介绍及应用

电子工程师 来源:网络整理 作者:工程师曾暄茗 2018-07-15 09:27 次阅读

处理器是什么

协处理器(coprocessor),一种芯片,用于减轻系统微处理器的特定处理任务。

协处理器,这是一种协助中央处理器完成其无法执行或执行效率、效果低下的处理工作而开发和应用的处理器。这种中央处理器无法执行的工作有很多,比如设备间的信号传输、接入设备的管理等;而执行效率、效果低下的有图形处理、声频处理等。为了进行这些处理,各种辅助处理器就诞生了。需要说明的是,由于现在的计算机中,整数运算器与浮点运算器已经集成在一起,因此浮点处理器已经不算是辅助处理器。而内建于CPU中的协处理器,同样不算是辅助处理器,除非它是独立存在。

特定处理任务

例如,数学协处理器可以控制数字处理;图形协处理器可以处理视频绘制。例如,intel penTIum 微处理器就包括内置的数学协处理器。

内核相连

协处理器可以附属于ARM处理器。一个协处理器通过扩展指令集或提供配置寄存器来扩展内核处理功能。一个或多个协处理器可以通过协处理器接口与ARM内核相连。

协处理器可以通过一组专门的、提供load-store类型接口的ARM指令来访问。例如协处理器15(CP15),ARM处理器使用协处理器15的寄存器来控制cache、TCM和存储器管理。

扩展指令集

协处理器也能通过提供一组专门的新指令来扩展指令集。例如,有一组专门的指令可以添加到标准ARM指令集中,以处理向量浮点(VFP)运算。

这些新指令是在ARM流水线的译码阶段被处理的。如果在译码阶段发现是一条协处理器指令,则把它送给相应的协处理器。如果该协处理器不存在,或不认识这条指令,则ARM认为发生了未定义指令异常。这也使得编程者可以用软件来仿真协处理器的行为(使用未定义指令异常服务子程序)。

内部结构

协处理器80x87的内部结构如图所示。它可分为二个主要部分:控制部件(CU)和数值执行部件(NEU)。

控制部件(CU)把协处理器接到CPU的系统总线上,协处理器和CPU都监视正在执行的指令流。如果当前将要执行的指令是协处理器指令(即:ESCape指令),那么,协处理器会自动执行它,否则,该指令将交给CPU来执行。

数值执行部件(NEU)复制执行所有的协处理器指令,它有一个用8个80位的寄存器组成的堆栈,该堆栈用于以扩展精度的浮点数据格式来存放数学指令的操作数和运算结果。在协处理器指令的执行过程中,要么指定该堆栈寄存器中的数据,要么使用压栈/出栈机制来从栈顶存放或读取数据。

在NEU部件中,还有一些记录协处理器工作状态的寄存器,如:状态寄存器、控制寄存器、标记寄存器和异常指针寄存器等。有关这些寄存器的作用将在后面给予分别介绍。

intel协处理器有什么用

协处理器在超级计算机领域崭露头角,与中国合作的天河二号继续霸占全球No.1宝座,Intel近日又披露了 下一代产品“Knights Landing”的更多技术细节,进步之大令人震惊。

现在的Xeon Phi只是协处理器,需要做成PCI-E扩展卡的样式,搭配Xeon E6-2600/v2系列中央处理器才能运作,只是起到加速作用。

幸运的是,Xeon Phi虽然基于新的IMC众核架构,但本质上依然是x86,所以同样可以扮演中央处理器的角色,原生运行操作系统

Intel披露说,Knights Landing将有协处理器、主处理器两种样式供选择,其中后者可安装在标准的服务器机架内,完全原生运行各种程序,而不需要专门的协处理器,这将大大简化编程难度,消除内存、PCI-E、网络之间数据转移的延迟,进而提升性能。

制造工艺也会从22nm进步到最新的14nm,更有利于缩小内核面积、扩大计算规模、降低整体功耗。

特别是在内存配置方面,Knights Landing会提供三种不同的方式,同时只需标准的内存编程模型即可,不像其它百亿亿次超高性能计算的概念设计那样还得开发特定的代码。

Knights Landing的主处理器版本会在内部整合封装高带宽的内存缓冲(胶水式而非原生),再搭配外部的DDR3、DDR4内存,将极大地提升内存密集型应用的性能。

根据今年早些时候泄露的一张幻灯片,Knights Landing将在2015年初发布,支持AVX 3.1指令集、DDR4内存、PCI-E 3.0总线。

具体性能暂时没有官方数据,据说双精度浮点速度可以提升到大约3TFlops,能效折合14-16GFlops/W,而现在的Knights Corner只有大约1TFlops、4-6GFlops/W。

不过这比起GPU来说还是有些弱,比如NVIDIA的开普勒现在就有5.7GFlops/W,下一代麦克斯韦可达8-16GFlops/W。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10850

    浏览量

    211518
  • intel
    +关注

    关注

    19

    文章

    3481

    浏览量

    185900
  • 协处理器
    +关注

    关注

    0

    文章

    75

    浏览量

    18170
收藏 人收藏

    评论

    相关推荐

    迅为4412开发板源码分析之处理器

    是,uboot 新版的源码中自带这部分源码。 这里给大家简要介绍下上面的几个重要名词概念。3.2.2 ARM 的处理器作者将介绍前面涉及到的寄存
    发表于 07-29 15:36

    小白求助怎样去使用ARM处理器

    ARM通过增加硬件处理器来支持对其指令集的通用扩展,通过未定义指令陷阱支持这些处理器的软件仿真。简单的ARM核提供板级
    发表于 04-24 09:36

    简述处理器发展历程及前景展望

    简述了处理器的概念、任务、发展历程和现状,探讨了处理器之所以引起人们重视和再重视的原因及其优势,简单介绍和展望了如何用FPGA 等类型
    发表于 01-02 11:23 18次下载

    ARM处理器指令介绍

    处理器(coprocessor),一种芯片,用于减轻系统微处理器的特定处理任务。处理器,这是
    发表于 11-10 15:56 2799次阅读

    手机上的处理器有什么作用_苹果处理器是干什么的

    本文首先介绍处理器概念,其次介绍处理器内部结构与手机
    的头像 发表于 04-24 09:27 2.2w次阅读

    有哪些手机内置了处理器_五款内置处理器的手机介绍

    本文主要介绍了五款内置处理器的手机。处理器用于减轻系统微处理器的负担,执行特定
    的头像 发表于 04-24 09:58 1.6w次阅读

    arm的处理器有几个?ARM处理器详解

    本文首先介绍了ARM处理器特点与主要模式,其次介绍了arm的处理器有几个,最后介绍了CP14和
    发表于 04-24 15:34 8954次阅读

    第4章第1部分:英特尔XeonPhi™处理器介绍

    Intel® Xeon® & Xeon® Phi™ Webinar: This two day webinar series introduces you to the world of multicore and manycore computing with Intel® Xeon® processors and Intel® Xeon Phi™ coprocessors.
    的头像 发表于 10-19 07:14 1913次阅读

    第4章第2部分:英特尔XeonPhi™处理器介绍

    Intel® Xeon® & Xeon® Phi™ Webinar: This two day webinar series introduces you to the world of multicore and manycore computing with Intel® Xeon® processors and Intel® Xeon Phi™ coprocessors.
    的头像 发表于 10-19 07:17 2955次阅读

    网络研讨会系列: 英特尔Xeon Phi™处理器介绍(编译7第3部分)

    Intel® Xeon® & Xeon® Phi™ Webinar: This two day webinar series introduces you to the world of multicore and manycore computing with Intel® Xeon® processors and Intel® Xeon Phi™ coprocessors.
    的头像 发表于 10-15 03:11 2060次阅读

    英特尔Xeon Phi™处理器介绍

    This module covers the intent of the workshop, the type viewer the workshop is aimed at, a brief look at the hardware architecture of the Intel® Xeon Phi™ coprocessor
    的头像 发表于 09-29 05:43 4275次阅读

    使用处理器加速的方法介绍

    了解处理的价值,Zynq-7000加速一致性端口,使用处理器加速的方法以及
    的头像 发表于 11-30 06:15 4258次阅读

    WOLA 滤波处理器介绍性概念和技术

    WOLA 滤波处理器介绍性概念和技术
    发表于 11-15 19:48 11次下载
    WOLA 滤波<b class='flag-5'>器</b>组<b class='flag-5'>协</b><b class='flag-5'>处理器</b>:<b class='flag-5'>介绍</b>性概念和技术

    使用TMS320C6416处理器:Viterbi处理器(VCP)

    电子发烧友网站提供《使用TMS320C6416处理器:Viterbi处理器(VCP).pdf》资料免费下载
    发表于 10-21 09:36 0次下载
    使用TMS320C6416<b class='flag-5'>协</b><b class='flag-5'>处理器</b>:Viterbi<b class='flag-5'>协</b><b class='flag-5'>处理器</b>(VCP)

    使用TMS320C6416处理器:Turbo处理器(TCP)

    电子发烧友网站提供《使用TMS320C6416处理器:Turbo处理器(TCP).pdf》资料免费下载
    发表于 10-23 10:16 0次下载
    使用TMS320C6416<b class='flag-5'>协</b><b class='flag-5'>处理器</b>:Turbo<b class='flag-5'>协</b><b class='flag-5'>处理器</b>(TCP)