眼下在非移动处理器市场风光无限的英特尔,其实也有着发展路上苦涩的经历,各种成功、失败、喜悦、沮丧,汇集在一起,才使得这位行业大佬发展到今天这样的位置。
下面,小编就带你梳理一下该公司历史上的35款经典芯片,看英特尔CPU的发展都经历了哪些鲜为人知的故事,也看看它走麦城时候的样子。
始于4004
1971年,英特尔第一款微处理器——四位的4004面世,它与其他三个芯片配合工作,分别是4001的ROM,4002的RAM,以及移位寄存器4003。而4004负责进行计算。当时,4004在计算器和类似的设备中大量采用,但还未能应用于计算机中,它的最大时钟速度为740 kHz。
4004之后,一款类似的处理器出现了,称为4040,它基本上是一款扩展的指令集和更高性能的改进版本的4004。
8008和8080
4004打响了英特尔微处理器业务的第一枪,随后,英特尔推出了全新的八位处理器,1972年,8008诞生,紧随其后的是1974年的8080和1975年的8085。8008是由英特尔生产的第一款八位处理器,值得一提的是,8080的速度比4004快,这得益于其八位处理数据的能力,但它的时钟频率偏保守,在200kHz~800kHz之间,8008的性能没有能够吸引多少系统开发商。8008使用10微米晶体管制程技术。
8080则较为成功。它在8008基础上加入了新的指令,并过渡到了6微米的晶体管制程。这使其时钟速率提升了一倍以上,1974年,最高性能的8080芯片运行在2 MHz。8080被应用到了很多设备当中,这导致一些软件开发商,如那段时间刚成立的微软,开始关注适用于英特尔处理器的软件开发。
当8086发布时,它是基于8080,并保持软件的向后兼容性。8080和关键硬件因素已出现在所有基于x86处理器的生产当中,8080的软件可以运行在任何x86处理器上。
8085是一个不太昂贵,且时钟频率更高的变种8080。
8086:x86的开始
英特尔首款16位处理器是8086,相比以前的设计,提高了性能。它不仅是主频高于8088,还采用16位外部数据总线和一个6字节的预取队列。它也能够运行16位的任务(尽管大多数软件是专为八位处理器设计的)。地址总线扩展到20位,使8086可以访问1MB内存,性能明显提高。
8086成为了第一个x86处理器,它使用了x86ISA的第一次修订,后来,几乎所有由英特尔和AMD开发的处理器都是建立在8086基础之上的。
英特尔在同一时间还推出了8088。该处理器是基于8086的,但是有很多数据线和四字节的指令预取队列都减半,这导致失去平衡,为窄总线切取指令率,迫使其执行单元空闲的时间不多。它具有1MB的RAM,比以前的处理器更高的频率,但它比8086慢一点。
80186和80188
英特尔跟进8086与其他几个处理器,所有这些都使用了类似的16位架构。第一次是在80186上,针对嵌入式应用。为推动这项工作,英特尔将主板上的一些硬件进了CPU,包括时钟发生器、中断控制器、定时器。对某些指令,即使在相同的时钟频率,80186比8086跑得快得多。当然,英特尔自然会提升CPU的频率,以进一步提高性能。
80188同样把一些硬件功能块集成了进去。但同8088一样,其数据总线减少了一半。
80286:更多的内存,更高的性能
80286与80186在同一年发布,性能几乎相同,但它的扩展地址总线为24位,使处理器能够访问到16MB内存。
iAPX 432
iAPX 432是英特尔早期尝试从x86投资组合中脱颖而出的一种完全不同的设计。英特尔预计iAPX 432比其他产品快几倍。然而,该款处理器最终失败了,原因在于一些设计缺陷。虽然x86处理器相对复杂,但iAPx 432将CISC带到了一个全新的复杂程度。硬件设计相当大胆,迫使英特尔将其从两个独立的die中进行制作。该处理器如果没有极高的带宽,则表现不佳。iAPX 432的性能超过了8080和8086,但是它很快就被较新的x86产品超过了,因此,最终被放弃了。
i960:英特尔的第一个RISC处理器
英特尔在1984年推出了其第一个RISC处理器。它不是x86处理器的直接竞争对手,因为它是作为一个安全的嵌入式解决方案。它使用伯克利RISC设计概念的32位超标量架构。第一款i960处理器的时钟频率相对较低,其中最慢的模式运行在10 MHz,但多年来,它被改进,并转变为使用更高的制程,使其达到100 MHz。它还支持4GB的受保护的内存。
i960被广泛应用在军事和商业系统。
80386:32位x86处理器
英特尔的第一个32位x86处理器是80386,发布于1985年。该处理器有一个关键的优势是它的32位地址总线,可以支持高达4GB的系统内存。虽然这远远超过所有人的使用需求,内存限制往往伤害现有x86的性能和竞争处理器。与现代CPU不同的是,在80386发布的时候,更多的RAM几乎总是转化为性能提升。英特尔还实施了几个架构增强功能,可以将性能提升到80286以上,即使两个系统都使用相同的RAM数量。它还支持虚拟模式处理,从而增加了多任务支持。
为了更经济的分割其产品阵容,英特尔还推出了80386SX。这个处理器与80386几乎相同,它仍然采用32位架构,但其数据总线的一半被削减到16位,以节省成本。
i860
1989年,英特尔又试图摆脱其x86处理器,它推出了一个称为i860的新RISC CPU。与早期的i960不同,该CPU被设计为在桌面市场上竞争的高性能模型,但设计证明是有问题的。其最重要的缺陷是处理器的性能完全依赖于编译器,按照在软件首次创建时需要执行的顺序放置指令,这有助于英特尔保持芯片尺寸和i860的整体复杂性,但是在编译程序时,几乎无法正确列出从开始到结束的所有指令,这导致CPU在尝试解决问题时不断停止工作。
80486:集成FPU
英特尔的80486在性能方面又是一个重大的进步。其成功的关键是将组件更紧密地集成到CPU中。80486是第一个包含L1缓存的x86 CPU。早期的80486型号带有8KB的裸片,并在1000nm工艺上刻蚀。但随着设计转变为600nm,L1缓存大小翻了一番,达到了16KB。
英特尔还将FPU整合到CPU中,到目前为止,这是一个单独的功能处理单元。通过将这些硬件移动到主机处理器中,它们之间的延迟急剧下降。80486还使用更快的FSB接口来增加带宽,并且核心有各种其他调整推动IPC。这些变化显着提高了80486的性能,高端机型比旧式80386快了多倍。
第一个80486处理器达到50 MHz,后来使用改进的600nm工艺的型号高达100 MHz。为了针对经济型用户,英特尔还发布了一款名为80486SX的80486版本,其中FPU已被禁用。
P5:第一个奔腾处理器
Pentium于1993年出现,是第一款不遵循80x86号码系统的Intelx86处理器。在内部,Pentium使用了P5架构,这是英特尔首款x86超标量设计。虽然奔腾的速度一般比80486快,但其最突出的特点就是FPU大大提高。原始奔腾的FPU比80486的老化单位快十倍以上。这在英特尔发布奔腾MMX的后期几年中变得更加显着。这款处理器在架构上与原始Pentium相同,但支持英特尔新的MMXSIMD指令集,可大幅提升性能。
英特尔还相对于80486增加了奔腾处理器的L1缓存。初始Pentium包含16KB,而Pentium MMX则上升到32KB。当然,这些处理器也以较高的时钟速率运行。第一台Pentium处理器使用800nm晶体管制程,可能只能达到60 MHz,但随后转变为英特尔250nm工艺,并将频率推高至300MHz。
P6:Pentium Pro
英特尔计划以Pentium Pro为基础的P6架构快速跟随奔腾,但遇到了技术难题。由于其无序(OoO)设计,Pentium Pro在32位操作中比Pentium快得多。它具有重新设计的内部架构,将指令解码为微操作,然后在通用执行单元上执行。由于附加的解码硬件,它还使用了显着扩展的14级流水线。
由于第一款Pentium Pro处理器面向服务器市场,英特尔将地址总线再次扩展到36位,并增加了PAE技术,使其能够支持高达64GB的RAM。这远远超过一般用户的需求,但是能够支持更大量的RAM是英特尔服务器的关键。
处理器的缓存系统也被重做。L1缓存限于两个分段的8KB缓存,一个用于指令,一个用于数据。为了弥补与Pentium MMX相比的16KB的缺陷,英特尔在附加到CPU包的单独芯片上放置了256KB和1MB的L2缓存。它使用背面总线(BSB)连接到CPU。
英特尔最初计划将Pentium Pro推向消费者,但最终将其限制为服务器产品。Pentium Pro具有几项革命性的功能,但在性能方面却与Pentium和Pentium MMX相悖。在16位操作中,较早的Pentium部件都显着增加,16位软件在当时仍然被大量使用。处理器也不支持MMX指令集,这导致奔腾MMX在MMX优化软件中表现优于Pentium Pro。
Pentium Pro可能在消费市场上有机会,但由于包含L2缓存的独立芯片,生产成本也相当高昂。最快的PentiumPro处理器的运行频率为200 MHz,采用500到350nm之间的晶体管制程。
P6:奔腾II
英特尔并没有放弃P6架构,而是等到1997年发布了Pentium II。奔腾II设法克服了Pentium Pro几乎所有的负面因素。其基础架构与Pentium Pro类似,并且继续使用一个14阶段的管道,对内核进行了几项改进,以改进IPC。L1增长到16KB数据+ 16KB指令高速缓存。
英特尔也转移到更加经济实惠的高速缓存芯片,连接到更大的硅封装以降低生产成本。这是使Pentium II成本更低的有效方法,但这些内存模块无法以CPU的速度运行。相反,L2缓存以半频率运行,而这些早期的处理器足以提高性能。
英特尔还增加了对MMX指令集的支持。Pentium II内部使用的代码为“Klamath”和“Deschutes”的CPU内核也被销售为服务器的至强和奔腾II Overdrive产品。最高性能型号包含512KB的L2缓存,运行频率为450 MHz。
P6:1 GHz的奔腾III
英特尔计划使用基于其Netburst架构的处理器来跟踪奔腾II,但尚未准备好。相反,英特尔将P6架构再次推出为Pentium III。
这些处理器中的第一个代号为“Katmai”,与Pentium II非常相似,因为它使用了一个含有低质量二级缓存的插槽式墨盒,占据CPU速度的一半。底层架构纳入其他重大变化,因为14级管道的几个部分融合在一起,将其缩短到10个等级。由于更新的管道和时钟速度的提高,奔腾III处理器中的第一个处理器通常以小幅度优于其Pentium II对手。
Katmai使用250nm晶体管制程。然而,随着迈向180nm制造工艺,英特尔能够显着提升Pentium III的性能。这个更新的实现,代号为“Coppermine”,将L2缓存移动到CPU中,并将其容量减少一半(低至256KB)。但是由于能够以处理器的频率运行,性能仍然高涨。
Coppermine是英特尔与AMD Athlon的竞争产品,在竞争中打破了1GHz。英特尔试图生产1.13GHz的型号,但是汤姆硬件公司的Tom Pabst博士调查发现,这是不稳定的情况后,最终才被召回。这使得1 GHz型号成为最快的Coppermine Pentium III。
Pentium III内核的最后一个命名为“Tualatin”。它采用130nm工艺,时钟频率高达1.4GHz。它还将L2缓存增加到512KB,这有助于提高性能。
P5和P6:赛扬和至强
在奔腾II发布之前,英特尔还推出了其Celeron和Xeon产品系列。这些产品使用与Pentium II或Pentium III相同的内核,但具有不同数量的缓存。基于Pentium II的第一款Celeron品牌处理器根本没有二级缓存,导致了可怕的性能。与Pentium III相比,之前基于Pentium III的型号的二级缓存的一半禁用。这导致Celeron处理器使用的Coppermine内核只包含128KB的L2缓存;基于Tualatin的后期模型将其增加到256KB。
这些半高速缓存衍生产品被称为Coppermine-128和Tualatin-256。英特尔以与Pentium III相当的时钟速度出货,这使得他们表现良好,使其对AMD的Duron处理器具有很强的竞争力。微软使用了以733 MHz为单位的Coppermine-128 Celeron处理器,作为Xbox游戏机的CPU。
第一个Xeon处理器类似,但它们包含更多的L2缓存。基于Pentium II的至强处理器至少包含512KB,与Pentium II CPU相同,而高端机型则可能高达2MB。
Netburst
在讨论英特尔Netburst架构和奔腾4之前,重要的是要检查其深层流程背后的想法,该思路描述了指令通过核心的过程。线程通常执行多个任务,但有时它们专门用于单个功能。通过添加新硬件或将一个线程分为多个线程,可以扩展执行通道。处理器流水线也可以通过删除硬件或将多个组件下载到单个线程来缩小。
管道的长度或深度对延迟,IPC,时钟速度和架构的吞吐量有直接影响。较长的管道通常需要大量的带宽,但是如果流水线保持适当的数据馈送,那么管道中的每个阶段都保持忙碌状态。具有更长管道的处理器通常能够以更高的时钟速率运行。
在处理器内部的权衡是更高的延迟,因为流经它的数据必须在每个阶段停止一定数量的时钟周期。使用长管道的处理器也倾向于具有较低的IPC,这就是为什么它们依靠更高的频率来提高性能。多年来,执行这两种理念的处理器已经证明是成功的。
Netburst:奔腾4Willamette和Northwood
在2000年,英特尔的Netburst架构终于准备好了,并被推出了奔腾4。这个组合将在未来六年内领衔英特尔的高端CPU。第一个被命名为“Willamette”,它在其生命的头两年承载了Netburst和Pentium 4。然而,这对英特尔来说是一个困扰的时期,芯片的竞争力超过奔腾III。Netburst能够显着提高频率,Willamette设法达到2 GHz,但在某些任务中,1.4 GHz的Pentium III仍然更快。AMD的Athlon处理器在此期间表现良好。
Willamette的问题是,英特尔将管道延伸到20个线程,并计划获得超过2GHz的时钟频率,但由于功耗和散热问题,它无法实现这些目标。英特尔的130nm设计被称为“Northwood”,情况有所改善,扩大到3.2 GHz,二级缓存从256KB翻一番,达到512KB。Netburst的功耗和散热依然存在。然而,Northwood却表现较好,对AMD的竞争非常激烈。
在高端机型上,英特尔还推出了超线程技术,以提高强调多任务的环境中的资源利用率。超线程在Northwood上并不像现在的Core i7处理器那样有利,但是它的性能提高了几个百分点。
Willamette和Northwood也在Celeron和Xeon品牌的CPU中发布。与上一代基于Celeron和Xeon的产品一样,英特尔提升或降低了二级缓存大小,以区分其性能。
P6:奔腾M
由于Netburst被设计为一个功能强大的高性能架构,并没有将其转化为移动系统。相反,在2003年,英特尔创建了专门为笔记本电脑设计的第一个架构。Pentium-M基于P6架构,但具有更长的12-14级流水线。这也是英特尔的第一个可变长度管道,这意味着如果指令所需的信息已经加载到缓存中,则可以在仅仅12个阶段之后执行指令。如果没有,它必须经过两个额外的阶段来加载数据。
这些处理器中的第一个采用130nm晶体管制程,并包含1MB二级缓存。它设法达到1.8 GHz,而功耗仅为24.5W。被称为“Dothan”的后续版本于2004年发布,转换为90nm制程。这使得英特尔将L2缓存增加到2MB,并结合许多核心增强功能,提供了体面的IPC吞吐量改进。CPU也扩大到2.27 GHz,功率略微增加到27W。
Pentium-M架构最终在Stealey A100移动CPU内部使用,之后被Intel的Atom处理器所取代。
Netburst: Prescott
Northwood从2002年至2004年将Netburst架构运行,之后英特尔推出了Prescott,并进行了大量改进。它采用了90nm的制造工艺,使Intel能够将L2缓存增加到1MB。英特尔还推出了新的LGA 775接口,其特点是支持DDR2内存和比第一个基于Northwood的CPU更快的四泵浦FSB。这些变化导致Prescott的带宽明显高于Northwood,这对于提高净爆弹的表现至关重要。Prescott还是英特尔第一款64位x86处理器,允许它一次访问更多的RAM并运行64位。
普雷斯科特应该是英特尔基于Netburst处理器系列的失败案例。英特尔再次延长其执行流程,此次达到31个阶段。该公司希望提高时钟速率足以抵消更长的管道,但只能达到3.8 GHz。普雷斯科特太热了,功耗高。英特尔预计采用90nm制程以缓解这个问题,但晶体管密度的增加使得制冷更加困难。由于无法达到更高的频率,普雷斯科特的进化变化会损害整体性能。
即使有了所有的增强功能和额外的缓存,Prescott在任何给定的时钟速率下,都与Northwood一样。大约在同一时间,AMD的K8处理器也正在向更小的晶体管制程转移,从而使其处于更高的频率。在这个短暂的时间内,AMD主宰了桌面CPU市场。
Netburst:奔腾D
2005年,这场比赛是为了生产第一个面向消费者的双核处理器。AMD已经宣布了其双核Athlon 64,英特尔通过使用包含两个Prescott芯片的多核模块(MCM)击败AMD。该公司称其双核处理器为奔腾D,而第一款型号为“史密斯菲尔德”。
然而,奔腾D面临着同样困扰普雷斯科特的问题。两个基于Netburst的die的热能和功率最大限制了时钟频率为3.2 GHz。由于架构受带宽限制,Smithfield的IPC吞吐量分在两个内核之间。运作也不是特别顺畅。而AMD的双核CPU由一个模块构建,被认为是优越的。
随后,史密斯菲尔德被普雷斯勒(Presler)所接受,后者转向了65nm制程技术它在MCM上包含两个Ceder Mill的die。这有助于降低处理器的热量和功耗,并让英特尔将其时钟频率提高到3.8 GHz。
普雷斯勒有两个关键的步骤。第一个具有更高的125W TDP,而后者下降到95W。由于芯片尺寸更小,英特尔能够将二级缓存增加一倍,因此每个模块都有2MB。一些型号还提供超线程,允许CPU同时处理四个线程。
所有Pentium D处理器都支持64位软件,可以利用超过4GB的RAM。
结语
好了,今天先介绍这些吧,明天会继续为您带来该公司后来开发的、直到今天的经典CPU。
(未完待续......)
-
cpu
+关注
关注
68文章
10824浏览量
211087 -
intel
+关注
关注
19文章
3480浏览量
185728
原文标题:35款经典CPU带你回顾英特尔的成长轨迹(上)
文章出处:【微信号:Anxin-360ic,微信公众号:芯师爷】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论