0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于台积电自研芯片性能分析和应用

lC49_半导体 来源:djl 作者:wikichip 2019-08-27 11:20 次阅读

昨天,有一则关于台积电自研芯片的文章刷爆了笔者的朋友圈。行业内的媒体的报道尚算中肯,也就是谈了台积电做了一个什么样的芯片,提供了怎么样的一个Demo,但有些标题党的作者甚至用“台积电要抢高通生意”这样的字眼来吸引读者。无论如何,这都与笔者所了解的台积电不一样。

随着基于小芯片(chiplet)的设计从研究转向生产,我们看到了来自工业界的小芯片论文的新流入。本月早些时候在日本京都举行的VLSI 2019上,台积电展示了自己的“小芯片”设计。

据雷锋网的报道,所谓“chiplet”是一种芯片,封装了一个IP(知识产权)子系统。它通常是通过高级封装集成,或者是通过标准化接口使用。至于它们为什么会变得如此重要,这是因为我们的计算和工作类型呈爆炸式增长,目前没有一种全能的办法来应对这些问题。从根本上说,对一流技术的异构集成是延续摩尔定律的一种方式。

使用基于小芯片的设计具有一些显著优点,例如更快的开发周期和更高的产量来降低成本。但它也带来了一系列新的挑战,这些挑战源于在基于小芯片的设计中追求类似单片产品(monolithic-like)的功耗和性能特性。因此,当中的主要挑战是互连和封装技术。虽然这些挑战仍然悬而未决,但已经有多种具有不同性质的解决方案被提出。在超大规模集成电路研讨会上,台积电展示了他们的一些技术,试图解决这些挑战。

台积电试图验证的三个主要特性是:

ARM核心在4 GHz以上工作

Bidir互连网状总线(Interconnect Mesh)在4 GHz以上

CoWoS和LIPINCON的速度为8 GT / s且<1 pJ / bit

值得注意的是,此研究和技术验证旨在用于高性能计算。因此,这些内核拥有非常高的时钟,高速率的内部互联速率,以及高密度线路和每比特传输极低功率的芯片间链路(inter-chip links with high-density wires and very low power per bit transfer)。

首先看芯片方面;

该芯片本身是一种双小芯片设计,但该技术本身可以通过额外的物理层(PHYS)相对容易地扩展到容纳更大数量的小芯片。每个小芯片都是在台积电7纳米节点上制造,拥有15个金属层。裸片本身只有4.4 mm×6.2 mm(27.28 mm²)。台积电采用了四个ARM Cortex-A72核。针对turbo频率大于4GHz电压操作,配备了高性能的cell(7.5T,3p + 3n)并定制设计1级高速缓存单元。还有两个2级缓存块。每个是1 MiB。这些是使用它们的高电流位单元(bitcells)并以半速运行来实现的。此外还有一个大型的6 MiB 3级缓存,使用高密度位单元实现,并以四分之一速度运行。

关于台积电自研芯片性能分析和应用

台积电采用了在高性能芯片中常见增强功能。典型的h-tree被用来将时钟分布的偏差从22ps减少到8ps。高性能时钟偏差以及via towers被广泛用于进一步改善关键路径上的时序。统计显示,整个设计共有五个电压域(voltage domains):0.8V SOC、0.8V ADPLL、0.3-0.8V Lipincon、0.8V L3和0.3-1.2V CPU。该芯片采用全数字锁相环,其抖动小于10ps,用于为CPU、互连和内存生成三个时钟域(clock domains )。

关于台积电自研芯片性能分析和应用

在1.20的电压下,Cortex核可以达到4GHz (signoff).。这个数字是基于运行Dhrystone模式工作负载的核心测量得到的。

关于台积电自研芯片性能分析和应用

其次来看一下网状互连(Mesh Interconnect);

该裸片包括网状互连。互连测试可通过片上分组生成单元(on-die packet generation unit )和分组监控单元(packet monitoring unit)完成。有六个双向触发器(bi-directional flip-flop)网格站(mesh stations)——每个边缘一个,中间两个。这些工作站围绕整个小芯片,间隔大约2毫米。网状互连是1968位宽,并使用具有相反方向信号(opposite direction signals )的逐位交错线路(bit-wise-interleaved wires )在M12和M13中布线,以最小化耦合( minimize coupling)。

总之,片上网状互连(on-die mesh interconnect)可以在4 GHz(0.8 V)到5 GHz(1.2 V)之间正常工作。缓存和Cortex集群都连接到最近的左下角(bottom-left )网格停止点(垂直方向时)。

关于台积电自研芯片性能分析和应用

互连可在0.76V下达到4GHz的频率。

关于台积电自研芯片性能分析和应用

再看一下芯片互联;

每个小芯片上都有两个LIPINCON(Low-voltage-In-Package-INterCONnect简称)接口。每个物理层的测量值仅为0.42 mm×2.4 mm(1.008 mm²)。这些是单端(single-ended),单向(unidirectional),低摆幅接口(low-swing interfaces)。一个接口用作与L3通信的主设备,而第二个接口是用于相反方向的从设备。

与SoC的其他部分不同,由于电源接地(power-ground)噪声问题,专用时钟有一个独立的PLL。每个物理层使用2:1多路复用功能,以便将速度加速到8 Gb / s。每个子通道有两个延迟锁相环( DLL):一个减少PVT变化,另一个用于减少时钟偏差,使系统级芯片和物理层之间的时钟相位对齐。由于使用单相锁相环,因此会采用两个环路——第一个环路锁定进入的时钟周期,并将其分为八个相位,第二个环路将该相位分为16个步骤。换句话说,在4 GHz(250 ps)下,您将看到低于2 ps的分辨率。

在本篇论文中,两个裸片连在一起。第二个小芯片旋转180度,用于LIPINCON PHY基台(abutment)。

关于台积电自研芯片性能分析和应用

芯片本身采用了台积电COWOS(Chip on Wafer on Substrate)2.5D封装技术,也就是将逻辑芯片和DRAM 放在硅中介层(interposer)上,然后封装在基板上。台积电在这里应用,就意味着硅中介层(silicon interposer)将用作安装在其上的两个相同小芯片的基板。

关于台积电自研芯片性能分析和应用

使用硅中介层可以采用更小的凸块(bumps),使得小芯片之间的导线更密集和更低。在这种设计中,使用了一个非常激进的40µm的微凸距,两个裸片之间只有100微米的间隔。

关于台积电自研芯片性能分析和应用

我们最后来看一下技术比较;

在两倍的时钟速度下,物理层运算速度为8GT/s。在互连宽度( interconnect width)为320位时,两个裸片之间的总带宽为320 GB / s。在40μm的bump pitch 下,这实际上是我们在最近的芯片设计中看到的最激进的间距之一,它还可以达到1.6 Tb / s /mm²的数据通量。下表对比了AMDIntel最近的两款小芯片设计。值得一提的是,英特尔之前曾提到过EMIB(嵌入式多芯片互连),其bump pitches为45μm,甚至将电流密度增加一倍至35μm。

但是,到目前为止,我们还没有发现任何能够证明这些功能的英特尔产品(包括Kaby Lake G)。

关于台积电自研芯片性能分析和应用

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    453

    文章

    50297

    浏览量

    421278
  • 频率
    +关注

    关注

    4

    文章

    1433

    浏览量

    59121
  • 高性能
    +关注

    关注

    0

    文章

    155

    浏览量

    20376
收藏 人收藏

    评论

    相关推荐

    光刻机#芯片 #

    行业芯事经验分享
    中国芯动向
    发布于 :2022年06月07日 16:46:41

    【AD新闻】竞争激烈!中芯抢高通芯片订单

    据外媒报道,预计将获得高通新一代电源管理芯片(PWM IC)70%至80%的订单。高通前一代电源管理芯片是由中芯国际(SMIC)生产的
    发表于 09-27 09:13

    小米芯片澎湃S2采用16nm工艺 代工

    据台湾电子时报报道称,小米跟达成了秘密协议,后者将生产澎湃S2处理器,是基于16nm工艺制程,至于何时推出还不清楚。 在这个时间节点上,人人都会喊一句
    发表于 04-29 23:20 6532次阅读

    基于5nm工艺的麒麟9000或将是华为高端芯片的绝版

    对于华为来说,美国将禁令升级后,对它们麒麟芯片打击是最直接的,也难怪余承东会说,麒麟9000(基于
    的头像 发表于 09-28 09:14 5565次阅读

    市值多少亿_为什么听美国的

    众所周知,是张忠谋在1987年成立,成立之后专注于半导体制造,目前国际上不少芯片都由
    的头像 发表于 12-15 15:48 1.7w次阅读

    苹果已预定基于3纳米工艺芯片的生产能力

    12月23日消息,苹果公司已预定基于3纳米工艺芯片的生产能力,以便在其iOS产品和电脑
    的头像 发表于 12-23 10:17 2016次阅读

    苹果已预定3nm产能

    是目前少数几家能生产5nm制程的半导体公司。根据此前的消息,除了5nm制程,还在研发
    的头像 发表于 12-23 10:41 2099次阅读

    苹果已预订最新的3nm芯片

    据报道,知情人士透露,最初一批采用3纳米工艺的芯片产能已经被苹果预订,用于生产iOS设备和
    的头像 发表于 12-23 11:17 1651次阅读

    为什么不自己做芯片

    的2020年财报令人瞩目,总营收创历史新高。作为全球芯片代工的龙头,
    发表于 04-02 14:55 8161次阅读

    首个2nm芯片定了!富士通CPU将由生产

    年底量产3nm工艺,三星则是6月份就宣布量产3nm了,之后两家会在2025年量产2nm工艺,行业内都默认苹果会首发用上台2nm,然
    的头像 发表于 11-09 14:39 1714次阅读
    首个2nm<b class='flag-5'>芯片</b>定了!富士通<b class='flag-5'>自</b><b class='flag-5'>研</b>CPU将由<b class='flag-5'>台</b><b class='flag-5'>积</b><b class='flag-5'>电</b>生产

    焦点芯闻丨苹果 CEO 为美国工厂站台,芯片将首次在美制造

    热点新闻 1、苹果 CEO 为美国工厂站台,芯片将首次在美制造 苹果公司CEO 蒂姆・
    的头像 发表于 12-07 19:30 704次阅读

    OpenAI芯片计划调整,传交生产

    近日,全球领先的生成式AI应用大厂OpenAI在芯片领域迎来了重大战略调整。为降低对外部AI芯片的依赖,OpenAI原本计划募资自建晶圆厂,以自主设计并生产高
    的头像 发表于 07-23 16:52 632次阅读

    谷歌Tensor G5芯片转投3nm与InFO封装

    近日,业界传出重大消息,谷歌手机的芯片Tensor G5计划转投的3nm制程,并引入
    的头像 发表于 08-06 09:20 519次阅读

    苹果2025下半年将采用Wi-Fi 7芯片

    据天风国际分析师郭明錤透露,苹果计划在2025年下半年推出的新品中,将首次采用的Wi-Fi 7芯片。这款芯片将基于
    的头像 发表于 11-01 16:58 356次阅读

    这次来真的了?苹果Wi-Fi7芯片采用N7工艺,或明年iPhone上首发

    落地。   10月最后一天,天风国际分析师郭明爆料称,苹果计划在2025年下半年推出的新品上搭载的Wi-Fi7芯片,该芯片采用
    的头像 发表于 11-02 00:02 4288次阅读
    这次来真的了?苹果<b class='flag-5'>自</b><b class='flag-5'>研</b>Wi-Fi7<b class='flag-5'>芯片</b>采用<b class='flag-5'>台</b><b class='flag-5'>积</b><b class='flag-5'>电</b>N7工艺,或明年iPhone上首发