再见,主板。你好,硅互连网络 | 智能技术

发布日期:2019-10-10 10:00
硅互连网络上的裸芯片将使计算机更小、更强大


长期以来,人们的需求让一些硬件系统变得越来越小,而它的其他功能变得越来越大现象一直在推动着电子领域的创新。前者可以从笔记本电脑到人工智能手机,再到智能手表、听筒和其他“隐形”电子产品的发展过程中看到。后者被定义为当今的商业数据中心,兆瓦级的吞噬怪物充斥着世界各地专门制造的工厂。有趣的是,同样的技术限制了这两个领域的进展,尽管原因不同。

我们认为,最大的问题是印刷电路板。解决办法就是摆脱它。

我们的研究表明,印刷电路板可以用构成与之相连的芯片的相同材料,即硅来代替。这一举措将为可穿戴设备和其他尺寸受限的小玩意带来更小、更轻的系统,也将带来难以置信的强大高性能计算机,这些计算机将把数十台服务器的计算能力打包到一块餐盘大小的硅片上。

这种全硅技术,我们称之为硅互连结构,允许裸芯片直接连接到单独一块硅上的布线。与印刷电路板上的连接不同,我们织物上芯片之间的布线和芯片内部的布线一样小。因此,可以实现更多的芯片到芯片的连接,这些连接能够更快地传输数据,同时节约更多的资源。

硅互连结构(Silicon Interconnect Fabric,简称si-if)提供了问题的解决方案。F芯片这是一条通往(相对而言)大型、复杂、难以在芯片上制造系统的绝佳途径,目前,(相对而言)F芯片能运行从智能手机到超级计算机的所有设备。代替原本的普通线上系统芯片Soc,系统设计者可以使用更小、更简单的设计和更容易制造紧密连接在si-if上的芯片组。这场芯片革命已经在进行中,Amd、Intel、Nvidia和其他公司都提供了在高级软件包中组装的芯片。硅互连结构扩展了这一愿景,打破了系统的包装,包括整个计算机。

要了解清除印刷电路板的意义,要考虑典型的系统线上芯片会发生什么。摩尔定律的出现,一块1平方厘米的硅可以装下驱动智能手机所需的几乎所有东西。不幸的是,由于各种各样的原因,大部分开始和结束于印刷电路板,然后把这片硅片放进一个(通常)塑料包装内,这个塑料包装可以是芯片本身的20倍大。

芯片和封装之间的尺寸差异造成了至少两个问题。首先,封装芯片的体积和重量远大于原始硅片。显然,这是所有需要小,薄,轻的东西的问题。其次,如果最终的硬件需要多个芯片相互通信(大多数系统都需要),那么信号需要传输的距离将增加10倍以上。这种距离是速度和能量的瓶颈,尤其是在芯片交换大量数据的情况下。对于图形、机器学习和搜索等数据密集型应用程序来说,这个瓶颈可能是最大的问题。更糟糕的是,包装好的芯片很难保持凉爽。实际上,几十年来,散热一直是计算机系统的一个限制因素。

如果这些包装上的问题,为什么不直接删除它们呢?是因为印刷电路板。

当然,印刷电路板的用途是将芯片、无源元件和其他设备连接到一个工作系统中。但这不是一项理想的技术。多氯联苯容易翘曲,很难做到完全平整。芯片封装通常通过一组焊点连接到电路板,焊点在制造过程中熔化并重新溶解。焊接技术的局限性加上表面翘曲,意味着这些焊点之间的间距不小于0.5毫米。换言之,每平方厘米芯片面积最多只能封装400个连接。对于许多应用程序来说,连接太少,无法向芯片提供电源并接收信号。例如,Intel Atom处理器的一个芯片占用的小面积空间只够容纳100个0.5毫米的连接,比它需要的空间少300个。设计者使用芯片包进行数学工程的单位面积连接。该封装采用硅芯片上1到50微米宽的微小输入/输出连接,并将它们扇出电路板的500微米刻度。

最近,半导体工业试图通过开发先进的封装技术来限制印制电路板的问题,例如硅插入器技术。插入器是一层薄薄的硅,上面安装了少量的裸硅芯片,它们之间的连接比两个封装芯片之间的连接要多。但是,插入器及其芯片仍然必须封装并安装在电路板上,因此这种设计增加了复杂性,但没有解决任何其他问题。此外,中间层必然是薄的、脆弱的、有限的,这意味着很难在其上构建大系统。

我们相信一个更好的解决方案是完全去除封装和多氯联苯,而是将芯片粘合到一个相对厚的(500微米到1毫米)硅片上。处理器、存储器芯片、模拟和射频芯片、电压调节器模块,甚至无源元件(如电感和电容器)都可以直接连接到硅上。与通常的印刷电路板材料相比,玻璃纤维和环氧树脂复合材料fr-4-a硅片具有刚性,可以抛光到接近完美的平面度,因此翘曲不再是问题。更重要的是,由于芯片和硅基片在加热和冷却时以相同的速率膨胀和收缩,你不再需要像芯片和基片之间的焊点那样的大而灵活的连接。

焊点可以用微米级的铜柱代替,铜柱建在硅衬底上。利用热压缩技术,基本上就是精确地加热和强制芯片的铜I/O端口,然后可以直接连接到柱子上。仔细优化热压缩键合可以产生比焊接键更可靠的铜对铜键合,所使用的材料更少。

消除电路板及其弱点意味着芯片的i/o端口可以间隔10微米而不是500微米。因此,我们可以在硅芯片上封装2500倍的i/o端口,就不需要像空间变压器那样的封装。

设置,我们可以利用标准的半导体制造工艺在si-if上制造多层布线。这些布线可以比印刷电路板上的要细得多。与电路板的500微米相比,它们的间距可以小于2微米。与使用电路板的1毫米或更大的间距相比,该技术甚至可以实现小于100微米的芯片间距。其结果是,如果一个系统节省空间和电力,并减少信号到达目的地的时间。

此外,与电路板和芯片封装材料不同,硅是一种相当好的热导体。如果要提取更多的热量,我们估计可以在硅的两侧安装散热器,最多可以多出70%。消除更多的热量可以让处理器运行得更快。

虽然硅有很好的抗拉强度和刚度,但它有点脆。幸运的是,半导体行业在过去几十年中已经开发出了在不破坏大型硅片的情况下处理大型硅片的方法。当基于si-if的系统被正确地锚定和处理时,我们期望它们能够满足或超过大多数可靠性测试,包括抗冲击、热循环和环境应力。

晶体硅的材料成本比fr-4的材料成本高,这一事实是绕不开的。虽然有许多因素影响成本,8层电路板每平方毫米成本大约是4层si-if晶圆的十分之一。然而,我们的分析表明,当去掉封装和复杂电路板结构的成本以及si-if节省空间的因素时,在成本上的差异可以忽略不计,si-if在许多情况下都遥遥领先。

硅互连结构与芯片封装和印刷电路板


硅互连结构将芯片与更密集、更高带宽连接起来;它使芯片能够更紧密地组装在一起,更好地散热。;它使芯片能够更紧密地组装在一起,更好地散热。

让我们看几个例子,说明如果集成可以使计算机系统受益,那么硅是如何实现的。在一项服务器设计的研究中,我们发现使用基于si-if的无包处理器可以使传统处理器的性能翻倍,因为它具有更高的连接性和更好的散热性能。更好的是,硅“电路板”的尺寸(需要更好的术语)可以从1000平方厘米减少到400平方厘米。缩减系统对数据中心房地产和所需冷却基础设施的数量具有实际意义。在另一个极端,我们研究了一个基于Arm微本体的小型物联网系统。在这里使用si if不仅可以使电路板的尺寸缩小70%,而且还可以将电路板的重量从20克减少到8克。

除了缩小现有系统并提高其性能外,si-if还应该让系统设计者创建不可能的计算机,或者至少是极其不切实际的计算机。

典型的高性能服务器在电路板上包含两到四个处理器。但是一些高性能计算应用需要多个服务器。当数据需要跨不同的处理器和电路板移动时,会出现通信延迟和带宽瓶颈。但是如果所有的处理器都在同一片硅片上呢?这些处理器可以像整个系统是一个大处理器一样紧密地集成在一起。

这个概念最早是由吉恩·阿姆达尔在他的三部曲系统公司提出的。三部曲失败的原因是制造过程不能产生足够的工作系统。当你在制造芯片的时候,总是有缺陷的可能,并且缺陷的可能性随着芯片的面积呈指数增长。如果你的芯片只有餐盘那么大,你几乎可以保证在它的某个地方有一个致命的系统缺陷。

但是,有了硅互连结构,你可以从芯片开始,我们已经知道可以制造出没有缺陷的芯片,然后将它们连接起来形成一个单一的系统。我们加州大学洛杉矶分校和伊利诺伊大学香槟分校的团队设计了这样一个由40个GPU(通用处理器)组成的晶圆级系统。在模拟中,与使用最先进的多芯片封装和印刷电路板构建的同等大小的40 gpu系统相比,它的计算速度提高了5倍多,能耗降低了80%。

这些都是令人信服的结果,但任务并不容易。我们必须考虑到一些限制因素,包括晶圆可以去除多少热量,GPU如何最快速地相互通信,以及如何在整个晶圆上传递能量。




小芯片!在100毫米宽的硅片上建立的硅互连结构上连接测试模具或芯片。与印刷电路板上的芯片不同,这种模具的间距只有100微米,可以加速信号并降低能耗。

电力是一个主要的制约因素。在芯片的标准1伏电源下,晶圆的窄线将消耗整整2千瓦。相反,我们选择将电源电压提高到12V,从而减少所需的电流量,从而降低功耗。这种解决方案需要在晶圆周围扩展电压调节器和信号调节电容器,占用可能会用到更多GPU模块的空间。在早期成果的鼓舞下,我们现在正在构建一个晶圆级计算系统的原型,我们希望在2020年底前完成。

硅互连结构可以在计算机行业的一个重要趋势中发挥作用:将片上系统(soc)分解为集成的叠片或芯片集合。(我们更喜欢dielets这个术语,而不是chiplets,因为它强调了裸硅芯片的特性,它的尺寸很小,而且如果没有si-if上的其他dielets,它可能无法完全正常工作。)在过去的20年里,为了提高性能和降低成本,设计师们不得不用越来越大的集成soc来取代整套芯片。尽管soc有很多优点(特别是对于大容量系统),但它也有很多缺点。

首先,线上系统芯片SOC是一个大芯片,如前所述,确保大芯片的良好成品率非常困难,尤其是涉及到最先进的半导体制造工艺时。(回想一下,芯片产量随着芯片面积的增长大致呈指数级下降)线上系统芯片SOC的另一个缺点是其一次性设计和制造成本高,例如用于光刻掩模的200万美元或更多,这使得SOC基本上无法用于大多数设计。更重要的是,任何制造过程的设计或升级的改变,即使是很小的改变,都需要对整个SOC进行重大的重新设计。最后,SOC方法试图将所有的子系统设计都强制整合到一个单一的制造过程中,即使这些子系统中的某些子系统如果使用不同的过程来制造会有更好的性能。因此,SOC中没有任何东西能达到其最高性能或效率。

无包si-if集成方法避免了所有这些问题,同时保留了SOC的小型化和性能优势,并提供了设计和成本优势。它将SOC分解为其组件系统,并将其重新创建为片上系统或片上系统if(soif)。

这种系统由独立制造的小型模具组成,这些模具连接在si-if上。模具之间的最小间距(几十微米)与SOC内两个功能块之间的最小间距相当。si-if上的布线与SOC上层使用的布线相同,因此互连密度也具有可比性。



带宽、延迟、能量:与印刷电路板上的传统系统相比,使用硅互连结构的晶圆级集成提高了带宽,减少了延迟,并使用更少的能量

与SOC相比,So-if的优势在于它启动器的尺寸。小型启动器的制造成本比大型SOC低,正如我们前面提到的,当芯片更小时,您可以获得更高的工作芯片产量。So-if最大的地方就唯独是硅衬底本身。基板不太可能有产量问题,因为它本身就由几个容易制造的层组成。芯片制造中的大部分成品率损失来自晶体管层或超致密低金属层的缺陷,而硅互连结构两者都没有。

除此之外,So-if还将具有工业界所期望的所有优势,即向芯片转移。例如,将So-if升级到新的制造节点应该更便宜、更容易。每个模具都有自己的制造技术,只有值得升级的模具才需要更换。那些不会从新节点的较小晶体管中获得太多好处的模具不需要重新设计。这种异构集成允许您构建一个全新的系统类,它混合和匹配不同代的模具和通常与Cmos不兼容的技术。例如,我们小组最近演示了将磷化铟模具连接到So-if上,以便在高频电路中潜在地使用。

因为在连接到So-if之前,需要制造和测试模具,所以它们可以用于不同的系统中,大大降低了成本。因此,根据我们的估计,设计和制造So-if的总成本可以比soc低70%。这种情况尤其适用于大型、低容量的系统,例如航空航天和国防工业,而这些行业的需求量只有几百到几千台。定制系统也更容易制作成So-if,因为设计成本和时间都在缩短。

我们认为,对系统成本和多样性的影响有可能开创一个新的创新时代,在这个时代,新的硬件是负担得起的,并可供更多的设计师、初创企业和大学使用。

在过去的几年里,我们在Si-if集成技术上取得了重大进展,但仍有许多工作要做。首先,也是最重要的是证明一个商业上可行的,高产硅if制造工艺。图案化晶圆规模的硅如果可能需要创新的“无掩模”平版印刷。现在使用的大多数平版印刷系统只能制作33×24毫米大小的图案。最终,我们需要一些能在直径为300毫米的晶圆上投射图案的东西。

我们还需要一些机制来测试裸模以及未受欢迎的Si-ifs。随着芯片制造商开始向先进封装和3D集成的芯片发展,裸模测试行业已经取得稳步进展。

下一步,我们将需要新的散热器或其他散热策略,利用硅良好的导热性。与加州大学洛杉矶分校的同事一起,我们一直在开发一种集成的晶圆级冷却和电力输送解决方案,称为PowerTherm(热动力器)。

此外,硅片的机箱、底座、连接器和布线需要经过设计,以实现完整的系统。

我们还需要对设计方法进行一些更改,以实现So-if的承诺。如果硅是一个无源基板,它只是导体,没有开关,因此跨极连接需要短。对于需要在晶圆级系统上连接远程模具的较长连接,我们需要中间模具来帮助进一步传输数据。进行布局和管脚分配的设计算法需要彻底检查,以便利用这种集成方式。我们还需要开发新的方法来探索利用So-if的异构性和可升级性的不同系统架构。

我们还需要考虑系统的可靠性。如果在粘合后发现模具有故障或在操作过程中出现故障,则很难更换。因此,So-if,特别是大型So-if,需要内置容错功能。容错可以在网络级或启动器级别实现。在网络层面上,Interdelet路由将需要能够绕过有故障的启动器。在启动器级别,我们可以考虑物理冗余技巧,比如为每个i/o端口使用多个铜柱。

当然,模具装配的好处在很大程度上取决于是否有有用的模具集成到新系统中。现阶段,业界仍在考虑生产哪些模具。不能简单地为soc的每个子系统制作一个启动器,因为有些启动器太小了,无法处理。一种有希望的方法是利用现有芯片和主板设计的统计挖掘来确定哪些功能“相似”在物理上彼此接近。如果这些功能涉及相同的制造技术,并遵循类似的升级周期,那么它们应该保持集成在相同的模具上。

这似乎是一连串需要解决的问题,但研究人员已经通过国防高级研究计划局的通用异构集成和IP重用策略(芯片)计划以及行业联盟来解决了其中一些问题。如果我们能解决这些问题,这将在很大程度上有助于延续摩尔定律更小、更快、更便宜的传统。