DIY装机 频道

4GHz的救赎 Intel 32nm幕后技术解析

    我们知道,在2008年末AMD发布了45nm工艺的CPU,但它并不是采用High-K栅介质的技术,而Intel的High-K技术肯定是未来半导体工艺发展方向,相信全球有制造能力的半导体生产线都将在32nm时使用该类技术,且必须使用该类技术。我们看到,虽然现有非Intel技术的45nm甚至不久后的40nm已经诞生,但在成品的功耗控制方面却大大落后于Intel的45nm技术,而今天我们在Intel 32nm技术上将再次验证HighK带来的低功耗的神奇。

    32纳米制程技术的基础是第二代高k+金属栅极晶体管。英特尔对第一代高k+金属栅极晶体管进行了众多改进。 在45纳米制程中,高k电介质的等效氧化层厚度为1.0纳米。而在32纳米制程中,此氧化层的厚度仅为0.9纳米,而栅极长度则缩短为30纳米。

    晶体管的栅极间距每两年缩小0.7倍——32纳米制程采用了业内最紧凑的栅极间距。32纳米制程采用了与英特尔45纳米制程一样的置换金属栅极工艺流程,这样有利于英特尔充分利用现有的成功工艺。这些改进对于缩小集成电路(IC)尺寸、提高晶体管的性能至关重要。采用高k+金属栅极晶体管的32纳米制程技术可以帮助设计人员同时优化电路的尺寸和性能。

    由于氧化层厚度减小,栅极长度缩短,晶体管的性能提高了22%以上。这些晶体管的驱动电流和栅极长度创造了业内非常好的纪录。此外,漏电电流也得到了优化。与45纳米制程相比,NMOS晶体管的漏电量减少5倍多,PMOS晶体管的漏电量则减少10倍以上。由于上述改进,电路的尺寸和性能均可得到显著优化。除此之外,32纳米还采用了第四代应变硅技术,用于提高晶体管的性能——这样一来,英特尔便可争取更多的时间和机会进行更多技术创新。

    为什么说是双保险?首先,我们已经见证了45nm应用于酷睿2快速切入高量产的过程(生产线短时间内实现极低的不良率),普通用户也可以回顾45nm产品E7000系列和移动平台T8000系列日如何快速进入主流市场。而Intel这次承诺,32nm的高量产速度要更优于45nm时。

    Intel表示:“32纳米制程的产量将达到或超过了极为成功的45纳米制程。缺陷率的降低幅度(相对于45纳米技术)已达到两年内的预期,因此英特尔预计将在2009年第四季度开始的生产中实现低不良品率和高产量。”

    为了完成处理器产品向32纳米技术的过渡,英特尔在未来两年内上马四座fab芯片生产厂。位于俄勒冈州的D1D芯片厂目前已经投入使用,同样位于俄勒冈州的D1C芯片厂将于2009年第四季度投入使用,以满足32纳米产品的生产需求。2010年,英特尔将再建两座制造工厂。位于亚利桑那州的Fab 32生产厂和位于新墨西哥州的Fab 11X生产厂。

    说到32nm工艺下制造的产品,我们会想到45nm计划中夭折的Havendale,而这并不是什么坏事,这款原计划中的产品将被采用32nm工艺制造代号改为——Clarkdale,Intel甚至在产品上市还有1年之际(2010年1季度上市),在2009年2月向大家展示了Clarkdale的成品,和已经可以运行的整个PC平台。

1
如图,右侧较小的核心仅仅是CPU内核,甚至不包括内存控制器

    我们认为,Intel一方面由于经济环境原因,不仅将32nm用于新一代的Westmere架构,同时将新技术应用于主流产品。而主流产品Clarkdale的架构也成为与32nm工艺相辅相成的一大因素。我们从Clarkdale的架构不难看出,其中只有CPU的核心采用32nm工艺制造,这甚至包括去掉了内存控制器,你甚至大体可以认为这就是将酷睿2的双核CPU用你32nm工艺制造。这对于提高成品率当然是很好的设计。

1
Intel 数字企业事业部副总裁 Smith展示Clarkdale实物

    另一方面,Intel的32nm生产线的确很大的量产能力。Clarkdale作为入门主流市场的产品,市场需求量自然不会低,刚刚发布的32nm新工艺要立刻提供如此大的产量的确也不容易。从这点来看Clarkdale的确是一款市场策略+架构设计+全新工艺的完美之作。

     Nehalem发布之初大家都对Intel将Bloomfield(即现在的Core i7)采用LGA1366针脚插座,而Lynnfiled采用LGA 1160针脚插座表示不能理解,而且Core i7支持3通道内存而后者并不支持。CPU针脚的不兼容,历来不受用户欢迎,这对用户投资保值空间是一个挑战,对主板选择是一个麻烦。而对主板行业来说,厂商也不愿意面对这样的设计。而我们在Westmere中看到了6核心的Gulftown,它将仍需要X58 Express芯片组支持,与Core i7外围规格一致,CPU插座标准一致。

Intel原装DX58SO主板
LGA1366与LGA775封装的产品相比,Core i7大出许多

     这时大家才恍然大雾,LGA1366多出的几百个针脚、偏偏多出一条的3通道内存控制器恰恰是为6核心Gulftown量身定制。这样一来,现在的主板、内存的平台投资都将得到合理的保护,而X58 Express颇具争议的芯片组(甚至被悲观者认为会和i820或i850芯片组一样下场)也变得很有价值。一套Gulftown平台,它的寿命至少可以使用到2012年吧?X58芯片组甚至因此会变成Intel历史上最成功的芯片组。

    多媒体指令集,一直是Intel的拿手好戏,不过在Westmere中Intel开始向VIA学习?终于加入了AES硬件指令集,类似的指令集在VIA C7处理器时就有加入。大家应该看过不少VIA C7或Nano的评测,在AES相关测试项目中,普普通通的一颗C7也可以超越Core i7。而现在,Gulftown等Westmere处理器加入了AES硬件指令集,在该方面性能不知要提升几十倍。

     不过我们认为,根据以往经验,SSE4.2才是我们更应该关注的多媒体指令集。在Nehalem上,Intel加入了SSE4.2,也许是SSE4.1的推广过于高调,而应用却姗姗来迟,Intel SSE4.2的宣传却极为低调。SSE4.2是转为XML优化的指令集,对于目前Web应用大量基于XML设计,SSE4.2对用户的体验是立竿见影的。应用范围也要比SSE4.1主要为视频编码服务的范围广很多。但这些指令集推广速度仍不容乐观,所以,在Nehalem上推出的技术应该在Westmere这一代得以广泛应用。

    Intel此次公布32nm技术,毕竟离产品发布还有9个月左右的时间,离产品上市还有近一年的时间。虽然,Intel把32nm第二代HighK技术讲的相对清楚,但并没有给出实测数据说明Westmere的功耗变化与性能指标。不过,我们相信,酷睿2发布时相对与Pentium4/D——功耗下降40%性能提升40%的双向巨大进步已经很难实现。但与Penryn、Nehalem发布时,保证功耗不变性能大幅度提升(至少20%)仍将延续,也许会比Nehalem当时表现更好(Core i7承诺同功耗下,各种应用平均性能提升20%)。

    在记者提问中,Intel大概表示Westmere的各种产品与今天对应市场定位的产品相比,将保证功耗不变的情况下轻松达到4GHz的水平。我们推测,可以认为Westmere下4GHz的产品可以与今天3GHz主频对应产品具有同样功耗。如果Westmere让4GHz进入主流,那么它可以看成2005年贝瑞特为Pentium4不能达到4GHz下跪的救赎,Westmere也算不辱使命。

    当然,Intel在离32nm工艺正式发布还有近一年时间时高调的宣传,也许,正是验证英特尔公司全球副总裁兼中国大区总裁杨叙在Nehalem发布时、在Intel2008年末年会上等场合多次提到的:“越是在经济危机中,企业越要有前瞻的眼量,考虑用什么样的创新产品和服务来迎接下一个经济增长点。英特尔将更加坚定信念、秉承创新精神,汇聚产业的智慧与力量,坚持与合作伙伴协作创新,共同直面挑战,将危机演变成经济振兴的奇迹、以共赢未来!”

0
相关文章