农企?按摩店?AMD的兴衰异闻录
农企?按摩店?AMD的兴衰异闻录
执笔/ 坎达拉克沙 @ 百度笔记本吧
2015年12月10日
〇、
2000年6月10日,AMD在美国加州的圣何塞竞技场(San Jose Arena),开了一场盛大的party。员工们被告知可以带任何人——父母、妻子、子女、朋友——来吃喝玩乐,以及领免费的奖品。AMD请来了全美最红的乡村歌手蒂姆·麦格罗和菲丝·希尔助阵,连CEO杰里·桑德斯(Jerry Sanders)都现场表演了走钢丝、骑独轮车的节目,一片盛世太平的景象。在这之前的1999年,AMD的速龙(Athlon)CPU一上市就广受好评,在这一年中,为公司带来了10亿美元的利润。
而12年后,一切都变了。AMD在低迷的2012年亏损达到了惊人的11.8亿美元,这将2010年4.71亿美元和2011年4.91亿美元的利润一扫而空。在2013年3月,AMD甚至卖掉了在得州奥斯汀市的中心大楼,以获得1.6亿美元的现金来解决燃眉之急。
事实上,在过去的几年里,AMD由于各种内部、外部的原因,一直处在一个漫长的、艰难前行的时期。Intel将它远远抛在了后面,高通、NVidia、三星这些对手也在频频发力,它本身也陷于各种被收购的传闻中。AMD目前正在经历转型期的阵痛,每当新的产品发布,总会引来无数粉丝的期盼或者叹息,也能让人看到它在迷雾重重中微薄的希望。就像桑德斯本人说的一样,“I would die before I’d fail”,AMD坎坷的发展路途,值得我们深入了解。
一、
杰里·桑德斯年轻的时候,不过是一个穷小子而已。当他18岁的时候,他卷入了一场街头斗殴。他被一群不良少年狠揍了一顿,被打到失去知觉,下巴、鼻子、肋骨都被打断了,并且被塞进了一个垃圾桶里。多亏被他的邻居发现送到医院,经过整整三天的昏迷才醒过来。这份颇有些传奇的经历对他的影响极大,这与他不屈不挠的“硅谷牛仔”的性格不无联系。
桑德斯的成绩比较优秀,并且具有与生俱来的销售才能。他毕业之后,先是在摩托罗拉供职,后来转去了大名鼎鼎的,被誉为“硅谷的摇篮”的仙童半导体(Fairchild Semiconductor),做到了营销总监的职位。1968年,仙童半导体的8位创始人中的两位——总经理罗伯特·诺伊斯(Robert Noyce)和实验室负责人戈登·摩尔(Gorden Moore),带着一部分员工离开了陷入资金危机的公司,成立了英特尔(Intel)。而一年后的1969年5月1日,桑德斯也带着7个人另立门户,成立了超微半导体(Advanced Micro Devices, AMD),就是本文的主角。
刚刚起步的AMD可谓是举步维艰,因为它与Intel的成立虽然只差一年,但劣势明显。Intel的两位创始人早已经是电子业界声名赫赫的大佬,手下也都非等闲之辈,想要吸引到投资和技术人才并非难事。而AMD的启动资金只有区区10万美元,桑德斯本人在IT领域也没有什么号召力,因此起步非常缓慢。
不过,AMD低调务实的作风使得它发展比较快。它首先由设计简单的IC开始,到了1975年,他们终于有了自己的第一个产品族——Am2900系列,包括ALU、多路复用器、内存控制器、总线控制器等许多部件。这时,AMD的股票也已经上市,并且也有了自己的第一家海外工厂,AMD已经算得上是一家初具规模的企业了。
二、
在上世纪七八十年代,Intel一直扮演着微处理器技术唯一的先驱者的角色。1971年,Intel设计出了第一个4位CPU 4004,1972年是8位的8008,1974年是具有重要意义的8080,1979年则是大名鼎鼎的16位CPU 8086和8088。值得一提的是,AMD在对8080做逆向,并且成功了,命名为Am9080。Intel为了保证产能,与著名电子工程师费德里科·法金(Federico Faggin)的Zilog Z80芯片对抗,在1976年与AMD签订了授权协议,AMD正式成为Intel的第二供应商(second source supplier),也就是类似于代工厂,属于亲密盟友的关系。
但到了1980年,Intel认为AMD产芯片的出货量已经非常大,AMD的存在威胁到了自己的利益,准备撤销对AMD的授权。但是,业界巨头IBM决定在此时进军PC行业,并希望Intel作为自己唯一的芯片供应商。在这种重大利好的驱使(或者说是IBM的胁迫)下,Intel和AMD又在1982年2月签订了新的协议,8086、8087、8088以及后续的80186、80286也授权给AMD生产,以应对快速增长的PC行业的需要。
1982年底,AMD以80286为蓝本制造的Am286处理器面世。比较令人意外的是,Intel将自产的80286芯片的频率设定为6~10MHz,而AMD的Am286则是8~16MHz,带来了可观的性能提升,并且售价相对低廉。AMD的这一做法,对Intel而言是一个不大不小的打击。可以说,AMD的性价比路线,早在三十多年之前就已经确定了。
面对这样的势头,Intel终于坐不住了,在1985年突然撕毁了协定,中止了32位处理器80386的授权,AMD一纸诉状把Intel告上了法庭。虽然AMD最终胜诉,这场旷日持久、历时4年多的官司却让双方都受害不浅,证人有近百名,各类卷宗积攒起来有几万页,诉讼费高达千万美元。
AMD非常清楚,只要诉讼多进行一天,AMD在微处理器的道路上就落后一天。因此,在走法律途径的同时,他们同时也在进行80386的逆向工作,于1989年完成,在Intel的阻挠下于1991年上市。虽然错过了黄金时机,但AMD把自家的Am386最大速度调到了40MHz,这与80386的33MHz相比又是一个技术上的胜利。1993年的Am486也是如此,在Intel的486DX终于达到100MHz时,AMD却提供了120MHz,还加入了回写cache和分页技术的更好的型号。1994年,AMD的总收入达到了破纪录的20亿美元。
三、
其实从上面已经看出,在较长的一段时间内,AMD求生存的道路比较直接,就是追随Intel,但又加上更有性价比的特征,以薄利多销的方式打开市场。但这条路已经变得越来越不现实,IC的复杂度在急速增长,Intel的高性能奔腾(Pentium)芯片的晶体管数量相对于之前的486几乎是3倍,逆向工程无法实施了。AMD需要转变。
在危机感的驱动下,AMD的研发部门从1993年开始自主研发K5芯片,并于1996年3月27日投放市场。K5是一个相当新颖(或者说激进)的方案,它采用了高度并行化的29k RISC指令集,这与主流的CISC指令集大相径庭,但同时又提供了非常好的x86前端。其内部则采用了4流水线、5个整数单元和1个浮点单元的设计。为了保证兼容性,K5能够在奔腾的Socket 5/7系列主板上使用。
K5的竞争对手是Intel的奔腾Pro系列(于1995年发布)和Cyrix的6×86系列。虽然AMD的工程师们走对了路线,但毕竟经验缺乏,设计过程中的逻辑层数过多,导致K5无法通过大幅提升频率来获得性能优势(最高只到133MHz),并且BPU的分支预测成功率也较奔腾Pro为低。总体上来讲,它的整数运算性能大约是奔腾200的水平,浮点性能则是奔腾100的水平,但击败了Cyrix的竞品,还是比较中规中矩的。但是由于上市较晚,加上设计上有一定的缺陷,因此销量不大,没有给Intel造成什么威胁。AMD的第一次尝试实在算不上好。
此时,Intel的重点已经转移到了奔腾2处理器上,AMD还要继续迎战。
四、
在得知K5处理器反响不佳的时候,桑德斯和他的手下们就决定,再研发一款新的型号,定为K6。不幸的是,K6的研发过程更加不顺利,K5的问题仍然或多或少地存在。鉴于此,桑德斯认为需要引入新的技术力量。
与此同时,硅谷的一家只有60个人的小公司NexGen,却做到了AMD做不到的事情。他们正在研发的Nx686处理器轻松地达到了180MHz的核心频率,性能足以压倒Intel的CPU,而这仅仅是靠IBM的一些微薄的资金资助完成的。NexGen的主席阿提克·拉沙(Atiq Raza),是一位很有才华的巴基斯坦籍科学家。他对自己的产品很自信,但他也很清楚,以目前NexGen的实力,是无法与Intel叫板的。
有意思的是,为NexGen与AMD牵线的,是微软CEO比尔·盖茨。他专门约了拉沙来谈,并且告诉他说AMD有自己的晶圆厂,但目前制造的芯片正在遇到性能瓶颈。拉沙与桑德斯电话交谈之后,被AMD的雄心以及桑德斯的魅力深深地打动,因此决定与AMD展开合作。1995年,AMD斥资6.15亿美元收购NexGen,并将其研发团队并入旗下。以NexGen的Nx686为原型,AMD倾力研制出了新的K6处理器,于1997年春季发售。
更有意思的是,K6的成功,与一位Intel前员工有着密不可分的联系。他的名字叫维诺德·达姆(Vinod Dham),印度籍科学家,也是奔腾芯片的主要研发负责人之一,被称为“The father of Pentium”。1995年,他从Intel离职加入了NexGen,被AMD收购后,也主导了K6的研发工作。
K6拥有880万个晶体管,其针脚仍然符合Socket 7规范,这证明其定位仍然是抢夺奔腾的市场。K6的第一个版本就可以运行在233MHz的核心频率下,具备6发射的超标量流水线,还有更加先进的分支预测技术。并且,它良好的超频性能使得它完全可以与超得更高的奔腾Pro一战。除了上面这些优点之外,它还比较便宜,使得当时的奔腾MMX完全失去了存在价值,甚至让刚刚面世的奔腾2也面临不小的竞争。AMD打了一场漂亮仗。
著名的硬件论坛Tom’s Hardware在当年的评测中十分兴奋地表示:“The Pentium MMX is now a completely obsolete CPU!”又说:“The K6 is faster than any current CPU under Windows 95 and will probably be just as fast as the Pentium II at the same clock speed.”由此可见,AMD在微处理器领域对Intel第一次正面交锋,完全不落下风。
五、
但是,Intel毕竟不是等闲之辈,它仍然是微处理器市场最领先的领导力量,PII(我就这样简写奔腾了哈)仍然拥有足够的与K6对抗的资本。就在K6发布之后,Intel突然宣布退出Socket 7市场,转而推出了具有专利保护的Slot 1主板,与AMD及其他厂商正式决裂。
这个举措在当时令很多人都非常迷惑。当时的Socket 7非常成熟,普及率非常广。但是,它是完全开放的规范,因此就意味着各厂商都可以在这个平台上推出自己的产品。这对Intel来说是一件不好的事情:由于Intel的研发能力突出,每次Intel在Socket 7平台上推出新品之后,身后就会引来一批包括AMD、IDT、Cyrix、Rise等在内的追赶者,并且制造出各自的兼容产品来与Intel争夺市场份额。这种费力不讨好的事情,谁都不会做,因此Intel转战Slot 1,其实就相当于断绝了其他厂商的兼容路线。
AMD牢牢把握住了这次机会,开始在Socket 7上连续刷新自己的K6产品线。从233MHz的Nx686开始,到300MHz的Little Foot、350MHz的Chomper、550MHz的Chomper Extended,这些产品在短短的1年多内先后上市。以Chomper为代表的K6-2新架构,还增加了AMD独有的3DNow!指令集,与Intel的SSE指令集类似,大大提升了图形和多媒体处理所需的浮点性能。另外,AMD还随同K6-2一起提出了“Super 7”的新理念,就是“Socket 7+100MHz FSB+AGP”的集合,引来除Intel外的其他厂商效仿,Slot 1显得愈加封闭。而高性能的K6-2成了压死PII的最后一根稻草,PII在这个“频率即一切”的年代显得力不从心,Intel转而去开发新一代的PIII了。PII成为了一款相当短命的主打产品。
1999年初,AMD推出了K6家族的最后一个修订版本K6-III,晶体管数量达到了2140万,是K6-2的两倍多,同时还加入了用于节能的PowerNow!新技术。就在4天之后,Intel的奔腾3正式发布。K6-III虽然性能表现仍然不错,但毕竟已经有些廉颇老矣,不适合承担与将来的PIII竞争的重大任务了。另外,已经在市的Intel入门级赛扬和高性能至强,也在不断对AMD造成威胁。在这种风云变幻的环境下,一代经典即将到来了。
六、
来卖个关子,说点花边新闻。
AMD的K6时期可谓是风生水起,但在其内部还是会有一些问题的,而这其实也主要来源于桑德斯本人。阿提克·拉沙曾经认为他的老板工作态度不佳:
“He was not engaged. He would be upset if I called him too late in the evening or too early in the morning. I’m a 24/7 kind of guy.”
而桑德斯的开支也随着公司业务的扩张变得开始无节制起来,甚至影响到整个公司:
“Mr. Sanders’ increasingly lavish style also became contagious…It was an atmosphere, former employees say, that encouraged loose spending throughout the company.”
桑德斯本人的管理方式也造成了公司员工态度的两极分化,既有十分忠诚的人,也让他和一些人产生了龃龉(“created both loyalty and friction”)。在20世纪末的一段时间内,AMD经历了一段人事和财政方面的困难期,但并不明显,从当时的大局上来讲,也并未产生大的消极影响。AMD仍然在微处理器的道路上大踏步前进,没有什么人或者什么事能阻挡它。
好了,言归正传。
七、
1999年6月23日,AMD正式发布采用K7微架构的新一代处理器,系列名称“速龙”(Athlon)。
K7普遍被认为是AMD的黄金时代的起点。
K7,也就是速龙处理器,其内部总线采用了来自DEC授权的EV6总线,频率高达200MHz(当时Intel的竞品为133MHz),第一代的核心频率则从500MHz起步提升至700MHz。K7的前端拥有3个并行的译码器,后端则拥有非常鲁棒的乱序执行部件,以及一套非常先进的三发射超流水线FPU,从根本上解决了浮点运算的老大难问题。第一代K7/速龙采用0.25μm工艺制造,缓存系统则是128KB的内置L1$,以及片外的512KB的L2$。其接口规范则是Slot A规范,芯片组为AMD 750,这标志着AMD也不鸟Intel,开始单干了。
K7第一代“Pluto”刚上市就一鸣惊人,其同频和综合性能超越了Intel立足刚刚稳定的,代号Katmai的第一代PIII。仅仅5个月后,AMD马上就推出了K75,代号Orion,0.18μm制程,频率范围为550MHz~1GHz。Orion是世界上第一款时钟频率能够达到1GHz的微处理器核心,具有里程碑意义。这正式标志着AMD开始与Intel在微处理器方面同台竞技,并第一次真正取得了优胜。但是,Pluto和Orion的超频潜力不佳,市场反响不错,但销量一般。
好景不长,Intel毕竟也是有反制措施的,它拿出了新的代号为“铜矿”(Coppermine)的PIII,加入了全速片内L2$,凭借800MHz以上的频率,又超越了Orion。不过,Intel为了从频率上压制Orion而仓促搞出的1.13GHz的Coppermine,当时却由于产品质量广泛出现问题而被大量回收,被俗称为“矿渣”,给Intel造成了巨大的心理阴影。
新千年的6月,在文章开头所述的AMD的盛大party举行的前后,AMD发布了代号为“雷鸟”(Thunderbird)的第三代K7/速龙处理器。其也采用了256KB的全速片内L2$,FSB回归100/133MHz,兼容Slot A和Socket A两种接口,晶体管数目达到了3700万。在频率方面,雷鸟可以达到1.4GHz的高频。由于此时K7与PIII的同频表现基本相同,因此频率更高也更便宜的雷鸟更受用户的青睐。在当时,雷鸟Athlon 750搭配VIA KT133主板,价格比Intel的奔腾套装便宜30%,但性能却没有打折扣,迅速席卷了民用PC市场。
另外,为了与Intel的赛扬争夺入门级市场,AMD又推出了代号为Spitfire的“钻龙”(Duron,俗称毒龙)系列,作为速龙的精简版,并且同样以超高的性价比广受好评,同频超越赛扬2。另外,Duron可以通过铅笔破解倍频,直上800MHz,性价比就更加突出。直到Intel在2001年推出了采用著名的PIII-S“图拉丁”(Tualatin)核心的赛扬,毒龙的领先优势才失去。关于铅笔破解倍频,大家可以百度一下你就知道。
简单聊两句图拉丁。图拉丁赛扬的100MHz外频可以不费什么力气就超到133MHz,并且L2$的容量和性能也比前代的有不小的提高。另外,Intel还量产了为数极其稀少的图拉丁PIII芯片,是当年低耗高能的代名词,非常有意义。
八、
Time to have a break~
在速龙发布后不久,昔日的NexGen领导人拉沙就离开了AMD,原因是与桑德斯产生了比较大的分歧。这对于AMD的研发团队而言,是一个不小的损失。具体原因是:桑德斯要在德国的德累斯顿开办新的晶圆厂(fabrication,简称fab),坚称“Real men have fabs”。拉沙出于长远考虑,要求暂缓这项措施,但桑德斯没有采纳他的意见。
事实证明,拉沙的建议是明智的。显而易见的是,AMD虽然迎来了蜜月期的开始,但其经济实力并未强大到能够为更多的fab提供资金支持。2001年年底,德累斯顿fab已经吃掉了AMD大约18亿美元的资金,而到最终完成时,虽然AMD的芯片业务表现非常好,但当年却承受了2.7亿美元的亏损。要知道,AMD在2000年可是达到了10亿美元的利润的。不过这不是我们讨论的重点了。
不管如何,AMD需要找一个替代人选。桑德斯看上了当时摩托罗拉公司半导体事业部的总监埃克托·鲁伊斯(Hector Ruiz)。国内一般都翻译成符合中文习惯的“鲁毅智”,但这是一个西班牙语人名,因此我按照西语的发音习惯来翻译。2000年1月,鲁伊斯走马上任,担任AMD的COO。两年后,桑德斯从CEO的位置上退了下来,鲁伊斯开始执掌AMD的大权。而他的是非功过,自有后人评说。
下面继续~
九、
2001年8月,Intel的基于NetBurst架构的奔腾4系列开始铺货,首批型号代号为Willamette,频率来到了史无前例的2GHz。NetBurst架构的宗旨是采用较长的流水线,通过几乎是暴力提升频率的简单方法来达到提升性能的效果。这是一种大舰巨炮主义的想法,长流水线固然可以提升处理器的潜在能力,但带来的频率和功耗瓶颈也是十分严重的。Willamette的同频性能败于自家的Tualatin和AMD的K7,但毕竟频率较高,因此还是比较有优势。
AMD的动作是:升级目前的K7架构,代号为Palomino,并且速龙系列的名字也换成了Athlon XP。Palomino相对于雷鸟,加入了对Intel SSE指令集的支持,并且SIMD逻辑也有改善,性能提升了15%。
另外,AMD还耍了心机,用PR值的命名方法来作为速龙XP系列的型号。例如Athlon XP 1700+,AMD官方给出的含义是以老速龙的1GHz为频率标准来标记的,但当时的DIYer都知道,醉翁之意不在酒,这套方法是专门针对P4的,1700+的含义就是“比1.7GHz的P4强”的含义,并且事实也确实如此。
不过,Intel的NetBurst架构虽然实际表现比较差,但并非不科学。2002年,代号“北木”(Northwood)的制程改进版P4面世,0.13μm制程,FSB和频率大大提升,并且创新性地引入了Intel引以为豪的超线程技术(hyper-threading),Palomino又感受到了空前的压力,AMD有推出K7小修改版Thoroughbred来迎战,超高的性价比仍然留住了一大批忠实用户。
在这两年内,AMD在与Intel进行拉锯战的同时,完成了对微处理器产品线的布局:速龙XP和毒龙主攻桌面高低端市场,速龙4/XP-M和毒龙M主攻移动高低端市场,速龙MP则是服务器市场。虽然在移动端和服务器表现一般,但在桌面端的表现十分抢眼。
十、
2003年初,AMD继续拿K7微架构大做文章,推出了升级版速龙XP,代号Barton和Thorton。Barton在当时的DIY领域俗称为“巴顿将军”,是K7的巅峰之作,也是谢幕之作。Barton的代表型号Athlon XP 2500+,则是当年的一代神U。
“巴顿将军”采用128KB L1$与512KB内建L2$,仍然沿用Socket A接口,提供对MMX、SSE和3DNow!的完整支持,FSB则来到了333/400MHz,频率1.83~2.33GHz。其性价比极高,超频潜力极佳。在当年,速龙XP 2500+搭配上DDR双通道内存和NVidia nForce 2 Ultra主板,其价格与Intel的赛扬平台相当,但性能则比赛扬强几条街。另外,通过超外频的方式,可以把2500+活活变成3200+,性能生吃Northwood的绝大多数型号,血拼3GHz以上的高端P4,非常凶悍。笔者我还是小学生时,就曾经买过不止一套Barton平台的配置,有组装电脑的多数同学家中也都是速龙或者毒龙,AMD CPU的受欢迎程度可见一斑。
总之,AMD与Intel竞争到这个阶段,Intel虽然还占据着CPU市场的主动,但其地位受到了非常严重的冲击。而Intel在P4和NetBurst的弯路中还要继续绕一段时间,在这段时间内,AMD当然也没闲着,他们准备着下一轮的更大的攻势。
十一、
2003年9月23日,AMD发布K8微架构的新品Athlon 64/64 FX(“速龙64”),与当年早前发布的Opteron(“皓龙”)一起,组成K8大军,对Intel的P4展开猛攻。
Athlon 64/Opteron采用了AMD自家的AMD64架构,是整个微处理器历史上第一款64位CPU,具有划时代的重要意义。它们的代号分别为SledgeHammer和ClawHammer,可以工作在纯64位模式下,也可以工作在32位模式甚至混合模式下,以用来提供向后兼容性,但同时又不牺牲性能。这种32位向64位平稳过渡的做法赢得了一致的好评,微软的Windows以及各主流的Unix/Linux系统都开始为64位提供良好的支持,AMD为推动32位到64位的进化功不可没。
更加值得一书的是,AMD的采用64位x86扩展指令集的这种方式,因为其十分先进便捷,成为了业界标准。Intel搞了很长时间的64位安腾(Itanium)架构轻松地被AMD64击败,后来Intel甚至为自己的64位架构取得了AMD64的授权。大概AMD自己也从来不会想到会有这样一天。
速龙64主打主流桌面市场,64 FX则主打高性能,这也是“FX”这两个字母被AMD用来标榜高性能的开端。两者都采用0.13μm工艺生产,内部集成内存控制器和HyperTransport控制器,流水线长度有所加长,频率约为2~2.4GHz,TDP为89W。虽然性能不错,但由于两者分别需要不同的Socket 754和Socket 940主板支持,并且主流的速龙64还不支持双通道内存,因此虽然得到了好评,但并没有对Northwood构成实质性的威胁。
AMD吸取了教训之后,于2004年上半年推出新的改进版K8,代号Newcastle。速龙64和64 FX统一为Socket 939接口,全部支持双通道,NVidia也十分给力地推出了nForce 4主板,K8的势头愈发不可阻挡。
也就是在2004年,Intel基于NetBurst架构的第三代P4E面世(E代表extreme),代号为Prescott。Prescott可以说是历史上争议最大的一个微架构,它的流水线级数从之前的20级,一跃达到了惊人的31级,频率已经接近了4GHz,但事实证明,Intel几乎是完全失败了。Prescott相对于Northwood而言,性能没有提升,甚至还有倒退。其巨大的发热量和功耗,也让Intel把P4E超上10GHz的美梦全盘落空,“长流水线+高频率”的模式已经是死胡同了。
不管怎么说,在这一次的正面对肛中,K8大获全胜。Athlon 64 3200+和Athlon 64 FX-55等经典型号疯狂蚕食着Intel在桌面处理器的市场份额,2004年,AMD在桌面处理器领域的份额超过了50%,Intel颓势非常明显。“玩游戏选AMD”已经成为深入人心的口号,AMD进入全盛时期。
十二、
说句题外话,CPU微架构是一个很复杂的话题,流水线长度是一个很重要的指标,但不是全部。换句话说,流水线长度和CPU的计算性能没有太多的必然联系,其他因素还有很多,这里就不一一说了。另外,Intel在移动端的付出还是比较明显的,在这个时期基于Banias计划衍生出的迅驰(Centrino)技术,成为了Intel之后在移动端发展的基础。更重要的是,Intel已经开始意识到了NetBurst架构的失败,Banias回归到了PIII时代的技术,并且他们也在努力寻找逃出困境的方法。
2005年5月,这次是Intel,抢先发布了史上第一款双核CPU:奔腾D。不过,奔腾D是由两颗P4的核心共享FSB组成,本质上还是没有摆脱高功耗低性能的怪圈。然而大约一周以后,AMD就祭出了自己的双核心处理器:Athlon 64 X2,代号Toledo/Manchester,制程为90nm。
毫无悬念,速龙64 X2成功地吊打了奔腾D,皓龙也在服务器领域对英特尔的Xeon造成了巨大的冲击,超高的能耗比使得P4毫无脸面。在家用领域,拥有一片X2 3800+这样的处理器,就相当于拥有了想要的几乎全部性能。而经过高频San Diego修订版的速龙FX系列,也终于推出了双核版本Toledo FX-60,和之后的Windsor FX-62等衍生型号一起,霸占了民用级CPU性能宝座。
当然,占据全面优势的AMD有理由给自己的好产品加上他们认为合适的价格。入门级的X2 3800+当年的价格普遍在2000元以上,最高端的FX型号高达7000元以上,但这也没有阻挡DIYer们的热情,AMD可谓是赚的盆满钵溢。2005年下半年,AMD又发布了主打性价比的“闪龙”(Sempron)系列,代号Palermo/Manila,采用Socket 754接口,超频性能同样上佳。在AMD的攻势下,Intel十分被动,Nocona、Smithfield、Presler、Paxville等架构面对速龙、闪龙、皓龙,只能被认为是仓促发布的产品,全部败下阵来。“64位”和“双核”这两大关键且密集的战役,Intel全都打输了。
与此同时,AMD也不忘为自己取得的胜利造势,公开宣称自己赢得了“双核对决”(dual-core duel)。不仅如此,在2005年,AMD还提起了一项诉讼,指控Intel在微处理器市场使用垄断优势、恶意竞争,以妨害AMD处理器进入市场(虽然事实并非如此),Intel还遭到了调查。AMD的日子简直过得不要太好。
那么,AMD是如何走下神坛,由盛转衰的?AMD为什么要收购ATI,其影响又是什么?Intel的tick-tock战略对整个微处理器工业的发展方向起到了什么作用?GlobalFoundries这个大家可能很熟悉的名字与AMD有什么渊源?还有很多问题,我们一一来探讨。
十三、
让我们暂时把目光从如日中天的AMD和陷入困境的Intel身上移开,进入图形处理器和主板芯片组的领域。先来看两份简历。
黄仁勋,1963年生于台湾台北,1972年迁往美国。1984年于俄勒冈州立大学取得电机工程学士学位,其后又在斯坦福大学取得硕士学位。1983~1985年,他在AMD的微处理器设计部门任工程师,之后又跳槽去了LSI Logic。1993年,黄仁勋与克里斯·马拉科夫斯基、柯蒂斯·普利姆在加州共同创办英伟达(NVidia),黄仁勋任主席与CEO。
何国源,1950年生于广东新会,1963年移民去香港。1974年于台湾成功大学取得电子工程学士学位,接下来的10年内,辗转Control Data、飞利浦和国家半导体,任电子工程师。1984年,何国源移居加拿大,一年后与其他两位香港科技人Benny Lau和Lee Ka Lau在安大略省共同创办冶天科技(Array Technology Industry,简称ATI)。
在前面所说的Intel和AMD打得难解难分的时候,NVidia和ATI这两家在GPU和芯片组领域领先的公司也在进行着激烈的竞争。既然四大主角全部到齐,那我们就花些时间来讲讲它们之间的关系好了。
十四、
大家可能已经发现了,前面在讲AMD崛起的时候,经常会出现NVidia nForce这个名词,这就是NVidia的副业——主板芯片组。在世纪之交的那几年里,NVidia凭借成功的Riva TNT和初代GeForce显示芯片,在GPU领域取得了长足的发展,完成了原始资本的积累。借着这样的东风,2001年,微软和NVidia达成战略合作,NVidia得到为微软XBox设计显示芯片和主板的机会,这份经验促使NVidia推出了nForce主板芯片组系列。
我们已经知道,Intel的芯片组规范是封闭的,也就是CPU和主板都是自己的一套标准。而AMD在那时的规范是开放的,VIA、SIS等厂商都能得以为AMD处理器设计主板芯片组。NVidia的初代nForce平台虽然反响不佳,但其后的nForce 2、3、4则是愈战愈勇,成功抢占了大红大紫的AMD K7/K8的头把交椅,与AMD成为了最为亲密的合作伙伴,联手挤压Intel。AMD刚刚发布64位处理器,nForce 3就成为了第一款完全支持AMD64技术的芯片组。其后的nForce 4更是将现在大家都耳熟能详的PCI Express(PCI-e)和SLI技术带了进来,算是当年的重大创新,与AMD强劲的速龙64处理器强强联合,战斗力惊人。Intel鉴于其9xx平台用户大量流失,还被迫改变了从不轻易授权给第三方的强硬态度,NVidia又得以发布了nForce 4 Intel Edition,捞到了更多的好处。
ATI虽然没有NVidia取得的战绩那么耀眼,但若要称第二,也是没有其他任何厂家敢挑战的。ATI的Rage以及Radeon R100/R200显示芯片也取得了不小的成功,另外,它也是当时唯一一家得到Intel垂青,获得Intel的芯片组授权的厂家,合作的密切程度不亚于AMD和NVidia。虽然P4不太给力,但ATI的RS300、RS350平台为Intel的P4提供了不小的支持。到了PCI-e的时代,新的Radeon Xpress 200平台(RS400、RD400等)继续对P4提供着Intel各类关键技术的支持,如超线程、EIST、EM64T、XD等,并且推出了与NVidia的SLI性质相同的CrossFire技术。Intel与ATI的联合,是Intel能够面对AMD的猛烈攻击而没有完全溃败的重要原因之一。
概括来讲,在这段时期内,AMD与NVidia、Intel与ATI分别在芯片组领域保持着密切合作;AMD与Intel在微处理器领域竞争;NVidia与ATI在图形处理器领域竞争。虽然互有胜负,但总体来讲,AMD和NVidia在各自的专业领域占据着技术优势,AMD和NVidia的联盟也是看起来坚不可摧的。
什么叫做坚不可摧?可以用两个事实来佐证:第一,2005年,黄仁勋在Computex上公然站台支持AMD,喊出了那句著名的“Intel is not good enough”,起到了一呼百应的效果。第二,NVidia突然出手收购了ATI的重要合作方宇力,此后宇力彻底停止了对ATI主板南桥设计的支持,给ATI及Intel的后院放了一把大火。
然而时间来到2006年。所有的事情几乎都不像我们看起来的那样了。
十五、
2006年7月24日,AMD宣布以42亿美元现金及5700万AMD股票,共计54亿美元并购ATI。举世震惊。这也是AMD三笔大宗交易中的第一笔。
这桩当时世界科技史上最大、最复杂的并购案涉及到众多的问题,我在这里只讨论一个问题,就是:ATI为什么选择了AMD,而不是Intel?
首先我们需要明确的是,ATI在自己的老本行,就是GPU业务方面遭到了很大的困难。虽然在DX9的第一轮竞争中,NVidia的GeForce 5000败给了ATI的Radeon 300,但到了第二轮竞争,NVidia的GeForce 6000系列借着Shader Model 3.0的威力,实在是太强大,ATI的Radeon R500(X1000)系列太守旧,几乎没有优势,处于被压制的境地。并且由于ATI很久没有为自己的Radeon系列产品线带来技术革新,外界普遍看衰ATI之后的发展路途。
在这种大环境下,传出了ATI的高层与Intel商谈合并的消息。由于Intel与ATI常年合作,关系良好,因此大家普遍看好。但是不巧的是,由于Intel在P4方面的种种策略失误,日子也不好过,其CEO欧得宁正在大刀阔斧展开清理行动,包括彻底的架构重组及数万人的裁员计划。在这个节骨眼上,ATI与Intel两家变一家,至少Intel是不愿意的,ATI只能无功而返,投靠AMD。而AMD早就在打将CPU与GPU融合的Fusion计划,而自己并无图形处理器和芯片组的产业链。至少从当时来讲,AMD的理念是非常先进的(虽然可行性有待商榷),接ATI这个盘,也符合自己的长期发展战略。
AMD并购ATI这一大案,造成了非常深远的影响,几乎完全改变了整个IT产业的发展格局。AMD成为了世界上第一家同时具有微处理器、芯片组、独立显示核心和存储介质四大生产能力的企业,这是绝无仅有的。更重要的是,AMD与ATI的联合,直接打破了市场上多年的潜规则(AMD+NV,Intel+ATI)。早在AMD与ATI传出绯闻时,黄仁勋就比较强硬地暗示“如果AMD和ATI合并,NVidia将重新评估与AMD的关系”。如今木已成舟,AMD与NVidia的关系宣告破裂,NVidia在主板芯片组领域不可避免地倒向了Intel阵营。对于AMD自身而言,AMD此后要在CPU和GPU领域双线作战,同时面对两大强敌,难度是非同小可的。
总之,AMD并购ATI这件事情是对是错,每个人心里都有不同的答案,我们就不再细说了。然而屈居劣势多年的Intel终于准备好了,就像当年AMD翻身一样,他们也准备好了自己的杀手锏。
十六、
插播一条趣事。起初AMD考虑收购的对象其实是NVidia。至于理由,当然与ATI想要与Intel合并同理,好兄弟总是容易讲话的。不过,老黄的态度十分坚决,就是一旦合并,他自己想要出任新的AMD-NVidia联合公司的总裁。这对占据优势的AMD而言是绝对无法接受的,所以他们最终选择了NVidia的竞争对手ATI。鲁伊斯的自传里明确说明了以上内容,当年国外网站也有报导这件事:
“NVidia Chief Executive Jen-Hsun Huang reportedly insisted that he become chief executive of the combined company. Naturally AMD Chief Executive Hector Ruiz wasn’t going to let that happen, so he chose to acquire rival ATI instead.”
从今天来看,老黄也算是条汉子啊。
下面要讲的内容,更多的人也许已经听说过了,更加精彩,不容错过。
十七、
在NetBurst系CPU被AMD速龙胖揍的那段时间里,Intel痛定思痛,制订了一套天才的产品发展策略,学名“tick-tock”,中文名为“钟摆策略”。
所谓tick-tock,其实就是时钟的滴答声。Intel用tick代表一年,tock代表一年,进行两年为一个周期的研发计划。在tick年,进行处理器芯片制程的更新,缩小芯片面积,降低功耗和发热量;在tock年,在制程更新的基础上进行微架构的更新,专注于提升效率和性能。这种发展战略可以保证持续不断的技术进步,杜绝竞争对手的产品霸占性能宝座很长时间的现象,提升自家产品的竞争力。
在这种策略的影响下,Intel又开始焕发出生机。2006年是一个tock年,早在这一年的一月,新的Core微架构就登陆了移动端,代号Yonah,基础为之前的奔腾M的技术,有单核的Core Solo和双核的Core Duo两个版本,巩固了Intel在发展极为迅速的笔记本市场的地位。然而,这不过是开胃菜而已。
2006年7月27日,就是AMD并购ATI的3天之后,Intel正式发布全新的、具有革命意义的Core 2微架构,代号Conroe/Merom(俗称“扣肉”和“焖肉”),分别主攻桌面端和移动端,全面的反击战打响了。
Conroe的代表型号,就是当年大名鼎鼎的Core 2 Duo E系列。其采用双核心设计,65nm制程,集成了2.9亿只晶体管。微架构底层则完全摒弃了NetBurst时代的方案,重新回归PIII时代的正确道路,采用经典的14+级流水线设计(此后,Intel后续微架构的流水线设计再也没有发生过本质的变化),TDP仅为65W。其他方面,Conroe采用了统一的LGA775规范,内建2~4MB L2$,还加入了新的SSSE3 SIMD指令集,一举改变了P4以来积弱的局面。
Intel声称,Core 2比NetBurst而言,性能有40%的提升,但功耗反而有40%的下降,而这并不是一句空谈。2.4GHz的高端型号E6600在与速龙FX的正面对决中全面获胜,性能更高,功耗更低。AMD面临了巨大的危机,Athlon 64 X2系列芯片的价格几乎是在短短几天内暴降千元以上。TechSpot有一句话形容AMD当时的处境,非常形象:
“Overnight, AMD went from king of the hill to king of the foothill.”
Intel成功扭转了战局,AMD遭受了沉重的打击。然而Intel还不罢休,乘着Conroe/Merom的余威,又在短短几个月之后抢先发布了首个系列的四核CPU,代号Kentsfield,就是著名的Core 2 Quad Q/QX系列。2007年这个tick年,又发布了其45nm的制程改进版Yorkfield,还增添了移动端四核的型号。另外,低端的奔腾/赛扬(Allendale/Wolfdale)也不断推陈出新,对AMD实施全面的压制。
此时的AMD真是一夜回到解放前,2006年下半年到2007年上半年,AMD过得无比艰难。在微处理器领域迟迟没有能够对抗Core 2的竞品出现。而收购ATI之后,ATI失败的HD2000系列显卡又变成了AMD的烂摊子,NVidia渔翁得利,AMD只能拆东墙补西墙。2007年下半年,AMD的债务竟然高达50亿美元。
十八、
在微处理器领域,AMD面对tick-tock这套组合拳,显然是措手不及,只能将Athlon 64 X2放低身段,与新的Socket AM2规范配合,重新主打性价比,当作入门级处理器与Intel来竞争。由于AMD从ATI获得了芯片组的制造能力,因此日子还能稍微好过一点。并且,AMD就是在这时提出了“黑盒”(Black Edition)的概念,倡导不锁频,用户可以自由超频,以此来保持一定的竞争力。
其实自从2007年年初开始,AMD就一直在向大众泄露自家四核心处理器的消息,但始终不见踪影。在Conroe面世一年多之后,2007年10月,AMD终于拿出了自家的升级版K10微架构。首批型号包括代号Agena的Phenom X4(“羿龙X4”),以及代号Barcelona的新皓龙。其采用65nm制程,四核心设计,并且还首创了三级缓存的设计。另外,其内部集成了DDR2内存控制器(最高可支持DDR2 1066规格)以及更新的HyperTransport 3.0控制器。其他的技术细节就不一一列举了。总之,AMD在K10方面付出了不少的努力,以期夺回市场份额。
尽管AMD在技术上做出了很多改进,Phenom X4的表现差强人意,与Intel的Core 2 Quad系列相比,仍然能耗比不高。AMD为了弥补这个缺陷,一方面除了继续生产更新到K10的速龙之外,还别出心裁地搞了三核心羿龙,于2008年推出,就是Phenom X3,代号Toliman。虽然受到制程工艺的限制,Phenom X3的频率只能在2.x GHz附近徘徊,但毕竟三核心比英特尔的双核心处理器更优胜,还是有不少消费者买账的。另外,由于K10的三核心和双核心处理器大多是四核心型号屏蔽有缺陷的核心而来,因此开核也成为DIYer追求性价比,选择AMD处理器的理由之一。
但是,提起初代K10的羿龙处理器,就不得不提一下与前面提到的“矿渣”事件齐名的TLB Bug事件,不过这次灾难发生在AMD身上。
TLB(Translation Lookaside Buffer),其没有一个规范的中文译名,一般叫做“地址转换后备缓存”,在操作系统理论中一般简称为“快表”。它是CPU缓存的附属,用于更快地检索数据的内存地址。但是羿龙的B2/BA步进的型号,其L2$中的TLB被错误地放进了L3$中,导致在数据密度极大的罕见的情况下,CPU检索TLB会发生错误,导致完全宕机。尽管这是一个小概率事件,但对于必须追求万无一失的微处理器而言,这是绝对无法容忍的事情。AMD的信誉又遭到了一次打击。
后来,AMD不得不发布新版BIOS来解决这个问题,但直接造成了缓存延迟急剧上升,性能暴跌20%。直到后来发布的B3步进的型号,这个bug才被完全修复。AMD还不得不更改羿龙系列的序号,来提振消费者的信心。
其实,从这以后,AMD在微处理器架构方面又回到了原来的落后局面。大体上,AMD坚持走以多核心、不锁频和低价的道路,来吸引消费者,并一直坚持到现在。
十九、
Core 2和K10之后,Intel和AMD的处理器产品线越来越复杂,发展也越来越快。如果再用之前的方式写,笔者我也会感到力不从心,并且也会过于冗长,因此我会写得简洁明了一些。
然而我也想休息一下,关于Intel、AMD、ATI和NVidia的恩怨,暂时就写到这里。前面提到了,AMD有三笔大宗交易,现在来简单说一下第二笔交易。这次不是买,而是卖。
2008年,鲁伊斯宣布出售AMD自己的晶圆厂,买家公司名字叫做GlobalFoundries。这家名不见经传的小公司背后,是财大气粗的阿布扎比财团ATIC。从此,AMD变成了一家“fabless company”,丧失了自主的晶圆制造能力。这是鲁伊斯在任期间做的最后一件事。
鲁伊斯和AMD高层的想法是:fab长期以来一直是AMD开支的重点。如今AMD主要业务遇到了困难,出现了资金问题,卖掉fab的话,不仅可以减轻资金负担,AMD还可以专注于微架构设计。而分拆出去的fab毕竟和AMD有渊源,该fab可以接受其他fabless company的订单,以提高影响力。
我们目前也无法明确地评判这种思路在当时是对还是错,也不知道AMD当时的财务问题有多严重,但是它对于AMD之后的发展起到了不小的负面作用。众所周知,制程的改进对微处理器的发展有着诸多好处,最直接的优势就是可以堆积更多的晶体管,还能降低功耗和发热量。然而想要在制程改进上取得领先,最基本的要求就是拥有自主的晶圆制造能力。
从2006年开始,移动微处理器市场呈现爆炸性增长的态势,笔记本开始大量普及。然而在移动平台,功耗控制是十分重要的,Intel的Core Duo T/U系列就把这一点做得非常好。并且到了Core 2时代,桌面平台也开始倡导低功耗了,没有人会喜欢一片热得要起飞的CPU。这与2005年之前的“频率决定一切”的风潮大相径庭。可以说从此之后,AMD的高功耗、高发热的顽疾就一直延续了下去,AMD在解决这个问题时往往捉襟见肘,并且还要经常面对第三方产能不足的限制。而Intel之后的强势表现,也向世人证明了微处理器的设计和制造是不能分开来搞的。
这笔买卖做完之后,鲁伊斯旋即卸任CEO,不过仍然担任董事长到2009年初。而在他辞职之前,AMD已经连续经受了7个季度的亏损。接替他的是德克·迈耶尔(Dirk Meyer),是一位不折不扣的工程师,也是当年K7架构的功臣之一。
比较令人意外的是,鲁伊斯后来去了GlobalFoundries,并担任董事长。
二十、
让我们来看看老朋友NVidia哪儿去了?
在扣肉/焖肉面世和双A合并这两件大事之前的两个月,AMD发布了Socket AM2规范的CPU,NVidia也同时跟进,发布了nForce 500系列芯片组。后来羿龙上市,nForce 500家族就拥有了支持K10与不支持K10的两大序列,其中还有一部分是nForce 4披了马甲改名而成的,这样就可以全面覆盖AMD的产品了。当然,nForce 500也见证了K8最后的辉煌与迅速的衰落。
而仅仅半年之后,2006年11月,NVidia倒向了Intel阵营,发布了支持Core 2处理器的nForce 600i系列,自由超频、三卡SLI等特性一个不少。但比较可惜的是,由于NVidia在Intel方面的经验非常缺乏,Intel自家的P965/P35始终占据强势,nForce 600i叫好不叫座,知名度很低。
NVidia虽然和AMD关系不睦了,但其在AMD芯片组领域仍然拥有着无可比拟的优势。AMD收购ATI后马上推出了自产的570X芯片组,接着是后来的整合版690G。然而仅仅三个月后,NVidia靠着炉火纯青的MCP68将战局扳了回来,证明自己的看家本领仍然相当不错。后来的MCP73则试图将整合平台推广到Intel方面,但遭到了Intel的强烈抵制。而到了后来的nForce 700系列时,AMD为自家的K10一口气准备了770、780G、790X、790FX四个重磅炸弹,Intel的态度也不友好,因此NVidia在主板芯片组领域遇到了大麻烦,并开始考虑转型。
nForce算是NVidia的一次无心插柳柳成荫的有益尝试,并且确实做出了漂亮的成绩。然而这并非NVidia的立身之本,GeForce和Quadro——就是GPU业务——才是NVidia真正的根基。
从AMD拥有显卡产品线之后,NVidia GeForce与AMD Radeon在消费级桌面和移动端显卡方面缠斗至今,并且没有任何一方取得过长时间的绝对领先优势。以我们目前关注的2007年为例,在这一年的Q4,NVidia的G80/G92核心与AMD的RV670核心同台竞技,中端到高端桌面显卡领域诞生了一众经典型号,包括GeForce 8800GS/8800GT/8800GTS,以及Radeon HD3850/HD3870,现在仍然活跃在各种老爷机中。不仅如此,2008年1月,AMD还抢先发布了第一款真正意义上的双芯显卡HD3870 X2,NVidia又迅速以自家的双芯9800GX2进行回击,真是异彩纷呈。
好了,AMD的显卡业务不是本文重点讨论的范围,在后面还会对近年来N卡和A卡的交锋进行一些简要的盘点。现在回归微处理器领域。
二十一、
前面已经提到了,2007年是Intel的tick年,Core微架构经过制程改进,以45nm的Penryn微架构再次出击,打得AMD满地找牙。AMD在2008年上半年除了修补了Phenom X4的TLB Bug,并推出了Phenom X3以及老Athlon X2的改进版之外,基本处于碌碌无为的状态。而Intel在此时采用“U海战术”,不断刷新Core 2的双核和四核产品型号,频率越来越高,基本上包揽了桌面级高端处理器市场,从这个时期开始,AMD再也没有能在高端市场对Intel造成过实质性的威胁。
Intel的tick-tock计划有条不紊地进行着。2008年11月17日,全新的45nm制程Nehalem微架构面世,Intel为我们带来了名震天下的酷睿i7(Core i7,代号Bloomfield)系列。“i7”这个名词就作为极致性能的标志,一直沿用到现在,AMD的“FX”在它面前只能自叹不如。此后,2009年9月有了酷睿i5(Lynnfield),2010年1月有了i3(Clarkfield)。酷睿i系列三条序列,连同Intel经典的奔腾、赛扬一起,构成了其深入人心的、全面覆盖的产品线,并沿用至今,没有丝毫的改变。Intel独有的睿频和超线程的概念开始迅速地被越来越多的DIYer熟知,稍微懂一点点桌面级处理器的人,都能熟练地说出“i3是双核心四线程,i5是四核心四线程,i7是四核心八线程。i5和i7还有睿频”这样的话。
AMD虽然处于困境中,但从桑德斯时代就留下来的那种斗士精神,让他们无法坐以待毙。2008年底到2009年初,AMD终于推出了基于K10微架构的45nm改进版,就是Phenom II和Athlon II,分别面向中高端用户与中低端用户。
第二代羿龙仍然分为四核、三核、双核三种,代号分别为Deneb、Heka、Callisto。其最大的特点就是相对于一代而言,大幅增加了L3$的容量,从2MB变成了6MB,同时也加入了与Intel的睿频技术(英文名Turbo Boost)相对的Turbo Core技术。另外,它能够支持新的Socket AM3平台,也能支持老的Socket AM2+平台,用户升级比较方便。像是Phenom II X4 955这种型号,由于其超低的售价、原生四核心的吸引力与特别好的超频性能,在DIY领域拥有非常好的口碑。同时,Phenom II X3/X2和Athlon II X3/X2仍然可以通过开核来提升性能。Athlon II X3 440/X2 220等售价低的入门级型号得到了不少预算不足的用户的青睐。
就是在这时开始,AMD为了主打性价比,同时扩大自身的影响力,提出了“3A平台”的概念,亦即“AMD CPU+AMD芯片组主板+AMD显卡“,获得了广泛的认可。以名称为”龙“(Dragon)的3A平台为例,AMD在当时可以提供”Phenom II X4+700系主板+Radeon HD4800系显卡“的一揽子方案,成功地吸引了一批追求性价比的中高端用户,甚至戴尔、惠普等主要的生产商也与AMD达成了合作。同时,整合了较高性能显示芯片的790GX芯片组等,对Intel非常孱弱的集成GPU领域也造成了强大的威胁。AMD通过这一系列举措,暂时挽救了节节败退的局面,也为自己重新塑造了在微处理器业界的良好形象。
但是,AMD的领导层在此时又做出了一个在今日看来是大错特错的决定。
二十二、
2009年1月,AMD宣布将自己的手持设备业务部门Imageon出售给高通。而在2008年的巴塞罗那GSM大会上,AMD还曾经高调地发布Imageon系列手机处理器和显示芯片,谁都没想到它会被AMD如此干脆地甩卖。AMD领导层的解释是:AMD可以更专注于自己的核心业务,就是x86微处理器以及消费级GPU业务(这与卖掉晶圆厂时的说辞几乎如出一辙)。
根据协定,高通获得了手持设备的全班人马,AMD还附送了研发接近完成的2D和3D显示技术以及移动端显示微架构。而这份大礼只花掉了高通区区6400万美元。后来的事情人尽皆知,高通以Imageon团队的人员和技术为基础研发出了Adreno系列GPU,与它自主研发的骁龙(Snapdragon)系列处理器一起,成为智能设备领域领先的SoC解决方案。
然而NVidia正在做着相反的事情。2008年,NVidia发布了自家的Tegra 1处理器。虽然不甚成功,但在相当长一段时间的摸爬滚打之后,2011年末的Tegra 3系列一炮而红。由于其出色的计算能力与图形处理能力,Tegra 3成为诸如Google Nexus 7、微软Surface一代、HTC One X、LG Optimus 4X、Acer Iconia Tab等著名机型的首选,与高通的骁龙S3展开竞争,在蓬勃发展多年的智能手机和平板市场占据了一席之地。
平心而论,AMD主动放弃了参加智能设备这场饕餮盛宴的入场券,失去了一次在其他领域翻身的大好机会。而Intel(代表产品是低功耗的Atom系列)和NVidia则抢占了先机,此后AMD也曾试图推出平板用处理器,但总是不了了之。
除了这件事之外,Intel在2009年还来给AMD泼冷水。Intel宣称AMD拥有x86的交叉授权协议,但将制造权交给了第三方(就是GlobalFoundries),有违二者当初的协定,威胁要对簿公堂,气势咄咄逼人。不过这件事情最后达成了和解,Intel不再追究此事,并且保证绝不会在微处理器领域开展恶意竞争,还赔给了AMD 12.5亿美元现金。这笔钱对AMD来说不算小数目,但对于Intel而言,这只不过是它在2009年Q4一个季度营收总额的一半而已。总体来讲在这次事件中,AMD虽然得到了好处,但并不是赢家;Intel虽然付出了一些金钱和承诺,但天平仍然严重地向它这一方倾斜着。
“While AMD technically came out on top, all it got was a one-time cash infusion and a guarantee that its x86 license wouldn’t disappear. All Intel ultimately had to give up to make the suit go away was a portion of one quarter’s profits and a promise not to do a bunch of stuff that it maintains it wasn’t doing anyway.”
二十三、
2010年1月4日,Nehalem的32nm制程改进版Westmere揭开了面纱。1月7日,Intel在发布桌面i3的同时,也重点发力移动端,推出了Core i M系列,彻底奠定了其在笔记本微处理器领域的绝对优势地位,i7 740QM等型号风靡一时。这还不够,两个月之后,Intel发布了代号为Gulftown的桌面酷睿i7至尊(Extreme)版,6个物理核心,12MB的超大L3$,3.5GHz以上的高频,仅有130W的TDP,性能在当时强大到爆表。Intel赢得了四核战役,如今又非常干净利落地抢了六核的桂冠。
AMD当然不甘示弱,但由于这两年内,AMD微处理器架构的发展基本陷入停滞,因此还是得拿K10架构来做文章。Gulftown发布的一个月之后,AMD发布代号Thuban的皓龙II X6,继续挑战Intel的地位。
Thuban采用六个K10核心的设计,每个核心拥有512KB L2$,所有核心共享6MB L3$,仍然支持Socket AM2+/AM3两种规范,核心频率2.6~3.3GHz。虽然其性能无法与i7至尊版相比,但干掉Nehalem的酷睿i7和酷睿i5是不费吹灰之力的。另外,它的售价相当便宜,不过2000元。其中最著名的型号是Phenom II X6 1055T,价格1000元多一点,成为最平民的六核神器,超频到4GHz之后甚至可以打翻i7 965X,反响非常好。
这一节有点短啊,拿显卡的事情做一点补充吧。
在2009到2010年这一时期,AMD在显卡方面的竞争中比NVidia占优势。RV770核心的Radeon HD4850/HD4870成为了第一款搭载GDDR5显存的显卡,而NVidia的对应型号GeForce GT240晚了几乎半年(NVidia这时正在奉行马甲战略)。这之后的HD5870更成为了第一个支持DX11的显卡,报了当年NVidia的8800GTX抢先支持DX10的一箭之仇。Thuban+HD5000的性价比很好,“玩游戏选AMD”的口号又开始流行起来了。
二十四、
2011年,tock。1月9日,Intel高调发布Sandy Bridge微架构,这也就是大家耳熟能详的第二代酷睿处理器的代号。一年后,22nm的Ivy Bridge也如期而至。
不要怪我讲的太简略或者太快,因为微处理器发展到这个地步,已经十分纷繁复杂,绝非一两句话能够说的清楚的了。并且写到这里,窝的心里很有一些难受,感到很惋惜AMD,但又好象不是。不论如何,这篇文章快要接近尾声了吧。
当然,Intel的自信是有理由的:改进的流水线和缓存、超高效而且创新的片内环状互联(SoC Ring Interconnect)设计、改头换面的Gen6和Gen7核芯显卡,无一不在宣扬着Intel在这个经久不衰的领域中的巨大优势。
AMD又隐忍了很长时间,在2011年,一举拿出了两个新品。第一个就是AMD当年收购ATI所要达到的最主要目标之一——加速处理器(Accelerated Processing Unit,简称APU)。
AMD在2006年就开始设想CPU与GPU融合的Fusion计划,过了5年,这个目的才真正实现。2011年,AMD发布了第一款基于K10微架构的APU,代号Llano。APU的创新之处在于:将处理计算事务的传统CPU核心、处理2D/3D图形任务的类独立显卡的GPU核心、北桥这三大部分做在一片芯片上,提供全面的应用能力。APU系列按照A10、A8、A6、A4四条序列布局,主攻入门级市场。不得不说,从这一点上看,AMD当年收购ATI是一个正确的决定。虽然Llano并不成熟,但其后的Trinity、Richland,以及现在大家比较熟悉的Kaveri、Carrizo APU,则在很大程度上挽救了AMD在微处理器业务上的败退局面,为那些追求入门级计算能力+图形能力的用户提供了非常可靠的选择。
第二个新品,是让广大A饭苦等了不知多长时间的全新微架构——Bulldozer(俗称“推土机”)。推土机之于AMD,无异于P4之于Intel。虽然AMD并未遭受很大的市场份额损失,但对于这之后多年的发展,影响是相当差的。
推土机微架构使用GlobalFoundries的32nm制程工艺,并采用了全新的模块化设计方案。具体来讲,就是以每两个核心作为一个模块,每个模块共享L2$,所有模块共享L3$。并且在微架构的前端和后端设计中,两个核心也可以共享一些资源,比如指令字节缓存、指令译码器和浮点运算调度器等。推土机CPU的命名,又采用了FX的前缀,不知AMD是否想借此怀念昔日的荣光。FX-8系列为四模块八核心设计,FX-6为三模块六核心,FX-4则为双模块四核心。其采用Socket AM3+接口规范,配合AMD 900系芯片组,频率最高可达4.2GHz。
但是,推土机的性能表现(尤其是与Sandy Bridge/Ivy Bridge对比的同频单线程性能表现)让人大跌眼镜,推土机全面落败。这是多方面设计失当的结果,其缺点包括长达20级的流水线,极高的L3$延迟,较低的分支预测效率,由于FP单元共享而被拖累的浮点运算性能,以及非常大的功耗和发热量。而竞争对手的Sandy Bridge,除了前面提到的缓存改进和环状互联之外,分支预测单元也被花了大心思重新设计,独具创新性的μop$更是神来之笔,效率提升非常明显,将AMD远远地甩在了身后。
二十五、
从2011年一直到今天,在微处理器的领域,Intel和AMD就分别按照各自的Sandy Bridge和Bulldozer的框架一直走了过来。虽然本质的变化并不多,但是不言而喻的是,Intel再也没有犯过之前的错误,牢牢把握住了每一次重大更新的机会——2012的Haswell、2014的Broadwell、2015的Skylake,这些东西,相信就不用我再多费口舌了。虽然Intel因此也被冠以“牙膏厂”的名声,然而不可否认,Intel的领先优势太明显了,市场份额常年超过80%,夫复何求呢。笔者自己家中的电脑上或者抽屉里,G3258、i3 4160、i5 4670K、i7 5820K、i5 4200H、i5 4210U、i5 6300U、i7 4800MQ等等Intel型号一应俱全,而AMD的处理器不过孤零零的A10-6800K和FX-8300而已啊。
推土机核心之后的几年里,AMD也相继拿出了其改进版Piledriver(打桩机)、Steamroller(压路机)和Excavator(挖掘机),充实着FX系列、APU系列以及几乎与之前没有什么渊源的速龙系列的产品线,仍然以桌面平台为主,移动平台作为一个微薄的辅助。而FX-6300、A10-7850K等经典型号,仍然有相当的一批忠实拥趸。另外,APU系列的成功,也吸引了索尼和微软的关注,邀请AMD为它们的著名游戏主机PS4和XBox设计处理器和显示芯片,这种半定制业务成了目前AMD主要的盈利来源,也是为数非常少的处于领先地位的领域之一。
在Kaveri APU发布的前后,AMD首倡,并联合ARM、高通、德州仪器、Imagination和联发科等厂商成立了异构系统架构(Heterogeneous System Architecture, HSA)联盟,这也是AMD最近为数不多的高光时刻之一。这个理念在今天看来,就像多年前的Fusion一样先进,而它的前途如何,仍然是未知数。不过该联盟实力雄厚,未来可期。而AMD苦心研究的,准备一举赶上Intel的全新Zen微架构,还是那么遥遥无期。
在GPU领域,AMD的日子还算好过。当年28nm GCN架构与NVidia的Kepler架构的连环交锋,成为很多DIYer心中一段不可磨灭的记忆。HD7750/7770/7790,GTX650/650Ti/650Ti Boost,你方唱罢我登场。可是近年来,NVidia的Maxwell架构大显神威,超高的能耗比遏止住了连年套马甲的GCN/Southern Islands。更加令人担心的是,自从NVidia把超算能力引入GPU领域,发布Titan以来,AMD在顶级发烧级显卡的领域一直处于被动,中端的性价比型号仍然是雷打不动的主力。在移动端,AMD从HD6000M时代开始便开始走下坡路,直到现在,采用移动A卡的笔记本产品寥寥。如今,NVidia的Pascal和AMD的Arctic Islands GPU蓄势待发,加上HBM等一票先进技术,双方仍然不可避免地要有一场恶战。
……
二十六、
AMD在这段困难的时期经历了剧烈的人事变动。迈耶尔执掌CEO大权不过两年,接下来就是罗瑞德(Rory Read),现在又换成了曾经在IBM和飞思卡尔任职过的资深经理人苏丽莎(Lisa Su)。AMD计划着并且也在实施着长期的战略转型计划,然而就像万吨巨轮很难转弯一样,谁都不会知道这个时期有多长。
感谢AMD,为整个人类的计算机和电子业界的发展做出了如此巨大的贡献,也给这世界上几乎每一个人带来更多更好的体验与乐趣。祝AMD早日摆脱困境,重振当年的雄风。
祝AMD一切都好。
最后的最后,我引用一首词来为这篇又臭又长的破文章结尾吧。
蜃海盈辉,
鸣沙似锈,
误落青岩晚时候。
云山袅然出泉涧,
飘蓬卷荡击尘垢。
征衣满,弓刀染,昨如旧。
岁岁因何折绿柳,
岁岁不得清平久,
岁岁消却前尘镂。
恍惚当时如初见,
罡风晦雨铮鸣骤。
又几时,旧梢头,着新蔻。
——仙剑奇侠传六《千秋岁引》
【全文完】