推土机微架构

✍ dations ◷ 2024-12-26 09:31:08 #推土机微架构

推土机微架构(英语:AMD Bulldozer)是AMD继K10微架构之后推出的中央处理器微架构,由 IBM Power4 的总工程师 Chuck Moore 操刀。该微架构主要应用于桌面型平台、服务器平台乃至超级计算机的微处理器核心上。Bulldozer在历经数次跳票后于2011年9月19日发布,其首发产品是核心代号为“Zambezi”的AMD FX。

Bulldozer微架构从一个早期已搁置的微架构设计发展而来,主攻热设计功耗为10瓦至125瓦的处理器平台。AMD预期认为,基于Bulldozer架构的处理器在实际应用中每个“推土机”(Bulldozer)核心每瓦性能可达到高性能计算(High-performance computing,HPC)的水准。届时每个“推土机”核心会支持Intel绝大部分的指令集(包括SSE4.1、SSE4.2、AES、CLMUL以及AVX),以及AMD自有的指令集(包括由SSE5拆分而来的XOP、FMA4、CVT16)。

2011年,AMD处理器开始导入32纳米制程,推出APU(加速处理单元)新形态处理器,应用在台式机与笔记本电脑。超微的处理器架构有两大关键的调整方向,依用途区分成两种系列,其研发技术代号分别为Bulldozer与Bobcat。Bulldozer架构针对主流服务器、台式机、笔记本电脑的应用,提供高访问性能与高负载多线程的架构,并选择以APU配置的高延展性来链接图形处理器;Bobcat主攻低耗电的超轻薄电脑应用。

Bulldozer架构的处理器均使用格罗方德的32纳米HKMG SOI制程,重新使用类似DEC的多任务计算的设计。根据AMD的发布说明,“平衡专用和共享的处理器运算资源,来提供一个易于成倍提升计算性能的,高度紧凑的单片机多核心的设计”。换句话说,透过精简处理器核心一些“冗余”部分,辅以多核心/多线程的设计,超微希望籍此以更少的能耗,来充分发挥这些核心的特性和性能来提升整块微处理器乃至整个平台的性能。AMD研究员Tim Fischer表示,Bulldozer采用全新的控制结构和运算单元,其性能体现于整数运算、浮点运算、L1缓存、电源管理,和时脉产生器等……均是开发重点,主要意义在于降低功耗并提升单位功耗的性能。

Bulldozer微架构的设计早在2003年已出现,由于AMD忙于K8微架构处理器的研发和推出而搁置,后来Bulldozer架构在该微架构的基础上重新设计。可合并为1个256位的2个128位并且可进行融合乘法运算的浮点运算单元,这个主要特性在2003年的设计中已出现;一个Bulldozer核心单元中,除了前述的浮点运算单元外,还拥有两个整数调度运算单元,每个整数调度运算单元各自拥有4条流水线(另外的读取、解码这两级流水线为两个整数运算单元所共享);L1缓存为每整数调度运算单元独占,但L2缓存则为两个整数调度运算单元所共享。AMD称这样的一个单元为一个“模块”,一个16线程的Bulldozer处理器中包含8个这样的模块,但一个模块并不会被辨认为一个物理核心,而是根据一个模块中的2个整数调度运算单元的数量辨认为两个逻辑核心(即操作系统会将1个模块辨认为两个逻辑核心/线程)。一个“模块”包含2个逻辑核心,和Intel的超线程技术中1个物理核心被辨认为2个逻辑核心的做法似乎有类似之处,但事实上,两者大相径庭:AMD Bulldozer的“模块”为每条线程提供了各自的整数运算调度单元和一级指令缓存,而英特尔的超线程则是两条线程共享核心内所有可用的运算资源。

基于Bulldozer微架构,32纳米SOI HKMG制程的处理器产品于2011年9月率先于桌面型平台上发布,是为核心代号“Zambezi”(Socket AM3+,4至8线程)之AMD FX系列;紧接着的是10月12日发布服务器平台,核心代号“Interlagos”(Socket G34,16线程)、“Valencia”(Socket C32,4至8线程)之AMD Opteron系列重新激活了AMD少有的“FX”品牌。首发的桌面级产品FX-8150,将有四个Bulldozer模块;服务器级微处理器,代号Interlagos,是由两个包含4个Bulldozer模块的MCM、共八个Bulldozer模块所构成。

基于Bulldozer微架构的桌面型平台处理器为AMD FX,于2011年9月19日正式上市。使用GlobalFoundries 32nm SOI工艺,支持Turbo Core 2.0、Cool'n'Quiet、HyperTransport 3.1等技术。使用新的Socket AM3+(942)插座,支持DDR3-1866双通道内存,分为8核、6核、4核三种版本,主频从2.8GHz~4.2GHz不等。配套芯片组为AMD 900系列芯片组。

Bulldozer与Fusion APU“Llano”两个系列处理器的上市时间定案,分别是2011年9月19日跟2012年第一季。最初有4个Bulldozer处理器在2011年9月19日发布,分别是:四核心FX-4100、六核心FX-6100、八核心FX-8150、FX-8120。三核心型号(1.5个模块,微软KB2592546补丁的定义为“1.5核心”)只供OEM市场。

2011年11月14日,AMD宣布推出针对服务器等级性能的Opteron 6200与4200系列处理器(先前代号分别为:Interlagos与Valencia),主要将提供其扩展性,并且提供高出73%的存储器带宽,以对应更高阶的虚拟化技术应用,同时在整体耗电量部分也让每组核心减少原有一半,同时也让主机使用空间减少三分之二,进而节省更多电力、空间等成本支出。

AMD也同步透露2012年将加入全新AMD Opteron 3000服务器平台,主要锁定超高密度、超低功耗的1路网络主机托管(Web Hosting)、网络服务器(Web Serving),以及微型服务器(Microserver)等应用领域。其中将会先推出代号为“Zurich”的4至8核心架构的处理器系列,同样采用推土机(Bulldozer)架构且对应AM3+插槽,并且预计将于2012上半年间出货。

首款基于Bulldozer微架构的消费级处理器AMD FX上市后,在微架构的设计上、性能上和能耗上饱受争议。首发的顶级型号FX-8150,在倚重单线程的基准性能测试中,测试结果显示FX-8150不仅落后于基于Nehalem、Sandy Bridge等微架构的Intel Core i系列,还不如基于K10微架构的AMD Phenom II系列;不过在倚重多线程的性能测试中,结果显示勉强可以追平Phenom II X6 1100T和Intel Core i7-2600K。纵观各媒体的性能测试结果,FX-8150综合性能强于Intel Core i5 2500K,而零售价格则在其之下,这个结果并没给市场预期留下好印象。在性能测试中,FX-8150在厂方默认时钟频率下运作,无论待机抑或满负荷运作,能耗比与Intel基于SandyBridge的处理器不相上下,但是进行较大幅度的超频后,FX-8150尽管性能提升明显但处理器会变得极其耗电,能耗比变得相当低下。

Tom's Hardware的网站评论认为,这种在多线程负载下仍然不如预期的性能表现,是由于目前Windows 7的线程和处理器核心一一对应的线程调度方式。他们指出,如果Windows首先把一条线程分配给一个Bulldozer模块,并在模块内分为两条子线程以充分利用该模块内的整数调度运算单元,这将会性能最大化地使处理器同时处理四条线程。这种线程调度方式和带有超线程的Intel微处理器的类似——Windows 7会在利用逻辑核心(超线程得到的)前把线程安排至物理核心上。

对于处理器在超频状态时夸张的功耗水平,业界相信由于格罗方德的32纳米SOI HKMG制程仍旧不成熟,这个导致了处理器核心在更高时脉下运作时,漏电现象严重,使耗电量飙升以及核心发热量大增。而且有性能测评指出,AMD为压低FX系列的功耗,有意压低部分型号处理器的最高工作温度,而这个温度的设置值,实际还低于处理器在默认时钟频率下满负荷运作时的最高温度,这样一来在处理器过热保护机制下,性能受到了不小的影响,从而使处理器性能不如预期。

而AMD FX的较低端的型号中,FX-4100系列与Intel Core i3系列之间的比较以及FX-6100系列与Intel Core i5系列(Core i5 2500K除外)之间的比较中,除了某些倚重单线程的应用程序和基准性能测试项目以外,其余的差距不大。不过功耗方面仍然有些偏高,尤其是超频以后功耗仍然大幅增加。

2011年10月13日,AMD在其官方博客中回应了AMD FX系列处理器的性能、功耗表现不如市场预期的问题,除了指出由于微架构不同于以往的x86处理器的微架构,现行的应用程序以及基准性能测试程序没有对Bulldozer微架构的特点进行充分优化,以至性能不如预期以外,也承认FX-8150性能不济的事实:不少性能测试成绩不如Intel的Core i7-2600K/2700K,甚至比不过AMD上一代的消费级顶级产品Phenom II X6 1100T。AMD同时表示,在2012年以后的发展规划中,将提升Bulldozer微架构的性能,并降低功耗,目标是每一瓦电功率的性能提升10%至15%。格罗方德也表示继续改进其32纳米SOI HKMG制程。根据目前一些基于AMD Piledriver微架构的AMD Fusion(核心代号“Trinity”)的工程样品的性能测试,结果显示和AMD的预期性能一致。

AMD于2011超级电脑展(Supercomputing 2011)上,宣布基于Bulldozer微架构的新款AMD Opteron 6200系列处理器已被HPCwire杂志的编辑与读者评选为2012年最受瞩目的五款新产品之一,并被美国国家科学基金会(National Science Foundation)的Blue Waters项目采用,将在伊利诺伊州的国家超级电脑应用中心(NCSA)建置此部超级电脑。

超过235部,搭载近5万颗AMD Opteron 6200系列处理器的Cray XE6机柜,使Blue Waters超级电脑能提供超过每秒千兆次(petaflop)的充裕性能,在各种现象研究上的获得突破性进展,包括:宇宙大爆炸(Big Bang)之后的演进、龙卷风的形成、病毒侵入细胞的机制,与其他众多科学工程方面的应用。

2012年12月,搭载18,688颗8模块16核心的AMD Opteron 6274为任务分配单元,18,688颗NVIDIA Tesla运算加速卡(GK110通用图形处理器)的泰坦超级电脑以17.59petaFLOPS的记录荣登TOP500第一名,Green500(超级电脑性能功耗比前500强)第三名。

2011年12月16日,微软发布了KB2592546,即传说中的推土机线程调度补丁。而当天上午微软就已经撤下了补丁,对于这一点BSN网站联系了微软和AMD,得到了AMD方面的官方回应:

AMD称自己也不相信用户能从单独第一部分的补丁中得到好处,原本的补丁发布计划是在2012年第一季度时才能看到推土机在Win7/Server 2008 R2优化后的性能表现。

微软在KB2592546之后,针对以Win7、Windows Server 2008 R2的电脑为基础,进行优化。目前,AMD推土机处理器比预期的慢。因为在该两种操作系统的线程逻辑,只对同步多线程(Simultaneous Multithreading, SMT)的调度特色进行优化,而没对集群多线程(CMT,Clustered Multithreading)一类的多线程设计的处理器进行特别优化,来让性能最有效地运行。

后来完整版的补丁(KB2646060以及KB2645594更新档)发布,不少性能测试结果显示这些性能优化补丁效用有限,无论是服务器平台还是桌面平台,最多仅在某些项目上有15%的性能增长。

2012.09.21 AMD的驱动程序已有内置修补无需安装微软的修正程序

AMD全球副总裁暨终端产品事业群总经理Chris Cloran表示,等级最高的FX-8150八核心处理器,在2011年8月31日,由AMD团队超频达到8.429GHz,超越同厂处理器先前的被“Team AMD FX”缔造的8.308 GHz成绩,荣登吉尼斯世界纪录“最高时脉的电脑处理器”。

AMD在2011年发布2012年的财政预算以及2012年的产品路线图时宣布,在2012年的第三季度发布Bulldozer微架构的改进版Piledriver。首批基于Piledriver的处理器是核心代号“Trinity”的AMD A系列处理器(APU)移动版本和桌面版本;新FX和Opteron在2012年9月发布。

(中文)

(英文)

相关

  • 中国年号索引中国是历史上最早使用年号纪年的地区。第一个年号出现在西汉汉武帝时期,年号为建元(前140年—前135年)。此前的帝王只有年数,没有年号。此后使用年号的传统一直延续到20世纪初期
  • 无限面形在几何学中,无限面形(英语:Apeirogonal hosohedron)是一种平面镶嵌,其包含二个落在无穷远处的顶点,因此它可以视为一个退化的多面形(由球面正二角形组成的球面镶嵌图),又称为无限阶二
  • 路易吉·卡多尔纳路易吉·卡多尔纳(意大利语:Luigi Cadorna,1850年9月4日-1928年12月21日),意大利军人、政治家。最高军衔为陆军元帅。他是意大利将军拉法埃莱·卡多尔纳(英语:Raffaele Cadorna)的儿
  • 金明淳金明淳(韩国语:김명순,1896年1月20日-1951年6月22日)是韩国女性作家、诗人、小说家、电影·话剧演员、记者。她是女性主义者,金一叶·罗蕙锡与韩国早期自由然爱主意者和自由性交
  • 藤井由宫子藤井由宫子(1972年4月24日-)是一名日本女子垒球运动员。她在2000年悉尼夏季奥林匹克运动会中,参加了女子垒球比赛并为日本队获得女子团体银牌。
  • 一日重生《一日重生》()是由美国作家米奇·艾尔邦继《在天堂遇见的五个人》及《最后14堂星期二的课》两本小说后所创作的一部小说,于2006年出版。中文简体版由上海译文出版社于2007年引
  • 第38届安妮奖第38届安妮奖,安妮奖为动画领域的最高荣誉之一,本届入围2010年动画领域电影与作品,颁奖典礼预定将于2011年2月6日举办。
  • 五里河 (渤海)五里河,位于中华人民共和国辽宁省葫芦岛市的一条河流,发源于连山区寺儿堡镇后峪村歪桃山,蜿蜒向东南,流经前峪村、老边村、寺前村、前瓦庙子村、西营盘村、葫芦岛市市区,在龙港区
  • 猫宫日向猫宫日向(日语:猫宮 ひなた/ねこみや ひなた),是日本的虚拟YouTuber,原为ENTUM(日语:ENTUM)所属,在ENTUM于2019年12月31日宣布解约后,现为自由身。发色是粉红色,留着双马尾发型。头上貌似生有一双猫耳,但本人称这是其“睡相差”睡乱头发所致,并非耳朵。服装为一件印有红字“危险物”(きけん物)的白色背心,但有时也会改为其他字句或改穿纯白色背心。性别不明。※粗体字为主要角色。
  • 基层群众自治制度基层群众自治制度是指在《中华人民共和国宪法》的框架下,以中国共产党基层组织为领导,依托基层群众自治组织(例如村委会、居委会),在城乡地区实现居民直接行使相关政治权利及所在居民的自我管理、自我服务、自我教育、自我监督的制度。