Cell微处理器架构(Cell Broadband Engine Architecture,通常简称Cell BE或CBEA)由索尼、索尼电脑娱乐、东芝、国际商业机器(IBM)公司联合开发。它是以RISC指令体系的Power架构为基础来设计的,并具有高时钟频率、高执行效率等特点。主要应用于PlayStation 3和刀锋服务器之上。而CELL处理器的第二代版本,提高了双精度浮点运算性能。以往的CELL处理器,双精度的性能只有单精度的十分之一。而新的CELL处理器,可以使到双精度性能有五倍的提升。
在2000年年中,索尼电脑娱乐,东芝公司和IBM结成一个被称为“STI”的联盟,用以设计和制造的处理器。
STI设计中心于2001年3月开业。Cell使用POWER4处理器的设计工具的增强版本,其设计期间为期四年。有三家公司超过400名的工程师一起在奥斯汀工作,并有11个IBM设计中心的重要支持。在此期间,IBM提出了Cell架构,制造工艺和软件环境有关的多项专利。早期专利版本的Broadband Engine被证实是一个芯片封装,包括“处理单元(Processing Elements)”,这是该专利的描述,是当前已知的Power Processing Element(PPE)。当前在Broadband Engine芯片上,每个“处理单元”包含8个加速处理单元,而它被简称为SPE。
2007年3月,IBM将Cell微处理器由第一代产品的90奈米制程推进到65奈米制程,由位于美国纽约州 East Fishkill 的12吋晶圆厂展开65奈米制程Cell微处理器的生产。制程推进到65奈米之后,Cell的芯片面积与耗电量将可进一步压低,有利于数字家电等相关应用的发展。
2008年2月,IBM宣布该公司将开始制造的45奈米制程的Cell处理器。2009年8月,轻薄版PlayStation 3-PS3 Slim同时采用45奈米Cell处理器。
2008年5月,IBM推出了高性能的的双精度浮点版本的Cell处理器,以65奈米为主要尺寸的PowerXCell 8i。
2008年5月,以一个Opteron处理器和PowerXCell 8i为基础的超级电脑,IBM走鹃系统,成为世界上第一个达成PetaFLOPS的系统,它当时是世界上最快的电脑,而此纪录一直维持到2009年第3季。
2009年,IBM于SC09高性能计算会议上宣布,放弃基于Cell架构处理器的开发,Cell架构及设计理念将融合到IBM的其他处理器产品中。该公司原计划开发 PowerXCell-8i 处理器的后续产品,内含双PowerPC处理器核心,并设置了32个 SPE 单元的下一代Cell处理器将已被取消。
2005年8月25日,IBM、SONY、SCEI与东芝等 4 家公司正式公开“Cell”,该次所公布的规格数据参考文件,共分为 5 份,包括 1 份说明 Cell 基于分布式处理与多媒体应用所定义的整体架构,另外 4 份则是关于 Cell 独立浮点数运算单元 SPU 的指令集架构,低端汇编语言,高端 C/C++ 编程语言扩展规格,以及应用程序二进制接口(Application Binary Interface)的规格书与帮助文档。
Cell结合了通用的Power Architecture内核,适中的性能与流线型的协处理器,大大加快多媒体和向量处理的应用程序,以及许多其他形式的专用计算。
PPE 可以作为资源管理使用,SPE 可以作为数据处理器使用。PPE 上的程序可以将任务分解到 SPE 上完成,然后相互传输数据。SPE 缺少一般处理器中的大部分通用特性,它们根本不能执行常见的操作系统任务,没有虚拟内存的支持,不能直接访问计算机的RAM,中断支持也非常有限。将 SPE、PPE 和主存控制器连接在一起的是一个名为 Element Interconnect Bus 的总线,这是数据传输的主要通道。
Power Processor Element(简称为PPE):PPE 包含一个64比特双线程PowerPC结构的RISC内核,并支持PowerPC的虚拟内存子系统。它具有32KB的 L1 指令缓存,以及一个32 KB 数据缓存,以及512 KB L2的共享缓存。Cell中的PPE包含VMX指令集(Vector Multimedia eXtensions:AltiVec技术)。
Synergistic Processing Elements,简称SPE。每个 SPE 包括:
Element Interconnect Bus(简称 EIB):透过该总线,每个DMA控制器获取与SPE相关的指令和数据。DMA控制器也将结果送到通用总线,使其可输出到芯片外,以发送给芯片上的周边设备或PPE缓冲存储器。PPE可意识到SPE所传输的数据,但SPE则完全不知道毗邻的任何流量;这将保持SPE的简易性,并限制在其运行时的中断或不必要的影响,如果SPE需要知道外部数据的变化,其各自的DMA控制器便负责截取信息。
Cell BE内置2.5兆字节内存,通过Rambus的XDR和FlexIO技术,每秒可与外部内存交换100吉字节Gbytes的数据。XDR存储器控制器接口(XIO)为72比特宽,可以在3.2Gbps数据速率下运作并提供25.6GB/s的总存储器带宽。
2008年,IBM公布了经修订的变种Cell,它被称作PowerXCell 8i,并从IBM的刀片服务器QS22开始采用。花费超过一亿美元的 走鹃 是世界第一台 Linpack 达成 1 petaflops 的超级电脑,采用双核 AMD Opteron 加上PowerXCell 8i 处理器混合为一个节点的设计,走鹃共有6563颗双核的 AMD Opteron,以及12240颗IBM PowerXCell 8i。国际超级电脑大会发布的绿色超级电脑500大(Green500)名单,IBM的PowerXCell 8i独占前3名及5至7名,该排名以平均每瓦电力每秒所提供的浮点运算能力(MFLOPS/W)为基准。除了QS22和超级电脑,PowerXCell也被做成一张PCI-E接口的加速处理器,并在QPACE项目作为核心处理器。
STI 将 Cell 应用于高清数字影音家电、游乐器、电脑绘图、科学运算等领域,其中以 SCE 所推出的 PS3 主机为相关应用中最受瞩目、规模也最为庞大的产品。第一代的 Cell 微处理器将具备1个 PPE 微处理器核心,与8个 SPE 协同处理器(保留1个 SPE 作为备援,实际可用的 SPE 为7个),由 2.5 亿晶体管所构成,PS3 则采用时脉 3.2GHz 的版本。
东芝推出基于CELL的辅助处理器,名为SpursEngine。这与真正的CELL处理器不同,它只有1个PPE和4个SPE核心,但额外增加了MPEG-2和H.264的硬件编解码器。它可以用来加速图片和视频播放(包括MPEG-2和H.264),并有自己的XDR存储器。接口方面,可以采用PCI-E x1或者x4。东芝的平板电视都会采用相关的处理器,将标清分辨率插值至1080p。并同时进行细节修补,改善色彩,边缘锐利化等工作。丽台已推出采用SpursEngine芯片的加速卡,用作协助电脑作影像编辑。
东芝公司推出Cell TV,它能把2D画面转换成3D。Cell T还可升级数字视频,甚至补强像素,强化低质量的流,并测知房间的灯光,调整屏幕的显示质量。Cell TV尚有内置摄影机、麦克风与软件,可以拨打网络视频电话。这是东芝以Cell为核心开发的首款产品,重点显然是将电视机作为一个范例,用来说明硬件和软件工程师能够合力开发出什么样的产品。例如:利用Cell电视机的连网功能创建一种商业模式,这款电视机显然可以成为一大批付费服务的载体。