big.LITTLE

✍ dations ◷ 2025-04-05 00:07:00 #ARM架构

ARM big.LITTLE或big.LITTLE是由安谋国际科技公司(ARM)提出的异质运算多核心处理器配置结构配置。在这个配置,将比较耗电、但运算能力强的处理器核心组成的“big集群”与低耗电、运算能力弱的处理器核心组成的“LITTLE集群”结合在一起,这些处理器核心共享存储器区段,并能够在不同的CPU集群之间在线实时分派、切换负载。这个多核心处理器配置结构运用在移动计算上,从而能够做出计算高性能,但是平均耗电低的多核心处理器,ARM的市场数据称在某些运算操作中这个配置配置相比只使用与“big集群”相同CPU核心数量的处理器可节省多达75%的功耗。

本配置配置式在2011年10月ARM发表Cortex-A7时首次对外公布,Cortex-A15也能够与这个架构兼容。2012年10月,ARM公司宣布Cortex-A53(英语:ARM Cortex-A53)与Cortex-A57(英语:ARM Cortex-A57)(ARMv8)也能与这个架构兼容。2014年2月ARM发表Cortex-A17(英语:ARM Cortex-A17),同一年在Computex 2013上ARM又发表了Cortex-A12(英语:ARM Cortex-A12),这两种CPU核心也可用于big.LITTLE配置式中的“big集群”上(“LITTLE集群”由Cortex-A7担当)。

2017年5月,ARM发表DynamIQ取代big.LITTLE。与big.LITTLE相比,DynamIQ允许更为灵活的CPU核心配置和更大规模的集群设计(每个CPU集群可以有八颗CPU核心)、集群数量更多(一块CPU上最大可扩展至32个集群)、更精确的电源控制(每个核心内有更多的时钟门控和电压控制)以及更快速的L2缓存访问操作。然而DynamIQ仅适用于Cortex-A75、Cortex-A55及往后推出的ARM CPU核心。

big.LITTLE中,节电的“LITTLE集群”和高性能的“big集群”之间有三种切换方式,均要求在线实时操作,除了电路设计以外还需要操作系统的配合得当(一些方式需要依赖操作系统的工作流调度实现)

最早也是最简单的big.LITTLE配置实现是这种大小核心集群的切换,高性能CPU核心亦即大核心组成“big集群”,而低功耗CPU核心亦即小核心,则是组成“LITTLE集群”。操作系统的调度器在某一时间点上只能见到一组CPU集群,整个处理器的负载高低变化时,系统会在不同集群间转移负载。当负载从一个CPU集群转移至另一CPU集群时,相关的数据、运行状态等被保存在这些集群共享的二级缓存(L2 Cache)当中,先前运作的CPU集群断电关闭然后加电压开启另一个集群。集群的数据转移还需要使用缓存一致性互联(CCI)。这种big.LITTLE的第一个实现是三星Exynos 5410 Octa。这种方式的一大缺点是CPU集群间的切换延时较高,并且CPU核心的利用率较低。

这种切换方式自集群切换方式演变,主要区别在于每一个集群对操作系统调度器来说都是可见的。在此种方式中,任务在CPU核心之间切换使用内核内置切换器(in-kernel switcher,IKS),芯片设计上是一个高性能CPU核心和一个低功耗CPU核心组成一个复合集群,这一个集群作为一个“虚拟的”核心来供操作系统操作,同一时间点上这一对CPU核心只有一颗在运作,高性能CPU核心仅在有高性能运算需求时才开启,运算性能需求低时则是只开启低功耗核心。当虚拟核心内负载在高低之间变化时,先开启将要切换到的CPU核心,转移运行状态,转移完成后关闭先前运行的CPU核心,由该CPU核心继续运行先前的处理进程。切换工作需要通过cpufreq框架完成。Linux 3.11内核开始提供了big.LITTLE IKS完整实现所需内核组件模块。

苹果公司的A10 Fusion以及A10X Fusion即采用此种big.LITTLE配置。不过,更复杂多样的“大小核心”CPU核心分组,也是有可能的,一只采用IKS方式的处理器上容许一个虚拟核心内有一颗以上的高性能CPU核心或低功耗CPU核心,或者是相同的CPU核心而分成主副CPU核心。英伟达的Tegra 3 SoC也采用类似IKS切换方式,但Tegra 3上采用的是相同的CPU核心,多个主CPU核心与一个副CPU核心的设计。

异质多处理(heterogeneous multi-processing,HMP)是big.LITTLE配置中最灵活也是性能最强劲的使用模式,在这种配置中,同一时间点上所有的物理CPU核心都是可用的并且可以同时全部开启使用,也可以将高性能CPU核心全数关闭而只使用低功耗CPU核心。高优先级或者对运算速度吃重的线程可以被分派至高性能CPU核心上,而低优先级或对运算速度要求不高的线程(如背景任务),则是由低功耗CPU核心负责完成

最早的实现是三星电子的Exynos Octa 5420/5422/5430。而现时大部分实现big.LITTLE配置的ARM架构兼容处理器,多采用这种切换方式。迫于移动设备对CPU核心规模的控制,苹果公司的Apple A11也采用此种调度方式。

全局任务调度的优势:

对于大小CPU核心(集群)成对配置的,它们之间的切换过程对操作系统来说是透明的,操作系统使用现成的动态电压与时钟信号调整(DVFS)功能来实现。操作系统核心现成的DVFS支持(像是Linux核心的cpufreq)将根据负载轻重,从预先设置的一个时钟信号-核心电压参数配置表中以合适的参数设置CPU的电压与时脉,和此前仅需调整核心电压、时脉的CPU一样,然而,较低的参数设置则会开启节电(小)CPU核心,而较高的参数设置则是开启高性能(大)CPU核心。

另一种相对的,则是所有的CPU核心都呈现给操作系统内核调度器,调度器将依据请求决定由哪个核心运行哪个行程或线程。这种调度方式需要非成对配置的CPU核心(集群),不过成对配置的CPU核心(集群)也可能允许使用。不过这种调度方式更考验操作系统内核调度器的调校功力(多核心处理器的性能最优化),至少当前大多数的硬件中,多核心处理器的结构使用的是对称多处理器系统,big.LITTLE配置其实也不例外。

相关

  • Mc5f14 6d10 7s2 7p3(预测)2, 8, 18, 32, 32, 18, 5(预测)主条目:镆的同位素镆(英文:Moscovium)是一种人工合成的化学元素,化学符号为Mc,原子序为115。它最早在俄国杜布纳联合原子核研究
  • 葡萄适葡萄适(英语:Lucozade)原为葛兰素史克药厂旗下产品,后售予三得利。该饮品于1927年由英国药剂师Mr. Hunter发明并推出。其中的成分是葡萄糖,命名为葡萄适。该饮料还有葡萄适Xtra和
  • 细胞表面抗原分化簇 (也被称为分化群 或简称为 CD) 指的是用来辨识那些用作免疫抗原辨识的细胞表面分子。 在生理学上,CD分子有许多用途,通常用作细胞的重要受体或配体。 CD可用于细胞的讯
  • span class=nowrapRuClsub3/sub/span三氯化钌,分子式为RuCl3。一般所指的“三氯化钌”多指三氯化钌的水合物RuCl3·xH2O。无水三氯化钌和它的水合物均为棕黑色固体。三氯化钌的水合物通常是三水合物。这是一种钌
  • 双峰塔双峰塔(英语:Petronas Twin Towers;马来语:Menara Berkembar Petronas),又称双子塔、双子星塔、国家石油大厦、佩重纳斯大厦或国油双塔,是位于马来西亚吉隆坡市中心的两栋摩天大楼,
  • 土著民族原住民,旧称土著,是指某地方较早定居的族群,皆源自外来者(尤其是入侵者)对本地人(或族群)的称谓,原意指当地居民、原居民,但多具有土番、番人、土人等落后的贬意,然而到了二十世纪后期
  • 娄怀高速公路娄怀高速公路(湖南高速公路编号S70)为湖南省“五纵七横”中的“第三横”娄底至怀化高速公路;公路全线长280.393公里,全部路段已建成通车。
  • 广西菜广西菜是指广西壮族自治区当地的地方菜系,简称桂菜。广西壮族自治区位于云南和广东之间,北方大部接壤贵州,所以饮食习惯也受上述地区影响,其中受粤菜影响最大。粤菜的清淡,滇菜的
  • 2019冠状病毒病日本国内病例 除特别注明外,本文所有时间均以东九区时间(UTC+9)为准。2019冠状病毒病日本国内病例,介绍2019冠状病毒病日本疫情中,各地的确诊病例、疑似病例个案详情。下文的详情表中:由于自3
  • 嵌入 (化学)嵌入(英语:Intercalation,或译插层)在化学上是指在两个分子或基团之间加入一个分子,过程可逆。例如DNA嵌入与石墨嵌入化合物(graphite intercalation compound)。有许多分子可与生