张量处理单元

✍ dations ◷ 2025-06-07 13:01:31 #集成电路,机器学习,Google,微处理器

张量处理单元(英文:Tensor Processing Unit,简称:TPU),也称张量处理器,是 Google 开发的专用集成电路(ASIC),专门用于加速机器学习。自 2015 年起,谷歌就已经开始在内部使用 TPU,并于 2018 年将 TPU 提供给第三方使用,既将部分 TPU 作为其云基础架构的一部分,也将部分小型版本的 TPU 用于销售。

2016 年 5 月,Google 在 Google I/O 上宣布了张量处理单元,并表示 TPU 已经在其数据中心内部使用了超过一年。该芯片是专门为 Google 的 TensorFlow 框架(一个符号数学库,用于机器学习应用程序,如神经网络)设计的。不过,截至 2017 年,Google 也将 CPU 和 GPU 用于其他类型的机器学习。其他供应商也设计了自己的 AI 加速器,并针对嵌入式和机器人市场。

Google 的 TPU 是专有的,一些 TPU 的型号已经上市。在 2018 年 2 月 12 日,纽约时报报道称 Google 将“允许其他公司通过其云计算服务购买对这些芯片的访问权”。Google 曾称,它们已用于 AlphaGo 与李世乭的人机围棋对战以及 AlphaZero 系统中。Google还使用 TPU 进行 Google 街景中的文本处理,并且能够在不到五天的时间内找到 Google 街景数据库中的所有文本。在 Google 相册中,单个 TPU 每天可以处理超过1亿张照片。TPU 也被用在 Google 用来提供搜索结果的 RankBrain 中。

与图形处理单元(GPU)相比,TPU 被设计用于进行大量的低精度计算(如 8 位的低精度),每焦耳功耗下的输入/输出操作更多,但缺少用于光栅化/纹理映射的硬件。

根据 Norman Jouppi(英语:Norman Jouppi) 的说法,TPU 可以安装在散热器组件中,从而可以安装在数据中心机架上的硬盘驱动器插槽中。

第一代TPU是一个 8 位矩阵乘法的引擎,使用复杂指令集,并由主机通过 PCIe 3.0 总线驱动。它采用28 nm工艺制造,裸晶尺寸小于 331 mm2,时钟速度为 700 MHz,热设计功耗为 28–40 W。它有28 MiB 的片上存储和 4 MiB 的 32位累加器,取 8 位乘法器的 256×256 脉动阵列的计算结果。TPU 还封装了 8 GiB 的双通道 2133 MHz DDR3 SDRAM,带宽达到 34 GB/s。TPU 的指令向主机进行数据的收发,执行矩阵乘法和卷积运算,并应用激活函数。

第二代 TPU 于 2017 年 5 月发布。Google 表示,第一代 TPU 的设计受到了内存带宽的限制,因此在第二代设计中使用 16 GB 的高带宽内存,可将带宽提升到 600 GB/s,性能从而可达到 45 TFLOPS。TPU 芯片随后被排列成性能为 180 TFLOPS 的四芯片模块,并将其中的 64 个这样的模块组装成 256 芯片的 Pod,性能达到 11.5 PFLOPS。值得注意的是,第一代 TPU 只能进行整数运算,但第二代 TPU 还可以进行浮点运算。这使得第二代 TPU 对于机器学习模型的训练和推理都非常有用。谷歌表示,这些第二代TPU将可在 Google 计算引擎上使用,以用于 TensorFlow 应用程序中。

第三代 TPU 于 2018 年 5 月 8 日发布。谷歌宣布第三代 TPU 的性能是第二代的两倍,并将部署在芯片数量是上一代的四倍的 Pod 中。与部署的第二代 TPU 相比,这使每个 Pod 的性能提高了 8 倍(每个 Pod 中最多装有 1,024 个芯片)。

相关

  • 放血放血是将人的血液放出,以治疗、预防或者诊断疾病的替代医学疗法。放血在西方和中东的理论基础是古代医学的体液学说系统。该系统认为如果体液在人体内失去平衡,则会导致疾病。
  • 大卫·O·塞尔兹尼克大卫·O·塞尔兹尼克(David O. Selznick,1902年5月10日-1965年6月22日),生于美国匹兹堡,犹太人,美国电影业巨擘,《乱世佳人》的编剧,连续两年夺得奥斯卡最佳影片奖。他是好莱坞黄金时
  • 哈得孙河哈德逊河(英语:Hudson River,又译赫逊河)是美国纽约州的大河,长507公里,发源于纽约上州阿第伦达克山脉,上游分出莫华克河,西接伊利运河(可达五大湖),流经哈德逊河谷后汇入纽约港,是纽约
  • 布雷斯地区布尔格布雷斯地区布尔格(法语:Bourg-en-Bresse,法语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code
  • 多相催化多相催化(英语:Heterogeneous catalysis)指在两相(固-液、固-气、液-气)界面上发生的催化反应,目前工业中使用的催化反应大多属于多相催化。在化学中,多相催化是指催化剂的形式,其
  • 保罗一世 (希腊)保罗一世(希腊文:Παύλος Α΄, Βασιλεύς των Ελλήνων,拉丁文转写:,1901年12月14日-1964年3月6日),1947年至1964年任希腊国王。保罗一世是希腊国王康斯坦丁
  • 言论自由之旗言论自由之旗(英语:Free Speech Flag)是一面象征个人自由并表达对言论自由支持的旗帜,由艺术家约翰·马科特(John Marcotte)所设计。本旗帜上的颜色条对应的是HD DVD和蓝光光盘中
  • 属下阶层属下或属下阶层,又译作底层,是葛兰西在《狱中札记》中论述阶级斗争时,迫于当时的政治压力,而用来代替马克思的无产阶级的概念。属下(subaltern)也可以与“属下的(subordinate)”或“
  • 陈慧如陈慧如(英语:Kelly Chen,1976年-),台湾知名电视、电影编剧,曾任记者。代表作包含《痞子英雄》。
  • 披毛壳属披毛壳属(学名:,意为“毛茸茸的头皮”)为双神经类软体动物的基干成员,属于似楯壳螺目的棱管壳科,生存于奥陶纪早期的特马豆克阶,化石发现于摩洛哥东部。成体可成长至 12 公分左右。