绿茶爸爸
作者绿茶爸爸联盟成员·2021-03-31 10:36
系统工程师·浪潮商用机器有限公司

浅谈 POWER10 芯片的若干亮点

字数 3122阅读 2853评论 0赞 4

浅谈 POWER10 芯片的若干亮点

下面的这个 CPU 芯片路标图片,熟悉 Power 服务器的小伙伴们肯定已经见过很多次了, POWER10 处理器是 2020 年 8 月份由 IBM 在 Hot Chips 大会上发布的。

因为基于 POWER10 芯片的服务器还没有正式发布,所以本文只是基于笔者目前收集到的一些材料,对于 POWER10 的亮点进行一些说明和推测。

  • 芯片制造商是三星电子

相比前一代的 POWER9 处理器,这次 POWER10 处理器是 7 纳米的制程。处理器核心数会达到 30 个。其中比较值得说的是这次的芯片生产厂商是三星电子,相比三星电子,原来的生产厂 Global Foundries 显然有点不够看了。这也让我们对于 POWER10 有了更多的期待。

(知识点:三星电子是韩国最大的电子工业企业,是三星集团旗下最大的子公司。1938年3月三星电子于韩国成立,创始人是李秉哲。现任会长是李健熙,李秉哲的小儿子。三星电子在 2020 年《财富》世界 500 强排名 19 位,营业收入 1977 亿美元,排在他前面只有 2 家科技公司,亚马逊排在第 9 名,苹果排在第 12 名。关于三星电子的故事,小伙伴们可以自行百度,总之是很厉害。)

  • 更多的核心数量

按现有的资料来看, POWER10 芯片每 socket 可以做到 30 核,每核心 8 线程,在 602 平方毫米的面积中集成了 180 亿个晶体管。单芯片封装时可以做到 15 个 SMT8 的核心(理论上是 16 个,估计是考虑良品率,只发布了 15 个),如果是双芯片封装, 30 个( 15*2 )是应该完全没有问题的。

单芯片封装,最大可以扩展到 16 个 Socket ,这款机型应该是对应 POWER9 产品的 E980 ,目前姑且猜测后续 P10 机型为 E1080 。

双芯片封装,最大可以扩展到 4 个 Socket ,这款机型貌似应该是对应 POWER9 的 E950 ,但和 E950 最大的不同应该是核心数量大大的增加了。之前 E950 的 4 个 socket 都是单芯片封装。之所以笔者目前不确定后续出来的机型到底会是什么样子的,是因为笔者还从未在 Power 服务器上看到过这种高密度机型的先例,这款很是值得期待。很久以前的 POWER5 出过一款 560 服务器,在 2 个 CEC 抽屉里面安装了 4 个双芯片封装的 POWER5 CPU ,达到了 16 核,但因为和当年的 570 的性能有重叠,怕冲击已有的市场定价,当时此款机器并没有大力推广。

作为一款老牌的服务器芯片, POWER10 对比目前市场上爆炒的 EPYC ZEN3 加持的 Milan 芯片,并不会让人产生一出生就落后的感觉。

(知识点: AMD 的“ Milan ”服务器芯片是一款基于 Zen 3 架构的处理器,是第二代 EPYC 服务器芯片“ Rome ”的后续产品。上一代的 Rome 芯片让大家看到 x86 服务器市场有望结束 Intel 一家独大的局面)

下图为 AMD 的 EPYC Milan 芯片的简单的规格列表

Milan 的最大核心数是 64 核,但线程只有 2 个。 POWER10 的多线程技术从 POWER5 开始, P6,P7,P8,P9 一路走来,目前 P10 应该是继续延续 POWER8 时代就登顶巅峰的 SMT 8 的技术。究竟会是谁把谁 KO 了,可能还是得看实际的测试效果和适用场景。笔者这里可以肯定的是 4 路以上的场景,大概率会是 POWER10 会赢。

至于 Intel , 7 纳米已经延期,目前至强系列最新的 CPU 是 10 纳米的 Ice Lake 和 14 纳米的 Cooper Lake 系列。据称要在 2023 年才能有 7 纳米的芯片出来。牙膏厂要加油了。

  • PowerAXON Interface 和 Open Memory Interface

这是从 POWER10 处理器开始提出的新的接口形式,之前是没出现在 POWER CPU 上的,按照下图的说法就是,采用了瑞士军刀的理念,一种接口可以适应多种的场景,更灵活,更模块化。

从下图可以看到,无论是 PowerAXON 还是 OMI 接口,都达到了 1TB/ 秒的带宽。

其中 PowerAXON 接口用于 CPU 互联, OMI 用于和内存的连接。(见下图) OMI 接口带宽会支持更多的内存条和更大的内存容量。目前版本的 POWER10 单 socket 能支持 4TB 的内存。

相比之前的 DDR4 ,会有 6 倍的性能提升。并且可以预见的是, POWER10 肯定会引入 DDR5 内存。按下面的这个测试结果,在做 Stream 这个内存测试的时候, DDR5 OMI 接口,要超过 DDR4 OMI 接口 1 倍的性能。这当然是 DDR5 的功劳,但也侧面说明 OMI 接口带宽的强悍。

OpenCAPI 接口也是复用了 PowerAXON 接口,只是连接的时候走的协议不同而已。这个就是前文提到的“瑞士军刀”,一刀多用。如下图,其实 CAPI 是在 POWER8 时候引入的概念,概念很好,但市场反应并不是很接受,更多的只是个技术能力的体现。希望在 POWER10 这一代能有更好的改善。

  • PCIe Gen5

POWER9 的时候引入了 PCIe Gen4 ,在 POWER10 的时候引入 PCIe Gen5 。这个不奇怪,这是由 POWER 服务器在高端领域的统治性地位决定的,动辄 8 路 16 路的高端配置,不由得不重视 IO 方面的处理能力,高端机器上不配置几十块的万兆网卡, 16Gb HBA 卡都不敢号称高端,何况百 Gb 网络, 32Gb HBA 已经成为高端标配了。十成十的重 IO 妄想症患者。

  • 2.6 倍的性能功耗比

如下图,笔者见到的 PPT 上宣称 POWER10 会比前一代的 POWER9 有更好的性能功耗比。其中,性能提升是 30% ,而能耗下降了一半。因此算下来,每瓦特功耗提供的性能相比前一代,提高了 2.6 倍。并非单纯的性能提升。坦白讲,某种程度上看,摩尔定律已经失效, 18 个月性能提升 1 倍太难了。面临此种窘境,并非 POWER 服务器一家,其他家也都是如此。

  • AI-optimized ISA

目前的指令集设计里面,宣称是面向 AI 优化的,所谓 AI Infused ,其字面就是指里面注入一些新的指令和数据类型,比如 SIMD 指令,能大幅度提升相关 AI 操作的速度。

目前 POWER9 芯片使用的 ISA 是 3.0 , IBM 近期发布了 ISA 3.1 ,从目前最新的材料看, POWER10 会使用 Power ISA 3.1 的指令集。因为水平有限,笔者没有看到什么特殊的东西,大概可能是没看懂吧,对,就是没看懂。请大家自行理解吧。

  • Memory Clustering: Distributed Memory Disaggregation and Sharing

坦白讲,按笔者的理解这个东西就是它字面上的意思,把位于不同物理机器上的内存做成了集群,集群内各个节点之间可以共享内存。这个概念很好,但坦白讲,不知道成品机器出来以后会是什么样子的。我感兴趣的是机器之间走的是什么连接,希望不是特别贵的玩意。

下图就是我看到的 PPT 上的概念图,供大家参考。

上面主要是简单介绍了一下 POWER10 芯片的一些特性和亮点,限于水平有限和参考材料并不充足,目前只能比较粗略的介绍一下。抛砖引玉,请大家批评指正。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

4

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广