AMD架构创新效果 最新AI系统比2020年的产品能效提高28.3倍 (amd 架构)
12 月 11 日信息,AMD 早在 2021 年就制定了“到 2025 年将 EPYC 处置器和 Instinct 减速器的能效提高 30 倍”的目的。
依据 AMD 官方的说法,尽管还没到 2025 年,但他们如今距离这一效果曾经只差临门一脚:装备最新 EPYC 9575F和 Instinct MI300X 的机器相比2020 年一台未地下的机器能效提高了 28.3 倍。
AMD 在测试中经常经常使用了Llama3.1-70B(vLLM0.6.1.post2、TP8 Parallel、FP8、延续批处置)模型,然后对比其推理性能的差异。
AMD 并未走漏其测试中用到的这套 2020 年配件规格,但很显然基于Zen 2 系列的 EPYC 7002 处置器(单个 CPU 最多 64 核)以及基于初代 CDNA 架构的 Instinct MI100 减速器。
AMD 还表示,除了“给力”的配件优化之外,这一效果是经过架构改良和软件优化综分解功的效果,这是可以预料到的结果。
该公司最近刚推出了基于 CDNA 3 架构的 Instinct MI325X 减速器,装备了 288 GB HBM3E 内存子系统;AMD 明年还将推出基于 CDNA 4 架构的 Instinct MI355X,与 MI325X 相比性能(FP8 和 FP16)将提高约 80%。
除了 FP8 和 FP16 外,MI325X 还将支持 FP4 和 FP6 格式,其峰值性能将抵达 9.2 PetaFLOPS(FP4),这关于许多大言语模型来说十分适用。也就是说,AMD 要想实如今 2025 年成功其计算平台能效提高 30 倍的目的并不难。
AMD 初级副总裁、AMD 公司研讨员和产品技术架构师 Sam Naffziger 表示,“经过我们对配件和软件协同设计中深思熟虑的方法,我们对成功 30x25 目的很有决计,并对未来充溢等候,我们曾经看到了在未来几年内成功大幅能效优化的有效途径。”
版权声明
本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。