人工智能基础设施新锐TensorWave近日放出大招,其在北美地区部署的巨型AI训练集群正式投入运营。这台被戏称为『橙色风暴』的怪兽级计算机,装载了8192颗AMD新一代Instinct MI325X加速芯片,创下AMD GPU集群规模之最。
每颗MI325X都配备256GB HBM3e显存,6TB/s的恐怖带宽让其在处理大模型时游刃有余。得益于19,456个流处理器核心及2.1GHz频率,单个芯片即可提供2.6 PFLOPS的FP8算力。不过更令人瞩目的是整个集群的液冷系统——上万根亮橙色冷却管路将冷水直输每块GPU,完美驯服单卡1000瓦的发热野兽。
行业观察人士指出,虽然MI325X在单卡成本上比英伟达H200更具优势,但AMD平台8卡集群的上限(对标英伟达的72卡方案)曾让不少客户犹豫。TensorWave这次剑走偏锋,通过极致的机柜密度与散热设计另辟蹊径。整套系统可输出21 exaFLOPS的FP8算力,相当于每秒能完成2.1亿亿次浮点运算。
据内部人士透露,这家初创公司已获得由AMD风投领投的1亿美元A轮融资,后续计划在今年内升级至采用CDNA4架构的MI350X平台。虽然ROCm软件生态仍在完善,但这片由8000多片『红色核弹』构筑的算力矩阵,无疑为AMD在AI军备竞赛中赢得关键筹码。
(小编点评:当橙色液冷管在数据中心蜿蜒流淌,这场算力竞赛已进入白热化阶段。TensorWave的豪赌能否打破英伟达的统治?且看下一代MI350X如何改写战局。)