AMD近日发布全新的PCIe版AI加速卡——AMD Instinct MI350P,试图吸引那些刚开始尝试本地部署AI的企业客户。这款产品最大的特点,不是单纯拼算力,而是“更容易部署”。

过去几年,AMD高端AI GPU大多采用OAM模块设计,需要专门服务器平台,通常一台机器塞8张卡,成本和门槛都很高。而MI350P则回归传统PCIe双槽设计,可以直接插进常规19英寸机架服务器里,只要供电和散热够用即可。

很多对于“AI好奇但预算谨慎”的企业来说,这明显更现实。

从规格来看,MI350P并不弱。它拥有144GB HBM3e显存、4TB/s内存带宽,以及最高4.6 PFLOPS FP4算力,本质上相当于“缩水版”MI350X。AMD支持1到8卡配置,适合中小规模AI推理、训练以及企业私有化部署场景。

不过,它也有明显限制。

由于没有采用AMD Infinity Fabric高速互联,MI350P只能依赖PCIe 5.0通信,卡间带宽最高128GB/s。这意味着在超大模型训练时,多卡扩展能力会逊于高端方案。

AMD这次真正瞄准的,其实是Nvidia H200 NVL以及Nvidia RTX Pro 6000 Blackwell PCIe。

和H200相比,MI350P在FP8性能上理论可领先约38%,显存容量也略高一些。但H200凭借6组HBM3e堆栈,内存带宽仍快约20%,同时还支持NVLink高速互联。

换句话说,AMD在“原始性能”上开始追近,但生态和互联仍是短板。

至于另一位竞争对手RTX Pro 6000,情况则不同。该卡目前市场售价大约在8000到10000美元之间,是NVIDIA面向企业推广较多的PCIe AI卡。

而AMD强调,MI350P拥有:

  • 2.3倍更高峰值算力
  • 2.5倍更高内存带宽
  • 约50%更多显存

所以真正决定胜负的,很可能只剩一个问题:价格。

AMD目前尚未公布MI350P售价。如果定价足够激进,它可能会成为不少企业首次部署AI服务器时的“甜点级选择”。

毕竟现在很多公司并不需要训练GPT级大模型,他们更关心的是:能不能以更低成本,把AI真正放进自己的机房。