在2025 OCP全球峰会上,英特尔推出了一项突破性技术——将自身Gaudi3 AI加速器与英伟达B200 Tensor Core GPU集成于同一计算架构,构建出高效异构AI系统。这一创新打破了传统单一厂商硬件方案的局限,为AI计算领域开辟了新的技术路径。
该系统的核心设计理念在于任务分工优化:英伟达B200 GPU专注于AI模型的预填充阶段,而计算密集型的解码任务则由英特尔Gaudi3加速器承担。这种分工策略充分发挥了不同硬件的架构优势,实现了计算资源的高效利用。
在Llama开源大模型的实测中,这套异构系统展现出显著优势。与纯B200构成的同构系统相比,其同TCO(总体拥有成本)下的性能提升最高达70%,意味着在相同成本投入下,系统算力产出接近翻倍。这一数据验证了异构架构在成本效益方面的突出表现。
技术细节方面,外媒SemiAnalysis披露该系统除搭载双核心计算芯片外,还集成了英伟达ConnectX-7 400GbE网卡、BlueField-3 DPU以及博通Tomahawk5 51.2Tb/s交换芯片。这些高端网络组件的加入,显著扩展了系统的扩展域,确保多芯片协同工作时的数据传输效率。
行业分析师指出,这种跨厂商硬件的深度整合不仅需要技术层面的兼容性突破,更涉及生态系统的协同创新。该系统的成功实践,为AI基础设施的建设提供了新的技术范式参考。