华为发布Atlas 350加速卡:昇腾950PR助力,算力超H20近3倍且支持FP4低精度

   时间:2026-03-22 03:39 来源:快讯作者:沈瑾瑜

在华为中国合作伙伴大会2026上,一款备受瞩目的AI训练推理加速卡Atlas 350正式亮相。这款加速卡搭载了华为全新研发的昇腾950PR(Ascend 950PR)处理器,标志着华为在人工智能芯片领域又迈出了重要一步。

与前代昇腾芯片相比,昇腾950PR在多个关键性能指标上实现了显著提升。特别是在低精度数据格式处理、向量算力、互联带宽以及自研高带宽内存(HBM)方面,昇腾950PR展现出了强大的技术实力。这些提升使得Atlas 350在AI训练和推理任务中能够更加高效地运行。

据华为昇腾计算业务总裁张迪煊介绍,Atlas 350在单卡算力上达到了惊人的水平,是英伟达H20的2.87倍。这一数据表明,Atlas 350在处理复杂AI任务时具有更高的效率和更快的速度。同时,Atlas 350还是目前国内唯一支持FP4低精度的推理产品,这一特性使得它在处理特定类型的AI任务时具有独特的优势。

除了强大的算力外,Atlas 350在内存配置方面也表现出色。其HBM容量达到了112GB,是H20的1.16倍。这一配置使得Atlas 350在处理大规模数据时能够更加游刃有余。同时,多模态生成速度的提升也达到了60%,进一步增强了其在AI应用中的实用性。内存访问颗粒度的减小也显著提高了小算子的访存效率,使得Atlas 350在处理细粒度任务时更加高效。

在大会展厅的Atlas 350展台上,华为公布了更多关于这款加速卡的详细参数。Atlas 350的FP4精度算力为1.56P,带宽达到了1.4TB/s,这些数据进一步证明了其在AI领域的强大实力。然而,高功耗也是Atlas 350需要面对的挑战之一,其功耗为600W,是H20的1.5倍。尽管如此,华为表示将通过优化设计和散热技术来降低功耗对整体性能的影响。

Atlas 350不仅支持FP16和FP8等常见精度格式,还支持更低精度的FP4。这一特性使得集成Atlas 350的服务器能够支持更大规模的模型以及更低时延的推理任务。由于精度降低,计算速度得以加快,同时寄存器效率也得到了提升。这对于需要处理大量数据和复杂模型的AI应用来说具有重要意义。

张迪煊表示,基于Atlas 350等产品,华为将结合AI发展趋势和客户需求,打造大、中、小三大核心算力场景。这一战略旨在帮助合作伙伴满足不同场景下的差异化需求,共同深耕行业智能化领域。通过提供多样化的算力解决方案,华为有望进一步巩固其在AI芯片市场的领先地位。

 
 
更多>同类内容
全站最新
热门内容