算苗科技3D TokenPU芯片A4E流片成功 国产AI云端大算力芯片迈入新阶段

   时间:2026-06-19 02:43 来源:快讯作者:顾青青

在AI算力芯片领域,一场由国产技术驱动的变革正在悄然发生。算苗科技今日宣布,其专为大模型推理设计的3D TokenPU芯片A4E已完成流片,标志着中国首次实现基于国产供应链的3D混合堆叠架构AI芯片量产。这款采用垂直堆叠技术的处理器,有望打破国外对高端AI算力的垄断,为国内大模型产业提供自主可控的算力解决方案。

随着AI产业重心从训练向推理迁移,推理芯片市场正迎来爆发式增长。德勤研究显示,未来五年推理侧算力需求将占整体市场的80%以上。然而,传统芯片架构面临"内存墙、算力墙、通信墙"三重挑战,数据在存储与计算单元间的频繁搬运导致高达80%的能耗浪费和70%的成本增加。算苗科技通过架构创新,为这一行业痛点提供了突破性方案。

A4E芯片采用全球首创的3D TokenPU架构,将8层存储晶圆与计算逻辑晶圆通过硅通孔(TSV)技术垂直堆叠,实现微米级互联。这种设计将传统芯片间毫米级的传输距离压缩两个数量级,带来16TB/s的超高访存带宽,较传统架构提升近百倍。公司创始人汪福全博士形象地比喻:"这相当于把高速公路修到了计算单元的家门口,数据搬运效率实现质的飞跃。"

在软件协同层面,算苗科技引入Tile-Native设计理念,构建了从硬件到算法的完整优化闭环。硬件层面原生支持Tile级数据调度和多精度动态切换,软件层面开发了适配LLVM、Triton等开源生态的编译工具栈。这种软硬件深度协同的设计,使芯片在处理大模型Token时实现"一次搬运、多次复用",显著降低算力损耗和总拥有成本(TCO)。

国产化是A4E芯片的另一大亮点。算苗科技构建了覆盖设计、制造、封装的完整国产供应链体系,基于自研RISC-V架构和IP核,采用成熟国产工艺实现卓越性能。公司核心团队曾在高通量存算一体芯片项目中完成万片级3D混合堆叠晶圆量产,具备全球领先的工程化能力。目前研发人员占比超80%,汇聚了来自中科院、清华、北大等顶尖机构的半导体专家。

在商业化落地方面,算苗科技已与国内头部大模型厂商开展深度合作。通过从芯片定义阶段即介入真实推理场景需求,针对性优化架构与算法,实现AI算力与大模型应用的精准匹配。这种"需求牵引、技术驱动"的研发模式,使A4E在千亿级推理市场中占据先发优势。

资本市场的认可印证了3D TokenPU的技术价值。算苗科技已完成多轮融资,投资方包括国开金融、北京顺禧、源码资本等知名机构,涵盖国资平台、市场化基金和产业资本。这些资金将用于加速芯片量产和下一代产品研发,推动国产AI算力生态建设。

作为3D架构AI芯片的开拓者,算苗科技正通过持续创新重塑行业格局。其基于国产供应链的垂直整合模式,不仅为国内大模型产业提供了安全可靠的算力底座,也为全球AI芯片市场贡献了中国方案。随着A4E芯片进入量产阶段,一场由架构创新引领的算力革命正在拉开帷幕。

 
 
更多>同类内容
全站最新
热门内容