数据世界网数据世界官方网站！

时事快闻

智谱GLM-5.1高速版API发布：400 tokens每秒，国产大模型实现旗舰能力与低延迟并存

时间：2026-05-23 01:59 来源：快讯作者：陆辰风

智谱近日宣布推出一款面向企业客户的高速版API——“GLM-5.1-highspeed”，该模型输出速度高达400 tokens/s，成为全球大模型厂商API中速度最快的产品之一。这一突破不仅刷新了行业纪录，更在国产大模型领域首次实现了旗舰级能力与低延迟的完美结合，打破了“高速即轻量”的传统认知。

GLM-5.1高速版的成功离不开智谱GLM团队与TileRT团队的深度合作。双方从推理引擎、调度系统到基础设施层面进行了系统性优化：在推理引擎层，针对模型架构特点重写核心路径，显著提升单卡吞吐能力；调度系统通过动态批处理、请求合并和KV缓存调度优化，有效降低高并发场景下的尾延迟；基础设施则围绕集群部署、网络链路和负载均衡展开协同优化，确保400 tokens/s的输出速度成为稳定可靠的生产级能力。

传统大模型推理速度受限于调度框架的设计。主流框架以算子为基本调度单元，每个算子需经历完整的“启动-计算-同步”流程，导致在单token、小batch场景下，调度开销被急剧放大。TileRT团队通过彻底重构推理流程，在编译期将整个计算图静态编排为常驻GPU的持久化引擎内核，实现了单卡内计算、异步IO与通信的微任务级拆解。这种设计使得推理过程仅需启动一次引擎内核，中间结果通过寄存器、共享内存和L2缓存直接传递，大幅减少了全局内存访问和主机调度开销。

在多卡协同方面，TileRT将NVIDIA SM单元的Warp特化思想扩展至8卡NVL拓扑结构。不同GPU根据计算密度和数据依赖关系执行差异化任务，形成高效的分工协作模式。这种架构突破了传统同构计算的局限，在保持低延迟的同时，充分释放了多卡集群的并行计算潜力。

目前，GLM-5.1高速版已面向智谱MaaS平台的部分企业客户开放服务，特别适用于AI编程、实时交互、商业决策和实时语音等对响应速度要求严苛的场景。该模型的推出标志着国产大模型在工程化落地方面取得重要进展，为企业级应用提供了更高效的技术解决方案。

更多>同类内容

小米17 Max深度评测：告别副屏拥抱大电池，徕卡影像与实用主义完美融合

我们直接进行游戏测试，性能模式下，半小时原神须弥城跑图，小米17 Max平均帧率稳稳贴着60帧，几乎是一条直线。这结果我是不太意外的，小米17 Max本来机身空间就大，所以在游戏方面的性能释放足够到位，做…

05-23

海盗船进军企业AI领域：CORSAIR PRO产品线发布，涵盖工作站与服务器

IT之家 5 月 22 日消息，传统上专注于消费者业务的硬件企业 CORSAIR（海盗船）美国加州当地时间 21 日宣布推出 CORSAIRPRO 产品线。这是一套专为部署和扩展现代 AI 工作负载的企业而…

05-23

华为MatePad Pro Max图赏来袭：全球最轻薄大尺寸平板，实力与颜值并存

快科技5月22日消息，日前华为MatePad Pro Max正式亮相，这也是全球最轻薄大尺寸平板电脑。现在这款新品已经来到我们评测室，下面为大家带来图赏。正面搭载一块13.2英寸的OLED柔性屏，拥有30…

05-23

沃尔玛中国：电商业务成增长引擎，但毛利率受业态结构影响下滑

05-23

杭州柯林拟控股开普勒：原CEO离职创业，公司估值半年缩水近三成

直到今年5月20日，杭州柯林宣布拟不超过3亿元再向杨华及其他股东购买其合计持有的开普勒机器人41.57%的股权。 4月8日，开普勒机器人宣布完成A++轮融资，规模为亿元级，由赛富投资基金领投，诺力智能装备股…

05-22

马斯克光伏布局加速推进，特斯拉与SpaceX齐聚得州建设光伏工厂

IT之家 5 月 22 日消息，科技界亿万富翁埃隆 · 马斯克 (Elon Musk)今年一月曾在达沃斯世界经济论坛上表示，计划通过三年时间让旗下两家企业特斯拉和 SpaceX 在美国分别建成年产 100G…

05-22

保利发展“23保利02”公司债2026年5月29日付息票面利率3%

05-22

财政部计划于2026年5月22日招标发行1700亿元3年期固定利率附息国债

05-22

2026年6月高颜值手机大赏：荣耀600领衔，设计影像续航全在线

荣耀600系列凭借独特的美学设计、领先的影像系统和超长续航表现，成为2026年6月最值得关注的高颜值手机。其幸运星ID设计将科技与艺术完美融合，8000nits绿洲护眼屏和全焦段4K Live影像带来了全方…

05-22

万物可爱与阿里云强强联合，以AI技术共绘影视创作新蓝图

双方将围绕“AI技术赋能精品剧集制作与IP打造”展开深度共创，基于阿里Happyhorse-1.0大模型优化内容生产平台路径，共同打造AI时代下更高效的创作工具与更精致的内容产品。这一实践不仅验证了通用大模型…

05-22

马斯克或成全球首位万亿美元富翁：解锁其成功背后的三大影响力法则

但真正的信任，不是你说自己有多厉害，而是你失败后还能兑现承诺。马斯克做承诺时，想的是"即使我失败了，我也要让你看到我在兑现"。马斯克用实际行动诠释了它——他不是用甜言蜜语"得人心"，他是用"把自己逼到墙角"的…

05-22

外籍父子共赴IPO征程：伯特利董事长袁永彬工程师履历亮眼，儿子袁若仑接力

此外，袁永彬同时担任公司若干子公司的董事及/或总经理，包括：自2012年12月起担任威海伯特利汽车安全系统有限公司董事；自2016年12月起担任遂宁伯特利汽车安全系统有限公司董事；自2017年3月起担任芜湖伯…

05-22

北汽蓝谷高层变动：张国富卸任刘观桥接任董事长注册资本增至63.7亿

天眼查App显示，近日，北汽蓝谷（600733）发生工商变更，张国富卸任法定代表人、董事长，由刘观桥接任。同时，注册资本由约55.7亿人民币增至约63.7亿人民币。北汽蓝谷新能源科技股份有限公司成立于199…

05-22

关键时刻突生变故！SpaceX“星舰”试飞临起飞被紧急叫停马斯克发声回应

05-22

杭州5月22日挂牌两宗住宅用地萧山余杭各一宗起始总价超23亿元

05-22

点击查看更多 +

全站最新

北京养老服务再升级！民政局携手高德上线养老地图，一键导航享便捷服务

看广告赚钱靠谱吗？实测5款软件分享，教你如何用零碎时间赚零花钱

AMD CEO苏姿丰：中国内地市场贡献两成营收，未来CPU市场增长强劲

Anthropic豪掷150亿美元年费租用马斯克数据中心，AI算力合作引关注

玲珑轮胎及董事长被监管警示企业合规运营再引关注

中国华电高层变动：董事长一职迎来新调整，企业发展引关注

热门内容

本栏最新

杭州柯林拟控股开普勒：原CEO离职创业，公司估值半年缩水近三成

马斯克光伏布局加速推进，特斯拉与SpaceX齐聚得州建设光伏工厂

万物可爱与阿里云强强联合，以AI技术共绘影视创作新蓝图

马斯克或成全球首位万亿美元富翁：解锁其成功背后的三大影响力法则

外籍父子共赴IPO征程：伯特利董事长袁永彬工程师履历亮眼，儿子袁若仑接力

北汽蓝谷高层变动：张国富卸任刘观桥接任董事长注册资本增至63.7亿