安蒙COMPUTEX演讲:高通布局智能体时代,打造“计算连续体”新生态

   时间:2026-06-02 09:07 来源:快讯作者:任飞扬

在COMPUTEX 2026的开幕演讲中,高通公司总裁兼CEO安蒙抛出一个引人注目的观点:2026年将成为“智能体之年”。这一论断并非空穴来风,而是基于对AI行业发展趋势的深刻洞察。过去两年,AI领域的竞争焦点集中在云端,从大模型参数规模到GPU算力集群,再到训练成本,每一次技术突破都引发“谁拥有更多算力”和“谁能训练出更强模型”的讨论。然而,随着算力与参数规模逐渐触及天花板,行业目光开始转向应用端,寻找AI的真正落地场景——智能体。

传统AI更像是一个“问答机器”,用户输入指令,模型生成答案,交互的主动权始终掌握在人类手中。而智能体AI则截然不同,它不仅能理解问题,还能解析用户意图、持续跟踪上下文、拆解复杂任务、调用工具,并在多个系统和设备间协同执行。这种转变意味着AI从“帮你回答”升级为“帮你完成”。例如,当用户要求“准备今天的工作简报”时,智能体不会仅生成一段文字,而是会主动读取邮件、日历、本地文档和会议记录,分析优先级,整理待办事项,最终调用Word等工具输出完整文档。这一过程中,文件索引、局部摘要等轻量任务完全可以在本地设备完成,无需全部上传云端,从而降低延迟、保护隐私并节省成本。

安蒙在演讲中指出,对话式AI、推理AI和智能体AI的Token需求并非线性增长,而是随任务复杂度呈指数级上升。简单问答可能仅消耗少量Token,但多轮推理、多工具调用、多智能体协作等场景会大幅放大资源消耗。若所有计算都依赖云端,不仅会导致成本激增,还会面临网络延迟、能源消耗和隐私泄露等瓶颈。因此,AI产业不能仅依赖“堆砌云端算力”,而需探索更高效的算力利用方式。这正是高通提出“计算连续体”的初衷:根据成本、性能、时延、功耗和隐私需求,将智能体工作负载动态分配至终端设备、边缘侧、本地服务器和云端,形成覆盖全场景的计算架构。

高通的设想并非“端侧取代云端”或“云端压倒端侧”,而是通过重新分工优化计算资源。例如,本地化、强隐私的任务可由设备端处理;高上下文、高复杂度的任务则交由云端;边缘设备和本地AI工作站则承担过渡角色。这一理念与高通长期深耕的移动计算领域高度契合。过去几十年,高通始终致力于在有限功耗和体积内提供强大算力,其技术已广泛应用于手机、耳机、可穿戴设备、汽车和机器人等场景。在智能体时代,高通希望将这一优势扩展至整个AI计算体系,从毫瓦级的可穿戴设备到千瓦级的数据中心推理系统,构建全链路算力生态。

对普通用户而言,智能体AI最先改变的或许是日常使用的设备——手机。过去,智能手机是数字生活的核心,可穿戴设备和IoT设备则作为延伸存在。但在安蒙看来,智能体时代将重塑这一格局:数字生态的中心不再是设备或操作系统,而是智能体本身,设备则成为智能体的“端点”。例如,用户在手机上的需求可无缝流转至PC处理;戴上智能眼镜后,智能体可通过摄像头和麦克风获取新输入,并结合此前任务提供服务。这种跨设备协同要求硬件具备更强性能:CPU需支持任务编排和系统协调,NPU和GPU需运行本地模型和并行推理,传感器和连接能力则需帮助设备理解用户环境。

高通正通过技术整合推动这一变革。其产品已覆盖手机、AI PC、汽车和机器人等领域,并持续探索6G与计算体系的融合。未来网络不仅负责连接,还将承担部分计算和感知任务,形成设备、边缘和云端的紧密协同。高通推出的Qualcomm AI200、AI250等千瓦级算力服务器,正与云服务商和合作伙伴推进部署,进一步拓展其数据中心产品组合。从最小型可穿戴设备到高性能推理数据中心,高通试图构建一个覆盖全层级的算力生态,为智能体时代提供底层支撑。

安蒙的演讲透露出高通更宏大的战略目标:成为智能体时代的底层平台提供者。随着AI竞争从模型转向智能体,终端设备、边缘计算和连接技术的重要性日益凸显。高通希望利用自身在移动计算和连接领域的积累,整合高性能计算、低延迟连接和高感知能力,构建覆盖设备、网络、边缘和云端的完整计算体系。这一愿景若能实现,高通或将重新定义AI时代的计算架构,让智能体真正“无处不在”。

 
 
更多>同类内容
全站最新
热门内容