OpenAI 毫无预兆地发布了 GPT-5.4,这款新模型首次实现了原生电脑操控能力,一经推出便引发科技圈热议。实测显示,GPT-5.4 几乎可以操作电脑上的所有应用,从文件管理到程序运行,从终端操作到软件交互,其表现令人惊叹。
在实测中,GPT-5.4 展现出了强大的电脑操控能力。以 Macbook 为例,用户只需发出指令,GPT-5.4 就能直接调起日历应用,并要求系统给予相应权限,随后在日历中设置提醒。同样,它还能打开小宇宙 APP,播放指定节目,甚至操作计算器进行复杂计算。无论是打开微信读书阅读书籍,还是更换电脑壁纸,亦或是通过终端运行代码,GPT-5.4 都能轻松应对,真正实现了“原生电脑操控能力”。
GPT-5.4 的发布,让 OpenClaw 这一开源个人 AI 助手项目迎来了新的发展机遇。OpenClaw 由 PSPDFKit 创始人 Peter Steinberger 开发,其核心理念是让 AI 真正帮助用户完成工作,而不仅仅是聊天。OpenClaw 运行在用户电脑上,拥有对 Shell、文件系统、浏览器的完整访问权限,可以通过消息指令执行终端命令、编写脚本、管理邮件等任务。然而,OpenClaw 的性能高度依赖所使用的模型,模型的能力直接决定了其表现。
GPT-5.4 的出现,恰好解决了 OpenClaw 的痛点。作为第一个具备原生电脑使用能力的通用模型,GPT-5.4 不需要借助外部框架或适配层,就能通过截图识别屏幕内容,发出鼠标点击和键盘输入指令,像人类一样操作软件。在 OSWorld-Verified 基准测试中,GPT-5.4 取得了 75.0% 的成功率,超过了普通人类用户的平均水平(72.4%),也远超前代模型 GPT-5.2(47.3%)。
除了原生电脑操控能力,GPT-5.4 还具备其他显著优势。其 100 万 Token 的上下文窗口,让 OpenClaw 能够维持长对话、记住复杂指令链、处理大量文件内容,不再像以前那样容易“遗忘”任务。Tool Search 机制则大幅降低了工具调用的 Token 消耗,提高了 Agent 的效率,对于 7×24 小时运行的 OpenClaw 来说,这意味着每月可节省数十甚至上百美元的 API 费用。GPT-5.4 在推理能力上的跃升,使其能够胜任更复杂、更高价值的工作场景,从写代码调 Bug 到做财务分析写投资备忘录,应用空间广阔。
科技界对 GPT-5.4 的评价极高。HyperWriteAI、OthersideAI 首席执行官 Matt Shumer 认为它是目前世界上最好的模型,远超其他竞争对手,甚至在标准模式下的表现也超越了以往的专业版模型。Mercor AI 首席执行官 Brenda 则表示,GPT-5.4 即将超越顶尖咨询公司、投行和律所的专业能力,能够完成人类精英金领的所有工作,甚至做得更好。
GPT-5.4 的发布,标志着 AI 行业正在从对话式 AI 向智能体 AI 跨越。过去,我们关注 AI 的聪明程度、写作能力、回答能力;现在,话题转向了 AI 的实际能力、完成能力和替代能力。GPT-5.4 与 OpenClaw 的组合,让个人 AI 员工从概念变为现实,开启了 AI 应用的新时代。












