从游戏少年到科技创业者,00后陈源培用人类数据为机器人构建“世界模型”

   时间:2026-06-16 20:44 来源:快讯作者:沈瑾瑜

陈源培的成长轨迹,很难用传统“学霸”模板来定义。高考前夜还在宿舍打牌,大学前沉迷各类游戏,这些经历在他看来并非需要纠正的“弯路”,反而塑造了他独特的认知:持续投入、试错、迭代,是任何领域突破的核心逻辑。这种思维贯穿了他的学术与创业生涯——从土木专业跨入机器人领域,到在强化学习赛道快速崛起,再到23岁回国创立灵初智能,他始终在探索一条非典型的技术成长路径。

在北大杨耀东教授团队期间,陈源培以“强化学习新人”身份,用三个月独立完成了一项关于双手灵巧操作的研究。这项工作不仅验证了GPU并行仿真在机器人训练中的可行性,更让他意识到:仿真环境虽能提供海量数据,却难以完全复刻真实世界的物理特性。摩擦、碰撞、柔性物体交互等复杂场景,仍是仿真技术的边界。这种认知促使他转向另一条路径——从人类操作数据中寻找答案。

斯坦福的科研经历成为关键转折点。他参与的“利用人类动作数据训练机器人”项目,颠覆了传统任务设计范式:不再聚焦“机器人如何运动”,而是将核心转向“物体状态如何变化”。例如,抓取手机被定义为“手机沿特定轨迹移动”,开门被抽象为“门绕铰链旋转”。这种视角统一了不同任务的表达方式,使模型能通过物体轨迹学习通用操作逻辑,而非为每个动作单独设计奖励函数。这一思路后来成为灵初智能技术路线的基石。

2024年,陈源培与京东系创始人王启斌、柴晓杰共同创立灵初智能,聚焦机器人世界模型与具身大脑研发。公司成立不到两年,累计融资超20亿元,其核心策略是从人类操作数据出发构建训练体系。与传统依赖机器人遥操作数据的方案不同,灵初直接提取人类数据中的通用知识——如物体位置、操作意图等,再通过强化学习适配机器人硬件特性。这种路径的落地依赖于自研的Psi-SynEngine数据采集引擎,其动捕手套方案将数据采集成本降低至传统方式的十分之一。

数据获取仅是第一步,真正的挑战在于跨越“具身鸿沟”:人类与机器人的身体结构、驱动方式截然不同,直接复现人类动作不可行。灵初的解决方案是世界模型。2026年发布的新一代模型Psi-R2,被定义为“世界动作模型”,其核心能力是预测动作后果。例如,在拆纸盒任务中,模型需持续理解当前动作对后续步骤的影响,并规划长程操作流程。与传统策略模型相比,Psi-R2更像一套“行动规划系统”,能同时处理目标理解与状态预测。

另一套模型Psi-W0则承担“内部评测系统”角色。它接收当前状态与候选动作,预测未来结果,并通过评估不同方案帮助机器人选择最优策略。以倒酒任务为例,Psi-W0会提前推演液体溢出风险、后续操作影响等因素,使机器人无需在真实世界中反复试错。更重要的是,这一模型通过理解物体状态变化规律,将人类经验转化为机器人可执行的数据,完成从“人类操作”到“机器人能力”的迁移。

灵初的技术框架并非孤立存在。首席科学家温颖提出的“三重世界模型”理论,为其提供了认知基础:人对世界的理解分为三层——底层是物理规律,上层是决策行动,中间层则负责筛选任务相关信息。例如,抓取手机时,机器人需聚焦手机位置与可抓取区域,忽略桌面纹理等无关信息。灵初的系统正是围绕这一逻辑构建:Psi-W0模拟物理世界变化,Psi-R2输出真实动作,中间层模型筛选有效数据,形成闭环训练体系。

当前,具身智能领域仍处于“迷雾森林”阶段。仿真派与真实数据派、夹爪与灵巧手、VLA与世界模型等路线尚未收敛,资本热度与技术不确定性并存。陈源培认为,单一算法概念难以构成长期壁垒,真正难以复制的是系统协同能力——从数据采集质量到模型训练经验,从硬件设计到真机评测,每个环节的精细化程度决定了最终效果。灵初的策略是将硬件、数据与模型视为整体:硬件为数据采集服务,数据持续训练模型,模型在真实任务中迭代优化。

这种路径的验证仍需时间。人类操作数据能否支撑具身智能的规模化学习?世界模型与强化学习能否形成持续扩张的数据飞轮?灵初的探索尚未给出最终答案。但陈源培的态度折射出新一代创业者的共性:他们不迷信既定路线,更关注问题本身的价值;不追求宏大叙事,而是在实验与迭代中寻找技术突破的切口。这种务实与开放,或许正是行业穿越迷雾的关键。

 
 
更多>同类内容
全站最新
热门内容