从游戏少年到科技创业者，00后陈源培用人类数据为机器人构建“世界模型”-数据洞察-数据世界

陈源培的成长轨迹，很难用传统“学霸”模板来定义。高考前夜还在宿舍打牌，大学前沉迷各类游戏，这些经历在他看来并非需要纠正的“弯路”，反而塑造了他独特的认知：持续投入、试错、迭代，是任何领域突破的核心逻辑。这种思维贯穿了他的学术与创业生涯——从土木专业跨入机器人领域，到在强化学习赛道快速崛起，再到23岁回国创立灵初智能，他始终在探索一条非典型的技术成长路径。

在北大杨耀东教授团队期间，陈源培以“强化学习新人”身份，用三个月独立完成了一项关于双手灵巧操作的研究。这项工作不仅验证了GPU并行仿真在机器人训练中的可行性，更让他意识到：仿真环境虽能提供海量数据，却难以完全复刻真实世界的物理特性。摩擦、碰撞、柔性物体交互等复杂场景，仍是仿真技术的边界。这种认知促使他转向另一条路径——从人类操作数据中寻找答案。

斯坦福的科研经历成为关键转折点。他参与的“利用人类动作数据训练机器人”项目，颠覆了传统任务设计范式：不再聚焦“机器人如何运动”，而是将核心转向“物体状态如何变化”。例如，抓取手机被定义为“手机沿特定轨迹移动”，开门被抽象为“门绕铰链旋转”。这种视角统一了不同任务的表达方式，使模型能通过物体轨迹学习通用操作逻辑，而非为每个动作单独设计奖励函数。这一思路后来成为灵初智能技术路线的基石。

2024年，陈源培与京东系创始人王启斌、柴晓杰共同创立灵初智能，聚焦机器人世界模型与具身大脑研发。公司成立不到两年，累计融资超20亿元，其核心策略是从人类操作数据出发构建训练体系。与传统依赖机器人遥操作数据的方案不同，灵初直接提取人类数据中的通用知识——如物体位置、操作意图等，再通过强化学习适配机器人硬件特性。这种路径的落地依赖于自研的Psi-SynEngine数据采集引擎，其动捕手套方案将数据采集成本降低至传统方式的十分之一。

数据获取仅是第一步，真正的挑战在于跨越“具身鸿沟”：人类与机器人的身体结构、驱动方式截然不同，直接复现人类动作不可行。灵初的解决方案是世界模型。2026年发布的新一代模型Psi-R2，被定义为“世界动作模型”，其核心能力是预测动作后果。例如，在拆纸盒任务中，模型需持续理解当前动作对后续步骤的影响，并规划长程操作流程。与传统策略模型相比，Psi-R2更像一套“行动规划系统”，能同时处理目标理解与状态预测。

另一套模型Psi-W0则承担“内部评测系统”角色。它接收当前状态与候选动作，预测未来结果，并通过评估不同方案帮助机器人选择最优策略。以倒酒任务为例，Psi-W0会提前推演液体溢出风险、后续操作影响等因素，使机器人无需在真实世界中反复试错。更重要的是，这一模型通过理解物体状态变化规律，将人类经验转化为机器人可执行的数据，完成从“人类操作”到“机器人能力”的迁移。

灵初的技术框架并非孤立存在。首席科学家温颖提出的“三重世界模型”理论，为其提供了认知基础：人对世界的理解分为三层——底层是物理规律，上层是决策行动，中间层则负责筛选任务相关信息。例如，抓取手机时，机器人需聚焦手机位置与可抓取区域，忽略桌面纹理等无关信息。灵初的系统正是围绕这一逻辑构建：Psi-W0模拟物理世界变化，Psi-R2输出真实动作，中间层模型筛选有效数据，形成闭环训练体系。

当前，具身智能领域仍处于“迷雾森林”阶段。仿真派与真实数据派、夹爪与灵巧手、VLA与世界模型等路线尚未收敛，资本热度与技术不确定性并存。陈源培认为，单一算法概念难以构成长期壁垒，真正难以复制的是系统协同能力——从数据采集质量到模型训练经验，从硬件设计到真机评测，每个环节的精细化程度决定了最终效果。灵初的策略是将硬件、数据与模型视为整体：硬件为数据采集服务，数据持续训练模型，模型在真实任务中迭代优化。

这种路径的验证仍需时间。人类操作数据能否支撑具身智能的规模化学习？世界模型与强化学习能否形成持续扩张的数据飞轮？灵初的探索尚未给出最终答案。但陈源培的态度折射出新一代创业者的共性：他们不迷信既定路线，更关注问题本身的价值；不追求宏大叙事，而是在实验与迭代中寻找技术突破的切口。这种务实与开放，或许正是行业穿越迷雾的关键。