在近期举办的小米“人车家全生态大会”上,一款名为MiMo-V2-Flash的新模型成为焦点。这款由新加入小米的罗福莉团队研发的模型,以其独特的定位和性能表现,引发了行业内外的广泛关注。
MiMo-V2-Flash并非传统意义上的“大”模型,其参数规模为309B,激活参数为15B。罗福莉在介绍时坦言,这个尺寸甚至让她不愿称之为大模型。然而,正是这样一个“小而精”的模型,在小米的构想中,被赋予了为Agent提供基座训练的重任。为了实现这一目标,模型在优化过程中特别侧重于高性价比和快速响应能力,例如,它能够达到每秒150 tokens的生成速度,且成本极低,同时在性能上也不打折扣。
在评估榜单上,MiMo-V2-Flash的表现同样亮眼。罗福莉透露,该模型的代码能力和Agent能力已经跻身全球开源模型的前列,甚至在某些评估基准上超过了DeepSeek-V3、Kimi K2-Thinking等知名模型,而其参数规模仅为这些模型的一半到三分之一。
尽管小米的新模型在发布后口碑两极分化,有人称赞其代码能力领先,也有人质疑其是否为“刷分”之作,但无论如何,小米对AI的重视和投入已是不争的事实。在12月18日的人车家全生态大会上发布这一模型,无疑彰显了AI在小米战略中的重要地位。
对于小米而言,AI的应用场景主要集中在两个方面:一是智能终端侧,通过轻量化模型和端侧部署,升级“超级小爱”和澎湃OS,将AI技术融入用户的日常生活;二是智能驾驶侧,利用大模型作为基座,提升智驾能力的上限。为了实现这些目标,小米在AI领域可谓下足了功夫。
从技术架构上看,MiMo-V2-Flash采用了混合注意力机制,这一选择并非偶然。小米团队通过实验发现,滑动窗口注意力(SWA)在长文和推理能力上优于主流的线性注意力机制,且固定大小的KV Cache极易适配现有的基础设施。因此,他们采用了5:1的SWA与全局注意力(GA)的混合结构,以优化成本和提升推理速度。与Claude Sonnet 4.5相比,小米新模型的推理价格仅为其2.5%,而生成速度却是其2倍。
然而,对于小米来说,将模型接入车、手机等设备中仍面临挑战。尽管MiMo-V2-Flash在性能上表现出色,但300B的规模距离端侧落地仍有距离。不过,这并未阻止小米在AI领域的探索步伐。罗福莉在演讲时提出的观点颇具启发性:AI进化的下一个起点,应该是一个能够与真实环境交互的物理模型。她强调,小米要打造的本质上不是一个程序,而是一个具备物理一致性、时空连贯性的虚拟宇宙。
从小米今年的模型发布动态来看,其未来的优化方向似乎已逐渐清晰:一是继续死磕端侧,为智能终端加码;二是攻克物理模型,补足在智驾方面的模型能力。为了实现这些目标,小米在研发投入上可谓不遗余力。小米集团总裁卢伟冰在财报电话会上明确表示,AI是核心研发方向。2025年,小米研发投入预计超过300亿元,其中四分之一将直接投向AI领域,并计划在未来五年投入超过2000亿元。
在组织层面,小米也在积极搭建自己的AI Infra平台,并着手组建GPU万卡集群,以支撑其AI大模型的大力投入。据悉,小米的AI团队在成立时已有6500张GPU资源。同时,小米的人才拼图也在逐步完整。除了负责基础大模型的罗福莉外,小米还挖来了陈龙服务于智驾团队。这种“双核”配置在技术路线上已经初见成效——陈龙团队提出并开源了全球首个打通自驾与具身操作的跨具身基座模型MiMo-Embodied。
这一模型试图解决自动驾驶与机器人之间的知识迁移难题,意味着小米正在尝试用一套通用的AI逻辑去驱动其庞大的硬件生态。从手中的手机到智能家居,再到智驾,小米正试图通过掌握最高效的“大脑”和最广泛的“身体”,在智能时代完成一次彻底的进化。至于这一进化能否成功,不仅取决于模型做得好不好,更取决于这些技术能否真正跑通每一台小米设备,转化为用户感知得到的体验。














