在近日举办的2025小米人车家全生态合作伙伴大会上,Xiaomi MiMo大模型项目负责人罗福莉首次公开亮相并发表主题演讲,引发行业高度关注。这位被业界誉为“AI天才少女”的技术专家,以《Xiaomi MiMo:小米基座大模型》为题,系统介绍了小米自主研发的首个推理大模型及其最新开源版本MiMo-V2-Flash的核心特性。
据罗福莉介绍,MiMo-V2-Flash通过三大技术创新构建核心竞争力。其首创的代码与工具调用架构,使模型具备类自然语言的交互能力,可精准解析复杂指令并高效调用外部工具;在模型结构设计层面,团队采用轻量化推理框架,通过优化神经元连接方式实现算力高效分配,为多智能体协同作业提供底层支撑;后训练阶段引入的强化学习范式,则通过动态调整训练策略显著提升模型收敛速度与稳定性。
性能对比数据显示,这个总参数量仅309B(激活15B)的模型展现出惊人实力。在代码生成与智能体协作两大核心评测基准中,MiMo-V2-Flash不仅跻身全球开源模型前两位,更在多数场景下超越参数量达其2-3倍的DeepSeek V3.2和K2-Thinking。特别是在推理效率维度,该模型在速度-成本象限图中占据显著优势,以更低资源消耗实现更快响应速度,为边缘计算设备部署AI大模型开辟新路径。
目前,MiMo-V2-Flash已正式开源上线,其功能设计凸显实用导向。除支持深度推理外,模型集成实时联网搜索模块,可自动抓取最新数据验证回答准确性。在对话场景中,系统既能保持自然流畅的交互体验,又能针对专业领域问题提供经权威资料核实的精准答复。这种“思考+验证”的双引擎架构,有效解决了传统大模型易产生幻觉信息的痛点,为金融、医疗、教育等对准确性要求严苛的领域提供可靠解决方案。
行业分析师指出,小米此次开源的推理大模型标志着AI技术进入“小体积、高智能”的新阶段。通过架构创新实现算力与智能的解耦,既降低了大模型落地门槛,又为终端设备直接运行复杂AI应用创造可能。随着MiMo-V2-Flash在智能家居、智能汽车等场景的深度应用,人机交互方式或将迎来新一轮变革。












