小米开源推理大模型Xiaomi MiMo，7B参数性能超越行业标杆

摘要：4月30日，小米正式推出首个专注推理能力的开源大模型‌Xiaomi MiMo‌，以7B参数规模在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）测评中超越OpenAI闭源模型o1-mini及阿里32B参数模型QwQ-32B-Pre

科技快报网讯，4月30日，小米正式推出首个专注推理能力的开源大模型‌Xiaomi MiMo‌，以7B参数规模在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）测评中超越OpenAI闭源模型o1-mini及阿里32B参数模型QwQ-32B-Preview。

MiMo的核心突破在于通过预训练与后训练联动策略激发模型潜能：

预训练阶段‌：构建200B tokens专用推理语料库，采用三阶段递进式训练，累计训练25T tokens以强化复杂逻辑处理能力；

后训练阶段‌：创新性引入“Test Difficulty Driven Reward”算法动态分配奖励，缓解强化学习中的稀疏性问题，并通过“Easy Data Re-Sampling”策略稳定训练过程。

该模型系列（含基础版、SFT版及强化学习版本）已在HuggingFace开源，代码库采用Apache2.0协议，同步公开26页技术报告。

作为小米大模型Core团队的首秀，MiMo以“小参数量、高推理效率”展现技术实力，推动公司股价当日上涨4.74%。此举标志着小米在AI竞赛中迈出关键一步，为智能终端生态注入新动能。

来源：Citreport

标签：模型推理开源 mimo xiaomimimo

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!