摘要:大模型独角兽MiniMax上线其首个推理模型MiniMax-M1,称是全球首个开源权重的大规模混合注意力推理模型。据官方介绍,该模型基于此前的MiniMax-Text-01模型开发,支持100万token的上下文长度,是DeepSeek R1的8倍。在智能体工
蓝鲸新闻6月17日讯 大模型独角兽MiniMax上线其首个推理模型MiniMax-M1,称是全球首个开源权重的大规模混合注意力推理模型。据官方介绍,该模型基于此前的MiniMax-Text-01模型开发,支持100万token的上下文长度,是DeepSeek R1的8倍。在智能体工具调用、复杂上下文任务等评测集中,MiniMax-M1得分高于DeepSeek-R1和阿里Qwen3等模型。但在数学、编程等方面,其表现不及DeepSeek 5月底更新的DeepSeek-R1-0528版本。MiniMax还宣布,自6月17日开启为期5天的MiniMax Week。(蓝鲸新闻 朱俊熹)
来源:小轩科技观
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!