阶跃星辰推出自研推理模型Step Reasoner mini,性能优异

360影视 2025-01-17 17:19 3

摘要:阶跃星辰于1月16日正式发布了其自主研发的推理模型Step Reasoner mini(简称Step R-mini)。该模型在AIME和Math等数学基准测试中表现优异,成绩超越了o1-preview,并与OpenAI的o1-mini相媲美。此外,在LiveC

阶跃星辰于1月16日正式发布了其自主研发的推理模型Step Reasoner mini(简称Step R-mini)。该模型在AIME和Math等数学基准测试中表现优异,成绩超越了o1-preview,并与OpenAI的o1-mini相媲美。此外,在LiveCodeBench代码任务上,Step R-mini也展现出更佳的效果。

Step R-mini通过大规模的强化学习训练,采用On-Policy(同策略)强化学习算法,实现了“文理兼修”。该模型不仅能准确解答数学、代码和逻辑推理问题,还能富有创意地完成文学内容创作和日常聊天任务,展现了其多方面的应用潜力。

免责声明:本文内容由开放的智能模型自动生成,仅供参考,不构成任何专业建议或决策依据。用户应自行核实信息的准确性和可靠性,本站对用户因使用或依赖本文内容而产生的任何风险或损失不承担任何责任。如有疑问或发现内容有误,请联系本站进行处理。

来源:雪茹教育

相关推荐