Qwen3 炸裂发布!235B 混合推理碾压 DeepSeek-R1,成本暴降 75% 思考模式:面对复杂数学推导(如 AIME25 测评 81.5 分)、代码生成(LiveCodeBench 评测 70 分)等任务时,模型会通过多步骤推理输出详细过程,支持最高 38k token 的动态思考预算。开发者可通过/think指令逐轮控制模式,甚至在 推理 moe moe模型 qwen3 aime25 2025-04-30 02:30 3