aime25

Qwen3 炸裂发布！235B 混合推理碾压 DeepSeek-R1，成本暴降 75%

思考模式：面对复杂数学推导（如 AIME25 测评 81.5 分）、代码生成（LiveCodeBench 评测 70 分）等任务时，模型会通过多步骤推理输出详细过程，支持最高 38k token 的动态思考预算。开发者可通过/think指令逐轮控制模式，甚至在