大模型推理,不再是“一根筋” 然而主流的MoE架构大模型,却苦于其结构上的“先天不足”:巨大的硬件成本与多重拖累效率的环节,使得中国企业在这场芯片堆砌与效率挖掘的苦径上难以提速。 模型 推理 张量 moe allreduce 2025-05-22 20:29 5