一台3090就能跑Gemma 3 27B!谷歌发布Gemma 3全系QAT版模型 该版本经过量化感知训练(Quantization-Aware Training,QAT)优化,能在保持高质量的同时显著降低内存需求。 模型 谷歌 vram gemma qat 2025-04-19 14:26 3