一文图解大模型量化:量化的目的、内涵及若干实现策略 大模型(LLMs)通常过于庞大,可能包含数十亿甚至数千亿个参数,通常需要配备大量显存(VRAM)的GPU来加速推理。 模型 策略 内涵 张量 线性映射 2025-03-28 09:33 3