研究人员提出AI模型无损压缩框架,压缩率达70% 研究中,他们针对包括 Llama-3.1、Qwen-2.5 和 Gemma-3 在内的最新模型进行了实验,借此证明 DFloat11 在保持逐位精确输出的同时,可以将模型大小减少约 30%。 模型 研究 gpu 解压缩 熵编码 2025-04-22 18:44 10