blockdiffusion

爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合

块离散去噪扩散语言模型(BD3-LMs)结合自回归模型和扩散模型的优势,解决了现有扩散模型生成长度受限、推理效率低和生成质量低的问题。通过块状扩散实现任意长度生成,利用键值缓存提升效率,并通过优化噪声调度降低训练方差,达到扩散模型中最高的预测准确性,同时生成效

模型 llm di blockdiffusion llm架构 2025-03-25 11:23  3