7B扩散LLM,居然能跟671B的DeepSeekV3掰手腕,扩散vs自回归
语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。在生成模型发展早期,这种刻板印象广泛存在于很多研究者的脑海中。
llm deepseek 掰手腕 deepseekv3掰手腕 2025-04-06 20:40 1
语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。在生成模型发展早期,这种刻板印象广泛存在于很多研究者的脑海中。
llm deepseek 掰手腕 deepseekv3掰手腕 2025-04-06 20:40 1