解码草稿

华盛顿大学团队：如何优化推测性解码草稿？

近日，来自华盛顿圣路易斯大学和卡内基梅隆大学的研究团队发表了一项关于大型语言模型（LLM）加速技术的重要研究。这项由Langlin Huang、Chengsong Huang、Jixuan Leng、Di Huang和Jiaxin Huang共同完成的研究，于