清华团队深入分析长上下文建模中的状态崩溃,Mamba作者点赞 而经过研究人员的对症下药,Mamba-2(370M)在256K上下文长度上达到了近乎完美的密钥检索精度。 建模 mamba mamba作者 2024-11-27 14:54 3