DeepSeek启动开源周,已开源Flash MLA代码库

360影视 2025-02-24 20:59 1

摘要:继此前在2月21日DeepSeek方面预告“开源周”计划,宣布将从2月24日起陆续开源5个代码库,以完全透明的方式与全球开发者社区分享“微小但真诚”的研究进展后。

继此前在2月21日DeepSeek方面预告“开源周”计划,宣布将从2月24日起陆续开源5个代码库,以完全透明的方式与全球开发者社区分享“微小但真诚”的研究进展后。

今日(2月24日)DeepSeek“开源周”如约正式启动。据了解,DeepSeek开源的首个代码库为Flash MLA,这是一个针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,目前已投入实际生产应用。

据悉,MLA即多层注意力机制,是DeepSeek系列模型的基本架构,旨在优化Transformer模型的推理效率与内存使用,同时保持模型性能。可通过低秩联合压缩技术,将多头注意力中的键(Key)和值(Value)矩阵投影到低维潜在空间,从而显著减少键值缓存(KV Cache)的存储需求。

与传统解码器相比,Flash MLA在处理可变长度序列时,能够显著提高计算效率和速度。据DeepSeek方面透露,使用FlashMLA之后,H800可以达到3000GB/s内存带宽、实现580TFLOPS计算性能。

对此有观点认为,这对于自然语言处理、图像识别、语音识别等需要大规模数据处理的应用场景具有重要意义,可加速模型训练和推理过程,提升AI应用的性能和效率。

DeepSeek方面表示,此次开源Flash MLA代码库旨在激发更多开发者的创造力,推动技术的进一步发展。而通过开源,开发者可以更深入地了解Flash MLA的实现原理,并在此基础上进行改进和创新,共同推动AI技术的进步。

值得一提的是,日前DeepSeek-R1大模型在HuggingFace上获得的点赞数量已超过10000个,成为该平台近150万个模型之中最受欢迎的大模型。

根据QuestMobile公布的数据显示,从上线以来截至今年2月9日,DeepSeek App累计下载量已达1.1亿次,周活跃用户数量最高值接近9700万。其中在今年的1月20日至1月26日,DeepSeek APP周下载量达到226万次,次周下载量则升至6300万次,环比增长超2700%。

来源:易快讯

相关推荐