DeepSeek公布推理引擎开源路径,放弃开放完整代码库
“源神”DeepSeek 又有新的开源动作了。4 月 14 日,DeepSeek 悄悄在其 GitHub 的 open-infra-index 库中公布了其自研推理引擎的开源计划。在公告中,DeepSeek 表示,他们并不会选择直接开其内部完整且高度优化的代码
“源神”DeepSeek 又有新的开源动作了。4 月 14 日,DeepSeek 悄悄在其 GitHub 的 open-infra-index 库中公布了其自研推理引擎的开源计划。在公告中,DeepSeek 表示,他们并不会选择直接开其内部完整且高度优化的代码
FlashMLA是针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,其灵感来自FlashAttention 2&3和cutlass项目。该代码库目前已投入生产。
据一些维护者称,人工智能被用于在开源仓库中创建虚假功能请求。到目前为止,Curl、React、CSS和Apache Airflow等项目中都已报告了由人工智能驱动的问题。