如何重现 DeepSeek 推理性能突破
DeepSeek-V3 在多个评测中展现出强大性能,成为当前最受关注的开源大模型之一。由于采用了大规模 MoE 架构,如何优化推理性能,是工程落地上的关键难点。DeepSeek 团队于 2 月相继开源了 DeepEP、DeepGEMM、FlashMLA、EPL
推理 deepseek decode deepseek推理 2025-05-19 15:55 6
DeepSeek-V3 在多个评测中展现出强大性能,成为当前最受关注的开源大模型之一。由于采用了大规模 MoE 架构,如何优化推理性能,是工程落地上的关键难点。DeepSeek 团队于 2 月相继开源了 DeepEP、DeepGEMM、FlashMLA、EPL
推理 deepseek decode deepseek推理 2025-05-19 15:55 6
Deepseek推动大模型平价化,降低开发成本,为下游端侧和应用侧打开市场空间,催生大量推理算力需求。IDC预测2026年中国智能算力规模年复合增长率达52.3%,增长源于推理端需求释放,大模型应用中推理算力需求超训练算力。国内各厂商已积极开展布局适配Deep
模型 推理 gpu deepseek deepseek推理 2025-05-12 09:05 7
随着NVIDIA平台持续探索Blackwell Ultra GPU和Blackwell GPU架构的极限潜力,这些推理性能的天花板会不断被捅破。
英伟达 推理 tok deepseek推理 tokens每秒 2025-03-21 17:33 9
随着NVIDIA平台持续探索Blackwell Ultra GPU和Blackwell GPU架构的极限潜力,这些推理性能的天花板会不断被捅破。
英伟达 推理 tok deepseek推理 tokens每秒 2025-03-21 17:43 12
万众瞩目 的Blackwell Ultra终于登场亮相,专为DeepSeek R1这样的推理模型打造,性能直达Hoper的40倍! 而下一代GPU「Rubin」,将于2026年下半年问世。 这次,老黄的金句直接升级为「买得越多,赚得越多」。
推理 deepseek deepseek推理 gb300震撼 2025-03-19 22:03 11
万众瞩目的Blackwell Ultra终于登场亮相,专为DeepSeek R1这样的推理模型打造,性能直达Hoper的40倍!而下一代GPU「Rubin」,将于2026年下半年问世。这次,老黄的金句直接升级为「买得越多,赚得越多」。
推理 rubin de deepseek推理 gb300震撼 2025-03-19 08:37 13
人工智能逐渐成年、大模型纷飞、军备竞赛加剧、国产大模型腾飞,特别是推理大模型盛行,在这样的国内外大势下,作为科研工作者、研发型药企,我们该如何甄别和拥抱人工智能?
模型 推理 药企 deepseek deepseek推理 2025-03-11 00:04 12