摘要:其在数学、代码、自然语言推理等任务上性能完全可以比肩OpenAI o1正式版。性能强大只是其优势的一部分,更大的优势在其训练成本,大概只有夜间常规成本的五十分之一左右,这个优势非常巨大。
2025年1月20日,DeepSeek正式发布了DeepSeek-R1大模型,一经发布就在全球引发了重大轰动。
其在数学、代码、自然语言推理等任务上性能完全可以比肩OpenAI o1正式版。性能强大只是其优势的一部分,更大的优势在其训练成本,大概只有夜间常规成本的五十分之一左右,这个优势非常巨大。
DeepSeek-R1横空出世后,西方政治、科技界态度反应不一,有支持力肯的,也有从各个各个角度质疑的,贬低的,在这种情况下,英伟达方面的态度就非常值得关注。
DeepSeek爆火之后,英伟达是利益受损的,因为DeepSeek的成功证明了人工智能的应用算法也非常重要,并不是绝对硬件算力越强,人工智能AI的性能也越强,无需过于依赖英伟达的先进AI芯片,这种心理导致英伟达的股票大幅下滑。
尽管如此,英伟达方面的态度相对公正、客观:
“DeepSeek是一项令人瞩目的AI进步,也是Test Time Scaling的完美案例。DeepSeek的成功(向大家)演示了如何使用该技术创建新模型,利用广泛可用的模型和完全符合出口控制标准的计算。
推理需要大量的 NVIDIA GPU 和高性能网络,我们现在有三个扩展法则:训练前和训练后(仍在继续)以及新的测试时扩展。”
总的来说,英伟达方面的态度是比较公正、客观、积极和友善的,值得肯定。
来源:宗熙先生
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!