摘要:5月28日晚间,DeepSeek在微信群发布帖子称,DeepSeek R1模型已完成“小版本试升级”,欢迎前往官方网页、APP、小程序测试(打开深度思考),API 接口和使用方式保持不变。
5月28日晚间,DeepSeek在微信群发布帖子称,DeepSeek R1模型已完成“小版本试升级”,欢迎前往官方网页、APP、小程序测试(打开深度思考),API 接口和使用方式保持不变。
业内人士认为,DeepSeek R1模型“小版本试升级”意味着本次升级不涉及模型架构重构,如 Transformer 层数、参数量级的大幅调整。有网友体验后表示,模型对于问题的推理思考行为、编程能力似乎在升级之后发生了显著变化。
过去几周,有关DeepSeek R2模型即将发布的传闻其实较多,但是最终都被证明仅仅是捕风捉影。
最近谷歌、Anthropic都发布了最新模型,在一些基准测试上的成绩实现了大幅提升。一种普遍的看法是,如果DeepSeek最新的模型在性能上做不到差不多或者超出这些模型,DeepSeek实际上没有特别的理由着急拿出新一代的模型。
DeepSeek R1模型是一款推理模型,在数学、代码、自然语言推理等任务上,具备显著优势。该模型在今年年初发布时,震惊了行业,因为其在一些公认的基准测试中,性能与OpenAI的o1模型基本上比肩,但是成本却便宜很多。
当时,著名风险投资公司Andreessen Horowitz (a16z) 合伙人Marc Andreessen在X上发帖称:“Deepseek R1是我见过的最令人惊叹、最令人印象深刻的突破之一——作为开源,它是给世界的一份有影响力的礼物。”
据DeepSeek公布的技术报告称,该模型的训练成本仅为500多万美元,这引发市场对于西方前沿模型厂商提升模型性能模式的质疑。这些模型厂商基本是都要花费数倍于DeepSeek的资金来购买先进算力来提升模型性能。
过去几个月,关于DeepSeek R1模型幻觉严重的讨论较多。在Vectara HHEM人工智能幻觉测试中,DeepSeek-R1的幻觉率达到了14.3%,是DeepSeek-V3的近4倍,也远超行业平均水平,这导致很多企业放慢了部署使用DeepSeek R1模型的节奏。
来源:电竞大讲堂鉴