DeepSeek霸榜,又被挤崩!“找他们的人踏破门槛了”

360影视 2025-01-27 12:55 2

摘要:近日,国产AIDeepSeek在中国、美国的科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”,在外网,DeepSeek被不少人称为“神秘的东方力量”。

近日,国产AI DeepSeek在中国、美国的科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”,在外网,DeepSeek被不少人称为“神秘的东方力量”。

DeepSeek应用登顶APP下载排行榜

1月27日相关微博热搜刷屏:

1月27日早间,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一

1月24日,在国外大模型排名 Arena 上,DeepSeek-R1 基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分,略超 OpenAI o1 的1352分。

更为关键的是,该模型每百万个token的查询成本仅为0.14美元,而OpenAI的成本为7.50美元,便宜了98%,而且允许开源。

同样在1月27日,DeepSeek服务状态页面显示,DeepSeek网页/API不可用,目前正在调查该问题。昨日(26日),DeepSeek曾出现短时闪崩现象。对于DeepSeek网页/API不可用的原因,DeepSeek回应称,可能和服务维护、请求限制等因素有关。

“中国模型”震动华尔街

网络社群里,越来越多的人把DeepSeek的出现与近期英伟达的回调联系在一起。

美股大V“THE SHORT BEAR”在社交媒体上表示,DeepSeek 创造了一个AI巨头们的痛苦时刻,而投资者必须对此敲响警钟。“如果击败 OpenAI 所需要的金额是 5500万美元(包括5000个 H800 GPU和500万预训练费用),那么这个行业的商业化会比很多人预想的要快很多。”

包括海外媒体 Vital Knowledge,德国世界报知名市场评论员 Holger Zschaepitz,都不约而同地把 DeepSeek 称之为“美国股市最大的威胁”。【详情回顾>>“中国模型”震动华尔街】

揭秘背后操盘手

天眼查显示,DeepSeek的开发者为杭州深度求索人工智能基础技术研究有限公司(简称“深度求索”),该公司成立于2023年7月份,由宁波程恩企业管理咨询合伙企业(有限合伙)和梁文锋共同持股。

据了解,深度求索背后的操盘手梁文锋是金融圈成名已久的高手。他创立的幻方量化,为国内量化私募巨头之一。

据湛江发布,来自湛江的梁文锋近日现身《新闻联播》,以DeepSeek创始人的身份参加了一场国家超高规格座谈会,并现场发言。

梁文锋是湛江市吴川市覃巴镇米历岭村人,父母都是小学语文老师。梁文锋一直是学校里的“尖子生”,并在数学学科表现出极大天赋,初中时期就学完了高中数学,甚至开始学大学的数学。

最后一排右边第6个是梁文锋,图:湛江发布

目前,梁文锋持股宁波程恩50.1%,宁波程信柔兆企业管理咨询合伙企业(有限合伙)持股49.8%,宁波程普商务咨询有限公司持股0.1%。而宁波程信由梁文锋、郑达韡、李欢、陈哲等自然人共同持股。

DeepSeek微信公众号信息显示,1月20日,深度求索正式发布DeepSeek-R1大模型,并同步开源模型权重。“DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。”深度求索在发布信息中表示。

《黑神话:悟空》的主创冯骥也高度评价和推荐DeepSeek,他指出存在六大优点:

1、强大。比肩o1的推理能力,暂时没有之一;

2、便宜。参数少,训练开销与使用费用小了一个数量级;

3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型;

4、免费。官方目前提供的服务完全免费,任何人随时随地可用;

5、联网。暂时唯一支持联网搜索的推理模型(o1还不支持);

6、本土。深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成。

此外,在美国硅谷,多位人工智能行业意见领袖对DeepSeek-R1表达由衷赞美。据证券日报报道,微软CEO萨蒂亚・纳德拉公开表示:“他们切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。”曾投资过OpenAI的投资人马克·安德里森在社交平台表示,DeepSeek-R1是我见过的最令人惊叹,最令人印象深刻的突破之一,并且是开源的,是对全世界的大礼。

值得注意的是,据湛江发布消息,性能比肩GPT-4o的DeepSeek-V3,投入研发费用为558万美元,训练成本不到GPT-4o的1/20,且只用了2048张H100的GPU集群,用时仅53天。在同等水平下,哪怕是全球AI第一梯队的头部公司,至少也要用到1.6万张以上的GPU进行训练。

市场认为,DeepSeek R1的成功可能削弱了市场对英伟达AI芯片需求的预期,已有多家券商发布相关研报。

实地探查Deepseek

DeepSeek是家极为低调的创业公司,一度游离在主流视野之外,但在2024年12月上线并同步开源DeepSeek-V3模型之后突然爆火。在这突然爆红之际,深度求索却选择了“深潜”,不想与外部有任何形式的交流互动。

杭州深度求索的注册地位于杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室。

1月14日上午,21世纪经济报道记者实地探访了杭州汇金国际大厦。

汇金国际大厦由4幢写字楼组成,均需要刷卡进入,其中AB楼的前台人员向21世纪经济报道记者确认,“这里是西1幢”,其表示,“需联系公司的对接人才能刷卡进电梯上楼”,拒绝了记者的进一步探访要求。

而21世纪经济报道记者多次拨打公开电话,均提示“暂时无法接通”

“找他们的人踏破门槛了”,“最近几波我们去约都没约上”,有投资人向21世纪经济报道记者透露。

此外,1月14日,21世纪经济报道记者加入了深度求索的“官方交流98群”。该群的群公告写道,“暂不对外进行项目合作,不提供私有化部署及相关支持服务;DeepSeek将集中研发精力奉上更强的模型,尽情(敬请)期待!”

21世纪经济报道记者曾注意到,群里一度讨论氛围热烈,不时有人提问,“请问什么时候发布 ios端?”“什么时候出图转视频的功能?”

诸多迹象表明,外界对神秘的DeepSeek充满了好奇和期待。

来源:华商连线

相关推荐