西班牙语媒体这样报道Deepseek:从中国挑战美国的人工智能霸主地位

360影视 2025-01-27 16:54 2

摘要:就在特朗普政府宣布斥资数十亿美元以维持美国在人工智能领域的全球领先地位时,中国的一项研究成果——Deepseek v3,引发了广泛关注。这一突破性技术不仅以远低于对手的成本进行训练,还重塑了硅谷对先进语言模型基础设施及能源需求的看法。

更新时间:2025 年 1 月 25 日,星期六 20:49

就在特朗普政府宣布斥资数十亿美元以维持美国在人工智能领域的全球领先地位时,中国的一项研究成果——Deepseek v3,引发了广泛关注。这一突破性技术不仅以远低于对手的成本进行训练,还重塑了硅谷对先进语言模型基础设施及能源需求的看法。

Deepseek v3 的开发团队由投资基金经理梁文峰 (Liang Wenfeng) 领导,利用 560 万美元的预算完成了模型的训练,远低于同等水平模型的传统费用。根据本周发布的技术文献,Deepseek v3 的训练过程仅耗费 270 万小时的 GPU 使用时间,这仅为 Meta 训练 Llama 3 所需资源的十一分之一。

更值得注意的是,Deepseek 的开发团队决定以 MIT 开源许可证的形式发布该模型。这一举措令许多美国人工智能巨头(如 OpenAI 和 Anthropic)面临巨大压力,因为这些公司在近期高估值融资时曾将高昂的模型训练成本作为主要理由。

面对当前受限的芯片供应,中国不得不寻求更高效的解决方案。而 Deepseek 的成功表明,他们找到了答案。

不过,Deepseek v3 的设计也带有审查机制。

尽管如此,Deepseek 的推理能力仍然引发了硅谷的高度关注,尤其是在解决复杂逻辑、数学和物理问题方面。

硅谷风投巨头 A16Z 的创始人马克·安德森 (Marc Andreesen) 表示:“Deepseek r1 是我见过的最令人惊叹的技术进步之一。作为开源项目,它是一份献给全球的宝贵礼物。”

与此同时,Meta 的人工智能主管 Yann LeCun 也称赞 Deepseek r1 是一种范式转变。他强调,开源技术的潜力是其成功的关键:“Deepseek 从 PyTorch 和 Llama 等开源项目中汲取灵感,并在此基础上开发出新的技术。因为它是开源的,所有人都可以从中受益。这正是开放研究的力量所在。”

Deepseek 的发布也促使硅谷巨头加快脚步。扎克伯格透露,Meta 将于今年推出 Llama 4,并希望其成为全球最先进的开源模型。此外,Meta 还计划让人工智能参与公司研发工作,同时正在建设一个占地规模相当于曼哈顿部分区域、容量超过 2GW 的数据中心。到年底,公司预计将部署超过 130 万个 GPU。

与此同时,OpenAI 也采取行动,首次向 ChatGPT 免费用户提供有限访问其 o1 模型的权限,此前该模型仅对付费用户开放。

DeepSeek 震撼华尔街:纳斯达克因对中国 AI 的担忧大跌超 2%

标普 500 指数期货下跌 1.4%,而纳斯达克指数期货则下挫 2.36%。这一跌势延续了上周五美国股市的现货市场表现,当时股市因投资者的谨慎情绪而走低,抵消了特朗普总统就职带来的部分涨幅。

引发市场动荡的导火索,是中国初创公司 DeepSeek上周推出的一款全新的开源人工智能 (AI) 模型。根据公司声明,该模型的性能足以媲美 OpenAI 的技术。这款产品的最大亮点在于其高性价比和运行所需的低性能芯片,这一特点引发了外界对包括 Nvidia 在内的美国科技企业主导地位的广泛质疑。

Aletheia Capital 消费与互联网负责人 Nirgunan Tiruchelvam 在接受《彭博社》采访时表示:“DeepSeek 的产品对硅谷的核心理论构成了深远挑战,即认为大规模资本和运营投入是发展人工智能的最佳途径。这让人对长期以来为人工智能发展投入的巨大资源产生了怀疑。”

这一背景下,美国股指期货的普遍下滑恰逢本周科技巨头的关键财报周。本周,微软、Meta、特斯拉和苹果等“七大巨头”中的四家公司,以及芯片制造商 ASML,都将陆续发布其第四季度业绩。

“市场当前更多的是谨慎而非乐观情绪,因为这些科技公司面对的对比基准极具挑战性,预计其盈利增速将降至两年来的最低水平,”瑞士昆特银行 (Swissquote Bank) 高级分析师 Ipek Ozkardeskaya 在一份报告中指出。

尽管 DeepSeek 的最新动态备受瞩目,但 Ozkardeskaya 提醒投资者保持冷静。她认为,现在就断言 DeepSeek 能够挑战全球 AI 龙头企业并动摇美国的科技霸主地位仍为时尚早。“本周科技巨头的财报结果,势必会为寻找市场走向的投资者提供更清晰的指引,”她补充道。

中国 AI DeepSeek 下载量登顶美国苹果设备榜单,超越 ChatGPT

股市动态发布时间:2025 年 1 月 27 日,04:35

北京——中国人工智能 (AI) 模型 DeepSeek R-1 的应用程序最近在中国和美国的 App Store 免费下载排行榜中攀升至榜首,超越了广受欢迎的 ChatGPT,成为焦点话题。

根据开发者的说法,于 1 月 20 日发布的 DeepSeek R-1 模型在数学问题解决、编程以及自然语言推理方面表现卓越,其性能堪比 OpenAI 的 o1 模型。

这一创新工具由中国公司 DeepSeek 推出,该公司获得量化投资企业幻方量化(Huanfang Quant)的支持。消息最早由《澎湃新闻 (The Paper)》于周一报道。

低成本,高效率

DeepSeek R-1 凭借高效与低成本的特点在全球开发者和科技界引发热议。据公司介绍,这款模型在 55 天内完成训练,总成本仅为 557 万美元(约合 533 万欧元)。其硬件配置采用了 2 048 台由 Nvidia (NASDAQ: NVDA) 生产的 H800 GPU,这是因美国对华限制而专为中国市场推出的性能减配版本。

这一成本不到 OpenAI o1 模型训练费用的十分之一,令人瞩目。

DeepSeek 称,R1 模型采用先进机器学习技术,在后期优化阶段显著提升其复杂任务的处理能力,即便仅使用少量分类数据也能获得优异表现。此外,DeepSeek 还将训练过程中的技术细节公开,为开发者提供了构建新工具的基础。

在价格方面,DeepSeek 的 API 服务显著低于竞品。其输入每百万token收费 1 元人民币(约 0.14 美元或 0.13 欧元),输出每百万token收费 16 元人民币(约 2.2 美元或 2.1 欧元)。相比之下,OpenAI o1 模型的收费分别为 15 美元(约 14.4 欧元)和 60 美元(约 57 欧元)。 *1千token约750个英语单词。

美国迎来挑战

DeepSeek-R1 的发布正值美国总统特朗普推出“星际之门 (Stargate)”计划之际。该计划旨在未来四年内投资 5 000 亿美元,建设 20 个新数据中心以支持 AI 项目。

“DeepSeek 的技术路径已经对美国在 AI 领域的霸权构成挑战,同时也证明了对中国半导体销售的限制并未达到预期效果,”南京大学教授 Li Baiyang 在接受《环球时报》采访时表示。

技术专家Tian Feng补充道,DeepSeek 的低成本策略与开源方法结合,“正在重新定义 AI 的发展规则”。

目前,中国已有超过 200 款大规模语言模型问世,其中包括字节跳动的“豆包 (Doubao)”、中国移动的“九天 (Jiutian)”、百度的“文心一言 (Wenxin Yiyan)”、阿里巴巴的“通义千问 (Tongyi Qianwen)”、华为云的“盘古 (Pangu)”和 Vivo 的“蓝心 (Lanxin)”。

值得注意的是,中国在 2023 年颁布的规定要求,所有生成式 AI 服务需遵守“社会主义核心价值观”,并禁止生成可能危害国家安全或社会稳定的内容。

幻方主页截图

来源:新浪财经

相关推荐