外媒:中国AI初创公司“震撼”硅谷

360影视 2025-01-27 14:14 2

摘要:2024年年底,一家名为“深度求索”(DeepSeek)的中国小型初创公司发布了一个新的人工智能系统,其功能可与OpenAI和谷歌等公司的尖端聊天机器人相媲美。

图片来源 视觉中国

中青报·中青网记者 袁野

2024年年底,一家名为“深度求索”(DeepSeek)的中国小型初创公司发布了一个新的人工智能系统,其功能可与OpenAI和谷歌等公司的尖端聊天机器人相媲美。

美国《纽约时报》评论称,能做到这点本就是一个里程碑,而这个名为“DeepSeek-V3”的大模型背后的团队还取得了更大的进步。DeepSeek的工程师在介绍他们如何构建这个大模型的研究论文中写道,他们在训练该系统时,只用了领先人工智能公司所用的高度专业化计算机芯片的一小部分。

美国《连线》杂志称,这些芯片是美中激烈的技术竞争的核心;美国政府竭力维持该国在全球人工智能竞争中的领先地位,试图对可出售给中国及其他竞争对手的高性能芯片(如硅谷巨头英伟达的产品)实施限制。

DeepSeek大模型的表现,让人们对美国政府贸易限制的效果产生了质疑。《连线》称,美国的出口管制措施已迫使中国研究人员使用互联网上免费提供的各种工具来发挥创造力。

英国《金融时报》报道称,DeepSeek聊天机器人能回答问题、解决逻辑问题、编写自己的计算机程序,根据美国人工智能公司使用的行业基准测试,其能力不亚于市场上已有的任何产品。而且它造价低廉,挑战了“只有最大的科技企业(它们全都在美国)才能制造出最先进的人工智能系统”的普遍观念。中国工程师称,他们训练新模型的成本仅为约600万美元,不到科技巨头Meta训练其最新人工智能模型所耗资金的十分之一。

“有600万美元资金的公司,在数量上远远多于有1亿美元或10亿美元资金的公司。”风险投资公司Page One Ventures的投资人克里斯·尼科尔森对《纽约时报》说。尼科尔森主要投资人工智能技术。

《金融时报》称,自从OpenAI在2022年发布ChatGPT、引发人工智能热潮以来,许多专家和投资者认为,如果不投入数亿美元购买人工智能专用芯片,任何公司都不可能与行业领军者竞争。

世界领先的人工智能公司用超级计算机来训练其聊天机器人,这些超级计算机需要多达1.6万个芯片,甚至更多。DeepSeek的工程师却说,他们只用了约2000个英伟达生产的专用芯片。

美国乔治·华盛顿大学专门研究新兴技术和国际关系的助理教授杰弗里·丁(音)告诉《纽约时报》,中国进口芯片受到限制,迫使DeepSeek的工程师“更有效地训练大模型,以保持竞争力”。

本月早些时候,美国拜登政府颁布了旨在阻止中国通过其他国家获得先进人工智能芯片的新规则。新规出台前,美国已采取了多轮限制措施,阻止中国公司购买或制造尖端计算机芯片。特朗普总统尚未表明他是否会继续实施或取消这些措施。

《连线》称,DeepSeek由量化对冲基金幻方量化运营。截至2001年,它已将利润投入购买数千枚英伟达芯片,用于训练其早期模型。该公司在中国声名鹊起,吸引了刚从顶尖大学毕业的人才。

曾参与早期DeepSeek大模型开发的计算机工程师汪子涵(音)对《连线》说,DeepSeek还聘请了不具备计算机科学背景的人员,协助该技术理解并创作出诗歌,甚至成功挑战了难度极高的中国高考试卷,取得了优异的成绩。

去年12月,OpenAI公布了其最新的人工智能推理模型——o3及其轻量版o3-mini。该系统尚未在OpenAI以外得到广泛使用。外媒称,DeepSeek并不落后,它在本月发布的推理模型性能同样令人印象深刻。

《纽约时报》称,一些美国立法者正在探索阻止或限制技术开源的可能性。不过,一些人警告,如果监管机构扼杀了开源技术在美国的进步,中国将获得显著优势。他们认为,如果最好的开源技术来自中国,美国开发人员将在这些技术的基础上构建其系统。从长远来看,这可能会让中国成为研发人工智能的中心。

“开源社区的重心已开始向中国转移。”美国加州大学伯克利分校计算机科学教授伊恩·斯托伊卡对《纽约时报》说。

从去年12月下旬起,加拿大技术顾问鲁文·科恩一直在使用 DeepSeek-V3。他告诉《纽约时报》,该模型与OpenAI、谷歌,以及旧金山初创公司Anthropic的最新系统能力相当,而且便宜得多。

“DeepSeek是让我省钱的好办法。”他说,“我们这些人就想用这样的技术。”

来源:中国青年报

相关推荐