号外:一家让华尔街的神经高度紧张、坐立不安的中国公司

360影视 2025-01-29 07:34 2

摘要:在当今科技领域,一个令人瞠目结舌的高效且强大的中国 AI 模型宛如一阵旋风,以雷霆万钧之势席卷了整个科技行业。这个备受瞩目的模型被命名为 DeepSeek R1,它的出现犹如一颗重磅炸弹,让远在大洋彼岸华尔街的神经高度紧张、坐立不安。

在当今科技领域,一个令人瞠目结舌的高效且强大的中国 AI 模型宛如一阵旋风,以雷霆万钧之势席卷了整个科技行业。这个备受瞩目的模型被命名为 DeepSeek R1,它的出现犹如一颗重磅炸弹,让远在大洋彼岸华尔街的神经高度紧张、坐立不安。

新的 AI 模型由 DeepSeek 精心开发,这是一家于短短一年前崭露头角的初创公司。然而,就是这样一家新兴企业,却以一种令人意想不到的方式实现了重大突破。著名科技投资者 Marc Andreessen 甚至将其称之为“AI 的人造卫星时刻”。DeepSeek R1 几乎能够与那些在业界声名远扬的竞争对手的能力平分秋色,例如 OpenAI 的 GPT-4、Meta 的 Llama 以及谷歌的 Gemini 等,但在成本方面,却仅仅是它们的一小部分。

该公司宣称,与美国公司在其 AI 技术上动辄投入数亿美元(甚至可能高达数十亿美元)的巨额资金相比,他们仅仅花费了区区 560 万美元来支撑其基础 AI 模型。尤其值得一提的是,考虑到美国多年来一直以国家安全作为借口,对向中国供应大功率人工智能芯片加以严格限制,这一成果就显得更加令人震惊了。这无疑意味着 DeepSeek 竟然能够在功率相对匮乏的 AI 芯片基础之上,成功打造出其低成本的卓越模型。

那么,究竟什么是 DeepSeek 呢?这家公司由中国对冲基金经理梁文峰于 2023 年底创立。在近年来,如雨后春笋般涌现出数十家初创公司,它们都在积极寻求大笔投资,渴望在将科技行业推向崭新高度的大规模人工智能浪潮中乘风破浪、勇立潮头。而梁文峰已然成为中国的 Sam Altman——一位不遗余力地推动 AI 技术发展和新研究投资的传播者。他所领导的对冲基金 High-Flyer 始终专注于 AI 开发。

与包括 Anthropic 和 Perplexity 在内的其他众多 AI 初创公司相同,DeepSeek 在过去的一年中陆续发布了各类具有竞争力的 AI 模型,这些模型在行业内引起了一定程度的关注。据《华尔街日报》的相关报道,其 V3 模式在一定程度上提升了人们对该公司的认知。然而,由于其围绕中国政府及其领导层敏感话题设置的内容限制,引发了外界对于其作为行业竞争对手可行性的质疑。

但是,去年年底横空出世的 R1 于上周正式推出,并在本周当该公司向《华尔街日报》透露其低得令人难以置信的运营成本时,瞬间获得了极大的关注。而且,值得一提的是,它是开源的。这就意味着其他公司不仅可以对其进行测试,还能够基于该模型展开构建,从而进一步改进和完善它。DeepSeek 应用程序在应用商店的排行榜上一路飙升,势如破竹,甚至超过了 ChatGPT Monday,其下载量已接近 200 万次。

那么,为什么 DeepSeek 如此至关重要呢?要知道,AI 是一项极度耗电且成本高度密集的技术。在美国,那些最为强大的科技领导者为了给其 AI 模型提供必需的电力,甚至正在收购核电公司。就拿 Meta 来说,上周他们明确表示,今年将在 AI 开发上投入超过 650 亿美元。

来源:有趣的科技君

相关推荐