摘要:智库兰德公司(Rand)的AI研究员莱纳特·海姆(Lennart Heim)表示,想象一下早期版本的ChatGPT就像一个读过图书馆里所有书籍的图书管理员。当被问到一个问题时,ChatGPT会根据读过的许多书给出答案。
DeepSeek的策略是利用自己的一些创新以及同样受到限制的中国AI公司常用的技术,来减少训练模型所需的数据处理。
智库兰德公司(Rand)的AI研究员莱纳特·海姆(Lennart Heim)表示,想象一下早期版本的ChatGPT就像一个读过图书馆里所有书籍的图书管理员。当被问到一个问题时,ChatGPT会根据读过的许多书给出答案。
这个过程既耗时又昂贵。阅读这些书籍需要很多芯片,会耗费大量电力。
DeepSeek采取了另一种方法。它的图书管理员并没有读过所有的书,而是在被问到一个问题后,被训练成能够找到合适的书来回答问题。
这涉及另一种技术,称为“混合专家”。DeepSeek和其他一些AI开发者并没有试图找到一个能够准确回答任何主题方面问题的图书管理员,他们所做的类似于将问题委托给特定领域(如小说、期刊和烹饪)的一系列专家。每位专家需要的培训更少,从而减轻了对芯片一次性完成所有任务的需求
DeepSeek在整个春节都在震撼世界震撼华尔街震撼每个中国人的心,作为天使投资人,我说说我的看法。
1 、可能大家觉得我是吹牛,但大家都知道,开发DeepSeek的钱来源于幻方,就是最早的量化基金,量化被认为是专门从中国股市割韭菜的模式,很成功,看到的传奇故事是创始人从 8 万很快赚了几个亿。所以作为正宗的股民,我们都是DeepSeek的天使投资人。
2 、中国股民是全世界最可爱的人,无论输过多次,只要还有一口气,都能勇往直前,从股市学习知识,获得情绪价值,虽然对某些卖公司的老板痛恨之极,对永远 3000 点的年轻保持耻笑,但当发现自己无心插柳投出来震撼美帝的股市,这个春节是开心的。
3 、DeepSeek对中国创新的意义在以坚持开放。垄断能够获得长期利益,比如微软的套装已经让比尔吃了一辈子了,但投资巨大也不利益全球平权,AI 也是一样的,OPENAI已经变成 CLOSEAI 了,投资的级别变成百亿美元起步,阻止了全球的科技进步,DeepSeek如金庸小说中的令狐冲,西湖论剑,不和你CLOSE,投资级别一下子变成几个亿数量级,开源可以战胜闭源,阿里昨天说发布了新的模型,预计接下来越来越多的公司会发布免费的开源模型,帝国主义的闭环垄断被打破。
4 、DeepSeek对中国创新的意义在以市场化和年轻化。春节前去杭州调研了 2 次,发现杭州的创新和其他城市的所谓创新不同,就是市场化和年轻化,在下沙的大学城,虽然你看起来是一些三本学校,但他们创新的氛围和操作超越了某些一线城市的所谓一流大学,获得大学国家机器人大赛等大奖,这才是硅谷的样子,你看看美国的很多巨头创业都是年轻人,再看看中国科创板上市的公司,创始人都年纪太大了。创新需要一个城市的创新机制,杭州没有如某些城市一样弄个基金去投资制造业,而是瞄准未来科技,那个机器人公司是因为杭州给 150 万不要条件才落户的。
5 、DeepSeek很厉害,但DeepSeek的基础还是建立在 OPENAI 基础上的,不是 0 到 1,未到撼动世界 AI老大的地步,事实上一位财经大佬春节前对这个模型的惊讶的时候,我就说根据我的测试,觉得他的输出可能和 OPENAI 的后台有关,因为很简单,他的数据的参考文献中很多英文的,说明其训练的数据和百度等傻模型不一样,不是来自百度中的虚假内容也和 KIMI 一样来自头条中很多虚假内容。DeepSeek降低了对英伟达GPU 的性能需求,但还是要用英伟达的卡训练的。DeepSeek肯定存在和原有模型的从技术到版权的竞争关系,并且完全可能引起版权、禁止等各种纠纷,这是问题但肯定不是问题,就如 PDD 一样,低价,免费就是竞争力。
6 、DeepSeek是中国股民作为天使投资人的骄傲。梁文锋在2019年金牛奖颁奖仪式上表示“散户在股市中越来越难赚钱了,因为量化投资崛起了”。但记者一点, DeepSeek基于英伟达芯片,没有基于寒武纪,最近网络传可能在测试某 w,新年开盘,和英伟达一样,某些伪算力,伪AI 可能成为抛弃的对象,很好!让DeepSeek教育这些假货,股民可以用DeepSeek实现对这些企业的信息平权。
DeepSeek 实现东升西降
DeepSeek是 OPENAI的亚洲廉价版
中国可以创新
DeepSeek与OpenAI的AI模型究竟有何不同?
DeepSeek和OpenAI是截然不同的两家公司,R1和o1也是两种不一样的技术。本文总结了这两种技术在五个方面的异同点。
很难不拿中国AI初创公司DeepSeek的新AI模型与占据龙头地位的美国竞争对手OpenAI相比较。
DeepSeek声称其最新的AI模型R1尤其擅长解决问题,在性能上与OpenAI的o1推理模型不相上下,但每次使用的成本却低得多。DeepSeek的一款应用程序目前在美国iPhone下载排行榜上名列榜首。
但正如DeepSeek和OpenAI是截然不同的两家公司,R1和o1也是两种不一样的技术。以下是这两种技术在五个方面的异同点。
//
DeepSeek的工作原理
《华尔街日报》此前报道,DeepSeek减少了训练模型所需要的数据处理量,不仅利用了自己的发明,还采用了其他受限的中国AI公司所采用的技术。
除了减少数据处理量(这压缩了大量的训练时间和计算成本),DeepSeek还使用一种名为“专家混合”(mixture of experts)的技术。DeepSeek和其他一些AI开发人员的做法类似于将问题交给特定领域的专家。每个专家需要的训练量都比较少,从而减轻了芯片同时处理所有任务的压力。
“他们采用的技术本身并不新鲜,但他们在如此大的规模上应用这些技术,并且如此坚信这些技术,这是很新颖的,”基于AI的互联网隐私平台Loti AI的首席执行官卢克·阿里戈尼(Luke Arrigoni)说。
DeepSeek采用的方法在用户向AI模型提问前需要更少的时间和算力,但在回答问题时需要更多的时间和算力。AI初创公司Fireworks AI的首席执行官兼联合创始人Lin Qiao表示,这个模型通过“思维链”(chain-of-thought)推理来展示自己是如何得出答案的,能一步一步地更好地完成一项复杂任务。
Lin Qiao说,OpenAI的o1模型也使用了思维链推理,但没有向用户展示背后的步骤。她还说,DeepSeek模型产生的推理可以用来训练更小的AI模型,这让其更进了一步。
o1和DeepSeek的R1都能完成所谓的“推理”任务,比如撰写商业计划书或创建填字游戏。
//
性能
DeepSeek背后的研究人员表示,他们用R1与OpenAI的一些顶级AI模型进行了测试,发现R1非常有竞争力。这些评估中包括由OpenAI开发的一项测评,让AI模型自行完成计算机编程任务,比如修复软件漏洞。
R1的性能与OpenAI的o1相当,优于名为o1-mini的早期模型。
Lin Qiao说,开源社区的成员已经创建了一个小得多的R1版本,可以在手机和平板电脑上使用。
一些用户表示,R1的写作和解决问题的能力令人惊叹。但他们也指出,在解决某些特定类型的问题方面,该模型的表现不如OpenAI的o1等竞争对手。
OpenAI首席执行官阿尔特曼(Sam Altman)周一在X上发帖称,R1是“一款令人印象深刻的模型,特别是考虑到能以这个价格交付产品”。他还表示,出现一个新的竞争对手令人振奋,他的公司将提前发布一些产品。
//
成本
DeepSeek宣称自己以更低的成本实现了与OpenAI相媲美的结果,而且没有使用性能最高的芯片。Bernstein Research分析师斯泰西·拉斯贡(Stacy Rasgon)在一份研究报告中表示,据估计,DeepSeek在训练一个早期模型时只用到价值约500万美元的芯片,但这忽略了其研发过程中的研究和实验成本。
目前尚不清楚DeepSeek在更先进的R1模型上使用了多少算力。
相比之下,OpenAI表示,训练GPT-4模型的成本超过1亿美元,而未来的AI模型预计将耗费10亿美元以上。
根据公开和非公开估算,对OpenAI下一个模型GPT-5来说,仅计算成本一项,六个月的训练就可能花费约5亿美元。
//
隐私和安全
DeepSeek最新的旗舰模型V3的用户注意到,一些敏感问题被拒绝回答。
不过,R1可以免费下载和使用,因此一些用户觉得在自己公司的服务器或美国公司托管的服务器上使用会更放心。AI初创公司Liner的首席执行官卢克·金(Luke Kim)表示,该公司愿意使用DeepSeek的R1,因为它是开源的,而且更换AI模型很容易。
相比之下,OpenAI表示自己采用一种“新的安全训练方法”,强制其o1模型遵守该公司的准则。OpenAI表示,该公司希望避免AI模型被“越狱”,并与美国和英国的AI安全机构签署了正式协议。AI模型越狱指的是操纵模型或试图绕过其安全控制。
//
开源与专有
DeepSeek已发布了R1模型背后的“权重”(数值参数),供公众免费使用、下载和修改,但没有发布其背后的训练数据,导致一些人认为其模型也并非完全“开源”。
这家中国公司发布了一份报告,详细介绍了自己是如何训练模型的。AI专家表示,这有助于开发人员破译DeepSeek是如何实现创新的。
发布模型权重也意味着开发人员可以下载模型来使用。运营开源模型共享平台的Hugging Face表示,其社区创建的R1模型已被下载了320万次。
与DeepSeek不同,OpenAI的o1是专有的,意味着消费者和企业要付费才能使用其模型和服务。虽然一些公司更喜欢使用专有技术,因为经过了创建者的审查,并内置了网络安全控制,但另一些公司更喜欢开源技术,因为更容易定制和控制。
来源:国际投行研究报告