剖析DeepSeek创始人梁文锋发言,洞察大模型创业逻辑与走向

360影视 2025-02-10 06:05 3

摘要:摒弃 KPI 和任务,给予员工自由发挥和试错空间,自由创新、放弃短期商业利益通过管理者以身作则而非成文文化确保价值观一致,促进创新选择开源,认为开源对技术人员是一种荣誉,能吸引人才,为了人类的未来开创者、开源者!美国最赚钱的公司,都是厚积薄发的高科技公司。

DeepSeek

摒弃 KPI 和任务,给予员工自由发挥和试错空间,自由创新、放弃短期商业利益通过管理者以身作则而非成文文化确保价值观一致,促进创新选择开源,认为开源对技术人员是一种荣誉,能吸引人才,为了人类的未来开创者、开源者!美国最赚钱的公司,都是厚积薄发的高科技公司。

·核心观点:梁文锋笃定语言大模型是通向 AGI 的必由之路,因此 DeepSeek 聚焦大模型研究,暂时搁置应用开发,坚信未来大模型应用门槛降低,初创公司随时能把握入局机会。(AI垂直应用投资正当时)

·行业分析:从横向看,在大模型领域,不同企业技术路线大相径庭。部分企业急于将大模型嫁接到现有业务,快速实现商业变现,像一些电商企业利用大模型优化商品推荐系统,提升销售业绩(现有的互联网巨头内部考核机制,对颠覆性创新的管理并不擅长);

而 DeepSeek 这类专注基础研究的企业,则将目光投向技术的长远发展,致力于突破技术瓶颈,为未来应用拓展奠定根基。纵向对比,早期大模型研发多集中在学术机构,随着技术成熟,企业参与度不断提高,技术路线从单纯模仿逐渐走向自主创新。

·竞争分析:OpenAI 凭借 GPT 系列一骑绝尘,GPT - 3 的 1750 亿参数和 GPT - 4 的多模态融合,引领行业发展。但众多后来者奋起直追,DeepSeek 推出 DeepSeekV2、DeepSeek - V3 等创新架构模型,在模型性能上崭露头角。国内百度、阿里、腾讯等科技巨头凭借资金、数据和人才优势,推出文心一言、通义千问、混元大模型,与国际企业和初创公司形成多维度竞争格局。

·补充数据及新闻事件:Statista 数据显示,全球大模型市场规模预计从 2022 年约 107 亿美元增长到 2028 年约 1070 亿美元,年复合增长率达 44.5% (主行业及行业引用延伸行业重大投资机会)。2024 年字节跳动云雀模型在 SuperGLUE 基准测试多项指标超越同类模型,彰显强大语言理解和推理能力,加剧市场竞争激烈程度。

·核心观点:做复刻成本低廉,做研究则需投入更多算力、人力,成本高昂,但 DeepSeek 志在参与全球创新,在模型结构、数据构造等多方面深入钻研,并将成果融入发布模型。

·行业分析:横向对比,一些企业选择复刻成熟模型,快速推出产品占领市场,如某些小型 AI 公司基于开源模型快速搭建应用。而追求创新的企业,如谷歌、OpenAI 等,不断投入研发,探索新的模型架构和训练方法。纵向来看,从早期简单的神经网络模型到如今复杂的 Transformer 架构,模型研究不断迭代创新。

·竞争分析:OpenAI 持续创新,GPT - 4 引入思维链技术提升推理能力。谷歌的 BERT 双向 Transformer 架构革新自然语言处理研究范式,T5 模型在多任务学习表现出色。国内清华大学 GLM 模型采用新架构和训练方法取得良好效果。各企业在创新上的角逐,推动大模型技术不断进步。

·补充数据及新闻事件:2023 - 2024 年全球大模型研究论文数量增长近 50%。2024 年华为发布盘古大模型 3.0,在能源领域精准分析数据,优化生产分配方案,为企业节省成本,凸显创新模型在行业应用的价值。

·核心观点:DeepSeek 深知技术生态的重要性,选择开源,认为开源对技术人员是一种荣誉,能吸引人才,形成独特的文化吸引力。(此处掌声,为了人类的未来值得尊敬的开创者)

·行业分析:横向比较,Meta 开源 Llama 系列,激发全球开发者热情,众多基于 Llama 的二次开发应用涌现。而一些企业选择闭源,依靠自身团队进行技术研发和应用拓展。纵向来看,开源生态从最初的软件领域逐渐扩展到如今的大模型领域,开源项目数量和参与人数不断增加。

·竞争分析:Meta 的 Llama 系列开源后,成为众多开发者的选择,拓展了广泛的应用场景。DeepSeek 开源模型吸引开发者参与生态建设,与其他开源项目形成竞争合作关系。百度文心一言逐步开放技术接口,构建自身技术生态,各企业在开源生态建设上竞争激烈。

·补充数据及新闻事件:GitHub 数据显示 2024 年大模型相关开源项目数量增长 30% 以上。2025 年初字节跳动宣布进一步开放云雀模型部分技术,促进开源生态发展,有望提升云雀模型影响力。

·核心观点:DeepSeek 选人重能力而非经验,核心岗位多吸纳应届和毕业一两年人才,因其更具探索精神。招人看重热爱,这类人才会主动寻求发展机会。

·行业分析:横向对比,科技巨头凭借品牌、薪酬等优势吸引大量经验丰富的人才,而初创公司如 DeepSeek 则更倾向于挖掘有潜力、有热情的新人(和马斯克一样的方法)。纵向来看,早期 AI 行业更看重人才的学术背景和经验,如今随着技术快速发展,创新能力和学习能力成为更重要的考量因素。

·竞争分析:谷歌、微软等科技巨头凭借强大品牌和优厚待遇,每年从顶尖高校招揽大量人才。但初创公司以灵活工作环境、挑战性项目和广阔发展空间吸引追求创新的人才。DeepSeek 独特的人才选拔培养机制,为热爱大模型技术的年轻人提供舞台,形成差异化竞争。

·补充数据及新闻事件:领英数据表明 2024 年大模型相关岗位人才需求增长 80% 以上。2024 年一些初创大模型公司推出股权激励、弹性工作等政策吸引人才,某初创公司实施股权激励吸引优秀人才,推动公司快速发展。

·核心观点:DeepSeek 摒弃 KPI 和任务,给予员工自由发挥和试错空间,通过管理者以身作则而非成文文化确保价值观一致,促进创新。

·行业分析:横向比较,科技巨头如谷歌以明确的企业文化规范员工行为,而初创公司多营造自由创新氛围。纵向来看,早期企业管理强调制度和规范,如今创新型企业更注重激发员工的自主性和创造力。

·竞争分析:谷歌以 “不作恶” 等企业文化凝聚员工,规范发展方向。而像 DeepSeek 这类初创公司,以自由信任为核心的文化,吸引追求创新自由的人才,形成独特人才优势。

·补充数据及新闻事件:针对大模型创业公司调查显示,创新氛围好的公司员工创新成果比其他公司高 30% 以上。2024 年多家大模型创业公司因独特企业文化吸引人才,推动公司发展,某公司打造开放文化,吸引多领域人才,实现技术和产品创新突破。

·核心观点:DeepSeek 以实现 AGI 为目标,当下专注技术创新,长远期望构建生态,由其他公司基于其技术构建应用,自身不涉足应用开发(投资衍生行业应用风险性降低!)。

·行业分析:横向对比,部分公司(互联网平台无一不是)追求短期商业变现,将大模型用于智能客服、内容生成等业务;而 DeepSeek 这类企业专注长期技术和生态建设。纵向来看,早期大模型商业应用主要集中在少数领域,随着技术发展,应用场景不断拓展,盈利模式也更加多元化。

·竞争分析:科技巨头凭借多元业务和庞大用户基础,通过多种方式实现大模型商业变现,如谷歌将大模型用于搜索、广告推荐等。初创公司需依据自身优势探索盈利模式,DeepSeek 可通过授权模型技术、定制训练服务等获取收入。

·补充数据及新闻事件:市场研究机构预测 2026 年全球大模型商业应用市场规模达 500 亿美元以上。2024 年一些大模型初创公司与传统企业合作,将大模型用于制造业、金融业等领域,实现商业收入增长。

·核心观点:大模型创业公司可能仅 2 - 3 家存活,自我定位清晰、精细化运营的公司更有机会,有价值的公司会以其他形式存续。

·行业分析:横向看,当前大模型市场竞争激烈,创业公司众多,市场分散。企业需明确定位、合理战略和精细化运营才能生存。纵向对比,早期市场参与者较少,竞争相对缓和,随着大量企业涌入,竞争愈发激烈,行业整合趋势逐渐显现。

·竞争分析:科技巨头在技术、资金、品牌上优势显著,初创公司可通过差异化竞争,专注细分领域,如专注医疗领域大模型应用的公司,为行业客户提供定制方案获市场认可。DeepSeek 专注基础模型研发构建技术壁垒。

·补充数据及新闻事件:2024 年全球大模型创业公司超 500 家,仅不到 10% 获新一轮融资。2024 年底一家医疗大模型创业公司被大型医疗企业收购,标志行业整合开始。

·核心观点:梁文锋认为互联网商业逻辑不适用于未来 AI 盈利模式,不能用旧套路思考新事物。(这个思路很重要)

·行业分析:横向对比,传统互联网企业商业模式多基于流量和广告,而大模型技术商业应用与之不同,需探索新路径。纵向来看,从早期技术与商业相对分离,到如今技术与商业深度融合,融合模式不断创新。

·竞争分析:微软与 OpenAI 合作将 GPT 技术集成到办公软件、搜索引擎,实现技术商业融合。初创公司与行业客户合作开发针对性应用场景,推动技术落地。

·补充数据及新闻事件:麦肯锡报告显示 2024 年全球大模型技术与商业应用融合项目数量增长 60% 以上。2025 年初一家大模型创业公司与电商合作开发智能推荐系统,助力电商提升销售额。

原话节选:

我们希望更多人,哪怕一个小App都可以低成本去用上大模型,而不是技术只掌握在一部分人和公司手中,形成垄断。大厂的模型,可能会和他们的平台或生态捆绑,而我们是完全自由的。一件激动人心的事,不能单纯用钱衡量。就像家里买钢琴,一来买得起,二来是因为有一群急于在上面弹奏乐曲的人。人工成本是对未来的投资,是公司最大的资产。我们选的人相对朴实一点,有好奇心,来我们这里有机会去做研究。大厂很难单纯去做研究,做训练,它更多会是业务需求驱动。如果不能很快应用,我们招人的条件是热爱,这些人的热情通常会表现出来,因为他真的很想做这件事,所以这些人往往同时也在找你。按照教科书的方法论来推导创业公司,在当下,他们做的事,都是活不下来的。但市场是变化的,真正的决定力量往往不是一些现成的规则和条件,而是一种适应和调整变化的能力。过去三十年,我们都只强调赚钱,对创新是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲美国最赚钱的公司,都是厚积薄发的高科技公司。.大厂有现成的用户,但它的现金流业务也是它的包袱,也会让它成为随时被颠覆的对象。我们发布的V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但我们能自己打造这样的人。DeepSeek也全是自下而上的。而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要push他。

来源:运营学社

相关推荐