大模型下半场战争硝烟四起,AI进化论第二季开启 | 第一季DeepSeek十日谈精彩回顾

360影视 2025-02-24 21:35 3

摘要:在全球 AI 竞争白热化的今天,DeepSeek 以“国运级创新”横空出世,不仅刷新了国产大模型的技术高度,更点燃一场关于 AI 技术革命的热烈讨论。正是在这样的背景下,CSDN 策划推出了“DeepSeek 暨 AI 进化论十日谈”系列直播,旨在深入剖析 D

在全球 AI 竞争白热化的今天,DeepSeek 以“国运级创新”横空出世,不仅刷新了国产大模型的技术高度,更点燃一场关于 AI 技术革命的热烈讨论。正是在这样的背景下,CSDN 策划推出了“DeepSeek 暨 AI 进化论十日谈”系列直播,旨在深入剖析 DeepSeek 所代表的技术创新如何重塑 AI 行业的未来。

这十场直播汇聚了顶级院校的 AI 学者、AI 专家、AI 领域的顶尖人士。他们以专业的视角和丰富的经验,分享了对 AI 技术和市场的深刻见解。期间,他们直击 AI 和大模型的核心技术问题,探讨了 Scaling Law 是否已经过时?如何构建可持续的开源生态?大模型的护城河究竟在哪里?强化学习是否会带来大模型的范式转换?DeepSeek 有意识了吗?哪些行业将会被颠覆……每一期都干货满满,引发企业高管、学者、技术专家等行业人士的强烈共鸣。

Deepseek 暨 AI 进化论十日谈主题一览:

DeepSeek 技术创新及对 AI 生态的影响

强化学习是否会带来大模型的范式转换

直击 Deepseek 技术真相,对我们究竟意味着什么?

十问解读 Deepseek 的“国运级创新”

聊聊关于 Deepseek 的误区与思考

Deepseek 及大模型创业生态

Deepseek 与软件开发智能化

Deepseek 对 AI 技术及开发者的刷新

从 Deepseek 出发聊聊意识本质和人类未来

Deepseek 开启的大模型下半场战争

在“DeepSeek 暨 AI 进化论十日谈”的第一场直播中,来自 CSDN 高级副总裁李建忠深入探讨了 DeepSeek 的三大核心技术创新,以及它对大模型生态的深远影响。作为国产大模型的典范,DeepSeek 不仅在技术上实现了突破,更通过其独特的架构设计、算法优化、工程创新推动了整个 AI 行业的快速发展。

DeepSeek 的创新不仅改变了技术层面,还对大模型生态产生了深远影响。首先,它将大模型的成本压缩至与搜索引擎相当,降低了 AI 应用的门槛。随着 AI 应用和智能体的快速发展,多个行业,尤其是医疗、金融、零售等,将迎来智能化升级的巨大机会。

更重要的是,DeepSeek 重塑了“AI 铁三角”——算法、算力、数据的关系,推动了 AI 产业版图的重构。最后,DeepSeek 的开源策略为 AI 创新提供了长期发展的平台,推动了全球技术共享与进步。

这一讲邀请到了 CSDN 高级副总裁李建忠、复旦大学教授张奇、中国人民大学高瓴人工智能学院副教授刘勇。嘉宾们首先介绍了强化学习(RL)如何在 AI 中发挥作用,特别是在大模型的训练中。李建忠通过 AlphaGo 到 AlphaZero 的经典案例,阐述了大模型如何通过推理能力的提升,从“快思考”到“慢思考”逐步推进。而刘勇和张奇则分别讲解了强化学习的核心框架和在大模型中的应用历史,深化了观众对 RL 的理解。

在讨论强化学习对大模型范式转变的影响时,嘉宾们深入剖析了大模型学习范式:模仿学习与探索学习的区别,以及如何通过强化学习实现更为高效的训练流程。特别是在 DeepSeek R1 的应用中,强化学习的引入不仅显著提升了推理能力,还可能减少对人工标注的依赖。通过 RLHF 与纯 RL 的对比,嘉宾们探讨了纯 RL 如何改变传统的监督微调方式,以及它是否意味着“人类标注师失业论”的到来。此外,嘉宾们也讨论了强化学习在加速科研工程、推动 AGI 发展的潜力,以及 DeepSeek 在这一进程中的技术贡献。

本期直播在 CSDN &《新程序员》执行总编唐小引的主持下,邀请到三位重量级嘉宾来为我们揭示 DeepSeek 的技术真相:硅谷资深 AI 技术专家吴双,北京邮电大学人机交互与认知工程实验室主任刘伟,以及《知识增强大模型》作者、前达观数据副总裁王文广

在本次直播中,三位专家围绕 DeepSeek 的技术实力展开了多维度的深入探讨。他们首先分享了对 DeepSeek 及其 R1 模型的初步印象与独特体验,进而聚焦于 DeepSeek 技术创新的核心本质,剖析其强大之处究竟源于算法突破还是工程优化,并深入辨析了围绕 DeepSeek 的诸多热点议题,例如“蒸馏”争议、低成本高效训练的实现路径、以及开源与闭源模式的优劣势。讨论还延伸至 DeepSeek R1 对下一代模型研究方向的潜在影响,并试图从技术、产业、生态等多个层面,解码 DeepSeek 现象背后所蕴含的更深层次的行业启示与未来趋势。

详细内容,欢迎阅读「直击 DeepSeek 技术真相,对我们究竟意味着什么?| 万有引力」一文。

本期 CSDN 高级副总裁李建忠对话北京大数医达创始人 & CEO、复星集团首席 AI 科学家邓侃,两位 AI “老炮儿”火力全开“硬核”对话,围绕十大犀利议题,分享最前沿的认知干货。

第一问:DeepSeek 之后,还要不要相信 Scaling Law,要不要囤卡“大力出奇迹”?

第二问:强化学习驱动的推理计算范式转移之后,数据还是否重要?

第三问:DeepSeek 的赶超到底是雕虫小技?还是国运级创新?

第四问:大模型如何构建开源生态?DeepSeek 会成为 Linux 还是 Android or other?

第五问:如果 DeepSeek 是 Android,谁是中国 iOS?闭源模型是否还有机会?

第六问:大模型到底有没有护城河?如果你是梁文锋,如何建立 DeepSeek 的护城河?

第七问:DeepSeek 首先会颠覆谁?谁最危险?谁最安全?

第八问:AGI 时代,互联网的哪些逻辑会变?哪些逻辑不会变?

第九问:DeepSeek 利好哪些职业,哪些职业会更危险?

第十问:推理计算范式下,代码能力越来越强,程序员是否会大规模失业?

有关这十问的详细内容,欢迎大家前往「十道灵魂之问,十日谈解读 DeepSeek 的“国运级创新”!」阅读,本文进行了详细整理与描述。

CSDN 高级副总裁李建忠在第五谈中拨云见日,旨在厘清公众对 DeepSeek 的认知误区。他首先纠正了将 AI 发展视为线性“科技树”的片面观点,强调 AI 更像复杂系统,多维度协同创新才是关键,而非局限于单一技术分支或学派之争。针对 “赢家通吃,模型即产品” 的误解,李建忠强调大模型应定位为 AI 生态的基础设施,而非最终产品,开源共享方能促进行业繁荣。

对于“Chatbox 是唯一产品形态”的误读,他指出 Chatbox 仅是浅层应用,大模型潜力在于赋能各行业,催生多元产品形态。关于 “DeepSeek 会推翻一切” 的论断,李建忠认为技术发展是进化式迭代,DeepSeek 乃加速进化而非颠覆,其价值在于开辟新路径、树立新标杆。在此部分,李建忠也进一步阐释了 DeepSeek 的出现对“Scaling Law”的传统认知带来的挑战与反思。而将“大模型等同于操作系统”则是概念的混淆和作用的夸大,大模型是应用层技术,需与操作系统协同而非取代。

最后,针对“DeepSeek 缺乏创新”的论断,李建忠有力反驳,力证 DeepSeek 在模型效率、成本控制及强化学习探索上的显著创新。在厘清误区后,李建忠引导思考 DeepSeek 是否引领 AGI 之路,肯定其为通往 AGI 的“先行者”与“探路人”,未来可期。

经过几期对 DeepSeek 技术和生态的剖析,我们本期将目光转向创业者,邀请到 CSDN 高级副总裁李建忠,维智科技创始人、PPTV前兼CEO陶闯围绕大模型创业十问展开讨论。

这十问分别是:

1. DeepSeek 浪潮是技术奇点还是范式转变?

2. 基础模型之后,垂直模型是否还有生存空间?

3. AI 应用 Killer App 将在哪些赛道爆发?

4. AI 应用与模型之间,中间件将呈现何种形态?

5. 数据资产价值何在?数据、数据资产与 AI 的关系是什么?

6. 时空人工智能、时空智能

来源:CSDN

相关推荐