冷战2.0将至,中国开源模型大爆炸临近 LeCun:DeepSeek只是 副产品
如今,美国AI社区许多人已公认:接下来几个月,中国将会出现一波开源AI模型的浪潮!很多业内人士和大V干脆陷入了「冷战2.0」恐慌,呼吁要开放无限的能源、无限的算力和更简单的立法。LeCun则表示,DeepSeek击败美国,其实不过是中国内部竞争的副产品而已。
如今,美国AI社区许多人已公认:接下来几个月,中国将会出现一波开源AI模型的浪潮!很多业内人士和大V干脆陷入了「冷战2.0」恐慌,呼吁要开放无限的能源、无限的算力和更简单的立法。LeCun则表示,DeepSeek击败美国,其实不过是中国内部竞争的副产品而已。
Meta 首席人工智能科学家 Yann LeCun 最近在一次活动中分享了一个有趣的轶事。他的故事表明,Meta 实际上在 ChatGPT 出现之前就开发并短暂发布了一个类似 ChatGPT 的系统,名为 Galactica,用于与科学文献进行交互。他的叙述强
但团队认为可以换用一种非常简单的技术,他们提出DyT(Dynamic Tanh),直接替代Layer Norm或RMSNorm,性能达到或超过标准Transformer。
transformer lecun 何恺 lecun改造 改 2025-03-14 15:31 5
特朗普和马斯克,已成全美学术界的公敌。NIH宣布削减科研经费以来,全美掀起反对潮,陶哲轩已发起抗议联名信,LeCun预言大批科学家将离职,建议欧洲抄底诺奖人才。宾大被迫撤销发出的研究生offer,10份通知书一夜作废。初入学界的「青椒」更是异常焦虑!
好家伙,最新发布的 R1 在 AIME2024 数学基准测试中 79.8% 直接踢走OpenAI 的 o1 ,在标准化编码测试中,DeepSeek-R1 也展现出“专家级”水平,在 Codeforces 平台上取得了 2029 Elo 评级,超越了 96.3%
Q:你获得了2024年Vin未来奖,在获奖感言中你提到,AI的学习方式不像人类或动物,它们没有从物理世界中获取大量的视觉观察,但你一直在努力实现这一点。
If intelligence is a cake, the bulk of the cake is unsupervised learning, the icing on the cake is supervised learning, and the ch
编辑:LRS【新智元导读】只需几十个样本即可训练专家模型,强化微调RLF能掀起强化学习热潮吗?具体技术实现尚不清楚,AI2此前开源的RLVR或许在技术思路上存在相似之处。
只需几十个样本即可训练专家模型,强化微调RLF能掀起强化学习热潮吗?具体技术实现尚不清楚,AI2此前开源的RLVR或许在技术思路上存在相似之处。
继 World Labs(李飞飞)、谷歌 DeepMind 接连发布自己的世界模型研究之后,Meta FAIR 的 Yann LeCun 团队也加入了战场,也在同一周之内发布了导航世界模型(Navigation World Models/NWM)。
近期,AI界泰斗级人物Yann LeCun一改往日观点,接受People by WTF采访时表态:人工智能可能在5到10年内达到人类的水平。
就在刚刚,LeCun一反常态地表示:AGI离我们只有5到10年了!这个说法,跟之前的「永远差着10到20年」大相径庭。当然,他还是把LLM打为死路,坚信自己的JEPA路线。至此,各位大佬们的口径是对齐了,有眼力见儿的投资人该继续投钱了。