摘要:2025,5,12 由 Meta AI与法兰西阿道夫·罗斯柴尔德基金会医院、巴黎高等师范学院感知系统实验室以及巴黎西岱大学综合神经科学与认知中心合作的一个研究 。他们研究了46名年龄范围从2岁至46岁正在接受顽固性癫痫的病人。 发现了一些与语言相关的神经活动发
本文来源:AI知我意
2025,5,12 由 Meta AI与法兰西阿道夫·罗斯柴尔德基金会医院、巴黎高等师范学院感知系统实验室以及巴黎西岱大学综合神经科学与认知中心合作的一个研究 。他们研究了46名年龄范围从2岁至46岁正在接受顽固性癫痫的病人。 发现了一些与语言相关的神经活动发展的规律,及 LLM 的语言表示与人脑的相似之处。
他们通过让被试者听法语有声读物《小王子》,同时通过其大脑内植入的超过7400个SEEG电极记录神经活动(就是记录听到对应单词时单词/音素时,大脑哪部分神经元活动了) ;随后,利用源自语言学理论或大型语言模型的表征来训练神经编码和解码模型,以绘制大脑中语言层级的定位、动态和发展过程 。
SEEG电极记录神经活动的发现
他们发现:
人脑的语言处理机制有一个成长过程,可能早在母体内,或者胎儿阶段就已经成长出了基础音素的响应能力(这种能力也能用来解释婴儿为什么会先学会mama, baba, 这类的叠词),但是,大脑对于高级的词汇需要时间塑造。 这与语言习得的层级理论相互印证。人脑对输入语言反应最早出现在 STG等核心语言区域, 随着年龄的增长,会扩散到其他脑区(顶下小叶(IPL)、外侧/额下皮层(L/IFC)和前颞叶(ATL)这些高级皮层区域)。大脑对简单的音素处理很快(150毫秒),再慢一些的是一些高频词汇,更慢的是高级的词汇(350毫秒),响应时间的差异可能意味着人脑神经元的建立了更长距离的连接。建立神经元活动与 LLM 的联系
为了让 LLM 与人脑的语言表征产生关联。 他们的方法是:采集人听到单词时脑中电极的激活情况(脑区的激活对应区域的电极被激活),看其能否与 LLM 某一层(主要观察两个地方:前向推理的前面层与后面层)的激活值,产生线性映射, 若能产生线性映射,则说明它们是同一种表示。这个线性映射建立后, 表现出来的效果就是:输入到 LLM 的文字, 可以预测人脑的神经元激活情况(通过一个编码器 encoder 实现)。 或者反过来, 听到对应的声音后, 采集到的电极活动,能预测 LLM 的对应文字在 LLM 模型某一层的激活情况(通过解码器 decoder 实现)。
神经元活动与 LLM 研究发现
他们发现:
训练过的语言模型 (Llama 3.1 8B)其表征确实能更好地预测年龄较大个体(尤其是12岁以上青少年和成人)的脑部激活情况,优于未经训练的随机初始化模型。(见下图, B,F 黑色的是随机初始化的 llama,蓝色为浅层神经元的预测,红色为浅层(0.1 模型深度)+深层(0.8 模型深度)的预测, Y轴为预测效果)LLM 的预测对成人的预测效果大于对幼儿的,说明一个训练过的 LLM 的语言表征(LLM 的大脑) 更接近于成人, 这意味着LLM的“学习”语言的过程可能与人类类似。局限性及未来计划
研究样本较少,观察的语言现象较简单,是他们的局限性。 这项研究的一个目的是研究人脑与 LLM 学习语言的机制的不同,来理解为什么 LLM 的学习效率低下的原因。 他们说:人类儿童只需接触几百万单词就能掌握语言,而LLMs 的训练数据量则达到万亿级别。
他们还发现,现在 LLM 的高智能可能受益于“一个不切实际的巨大且精确的工作记忆“ (上下文),相比较人脑的工作记忆小得多。 另外,LLM 在生成具有复杂关系的长句任务上,也经常力不从心。 这些都说明 LLM 有着独特的工作机制,并不是一味地模拟人脑。 他们未来计划进行更深入的研究以解释这些现象,理解更复杂的语言现象与 LLM 的关系或者深入研究 LLM 架构中语言表示与人脑趋同的具体机制, 探明造成这些差异的原因。
更复杂的语言现象与 LLM 的关系或则深入研究 LLM 架构中语言表示与人脑趋同的具体机制, 来探明造成这些差异的原因。
相关连接:
论文地址: https://ai.meta.com/research/publications/emergence-of-language-in-the-developing-brain/
项目博客: https://ai.meta.com/blog/meta-fair-science-new-open-source-releases/
来源:人工智能学家