为什么生活在不同地域的人群呈现出迥异的心理特征?不同时代的社会是否具有不同的道德倾向?在有文字记录的数千年间,人类社会发展出了形态各异的文化。从沿着欧洲海岸线绵延的教堂穹顶与尖塔,到遍布东亚的孔庙、宗祠与佛寺的飞檐翘角,在纷繁复杂的物质景观背后,多元的文化心理也在潜移默化中不断塑造着社会与文明的秩序。20世纪60至80年代,心理学家霍夫斯泰德通过长达多年的大规模问卷调查,观察到不同国家文化在“集体主义-个人主义”等取向上的差异。而针对不同文化取向形成的历史根源,过往学者提出了诸多理论:从病原体流行假说,到水稻-小麦理论与灌溉农业说,再到亲属关系假说——究竟是疾病传播的风险,不同生态环境下的农业形式,还是亲属制度与社会结构,根本性地导致了不同文明的文化心理差异?长期以来,社会心理学家、文化人类学家,乃至行为经济学家,以不同地域与人群为研究对象,致力于对上述理论进行实证检验。但这类研究大多依赖现代社会的调查数据,很少踏入历史的纵深之中,将分析扩展到更为宏观的长时段尺度——这既受限于不同学科间的隐形壁垒,也受限于材料与方法本身——我们要如何调查早已逝去的古人的心灵?如今,人工智能方法的兴起,为相关领域的研究带来了前所未有的转向契机。我和合作者们,在一项跨学科的研究中,尝试结合历史学、心理学与人工智能等不同领域的理论与方法,为上述问题的解答寻找新的可能性。在我们的研究中,心理学与人类学,为多元文化差异形成的原因提供了理论解释的基础;以自然语言处理为代表的人工智能技术,为定量的文本分析提供了切实可行的手段;而长久记录且未曾中断的中国历史材料,则为实证分析提供了得天独厚的试验场,使我们得以跨越时空,追溯中国文化心理在两千年长时段内的演进。一、调查已逝去的心灵:人工智能与量化历史的新方法在现代心理学研究中,针对人类受试者的问卷调查与实验是主要的实证方法。而对历史心理学研究而言,作为古代心灵的遗迹,古籍、方志、档案等历史时期的文本,是最主要的研究对象,相对应的历史文本分析,是最主要的研究方法。传统的定性分析(“近读”),不仅耗费时间与人力,且存在主观性强、标准难以统一等局限;而自然语言处理等人工智能技术的进步,使得大规模从历史文本中测量心理指标(“远读”)终于成为可能。如图1所示,我们开发了一种利用基于Transformer的嵌入模型在历史文本中进行心理测量的新方法,以“Surveying the Dead Minds”(调查已逝去的心灵)为题,该方法已发表于自然语言处理领域的顶会——自然语言处理的实证方法(Empirical Methods in Natural Language Processing,EMNLP)。在该方法中,我们通过微调后的模型,将需要分析的历史文本与特定主题的心理学量表,映射到同一个语义向量空间当中,并最终计算出该文本在该主题上的载荷分数——这一过程也被称之为“情景化构念表征”(Contextualized Construct Representation,CCR)——简单来说,利用该方法,我们可以为每一段历史文本,针对特定的心理构念主题(如“集体主义”、“个人主义”、“权威”、“忠诚”、“关怀”等等),测量得到一个相对客观的分数——让模型代替古人(历史文本的作者)回答问卷。模型测量得到的分数,尽管有其理论依据,但难以避免受到训练语料及方法中存在的系统偏差。为了对模型的可靠性进行验证,我们进行了实验性的案例研究,在研究中发现,通过对《全宋文》所收录不同官员著作测量得到的“权威”与“传统主义”等心理指标,可以有效预测其在变法中实际持有的态度(支持、反对或中立)。摘要:为什么生活在不同地域的人群呈现出迥异的心理特征?不同时代的社会是否具有不同的道德倾向?在有文字记录的数千年间,人类社会发展出了形态各异的文化。从沿着欧洲海岸线绵延的教堂穹顶与尖塔,到遍布东亚的孔庙、宗祠与佛寺的飞檐翘角,在纷繁复杂的物质景观背后,多元的文化心理
来源:小保讲讲历史