摘要:4月20日,在2025中国(安阳)国际汉字大会开幕式上,由国家“古文字与中华文明传承发展工程”专家委员会、中国文物信息咨询中心指导,河南省文物局、安阳市政府、安阳师范学院、腾讯SSV联合主办的“AI助力甲骨文研究考释与活化利用邀请赛”(以下简称“大赛”)正式启
在2025中国(安阳)国际汉字大会开幕式上,“AI助力甲骨文研究考释与活化利用邀请赛”启幕。安阳市委宣传部供图
安阳师范学院甲骨文信息处理教育部重点实验室博士张展正在用人工智能技术拼接甲骨碎片。本报记者 杨之甜 摄
□本报记者 李林 杨之甜
在AI技术蓬勃发展的今天,如何利用好AI技术解密甲骨文这一中华文明“源代码”?
4月20日,在2025中国(安阳)国际汉字大会开幕式上,由国家“古文字与中华文明传承发展工程”专家委员会、中国文物信息咨询中心指导,河南省文物局、安阳市政府、安阳师范学院、腾讯SSV联合主办的“AI助力甲骨文研究考释与活化利用邀请赛”(以下简称“大赛”)正式启动。
这是一场什么样的大赛?将对甲骨文研究起到怎样的推动作用?AI在大赛中又将扮演什么角色?带着这些问题,5月8日,记者来到安阳师范学院,采访了甲骨文信息处理教育部重点实验室(以下简称“实验室”)主任刘永革。
让AI成为甲骨文“专家”
作为大赛的发起者和主办方之一,自2019年起,实验室就一直在做甲骨文信息化处理工作。
“2022年,我们和腾讯合作进行了甲骨文的文字识别图像处理研究,开发了143万字的甲骨文单字数据库。在去年世界人工智能大会上,公布了多模态甲骨文数据集。我们还面向大众和学生,开发了‘了不起的甲骨文’微信小程序,普及甲骨文知识。”刘永革介绍。
“当前,甲骨文研究离不开人工智能,AI算法在字形分析、缀合效率、文化创意等方面都有巨大运用潜力。”刘永革说,甲骨文专家和研究者对人工智能的需求也非常强烈,利用好AI技术加速解密甲骨文这一中华文明“源代码”,成为实验室最新的课题之一。
“通过这场大赛,促进人工智能与甲骨文研究的深度融合,让人工智能也成为甲骨文‘专家’,这样它就能更好地服务于真正的甲骨文专家。”刘永革说,他们今年还做了一个甲骨文大模型,目前正在进行内部测试,也希望通过大赛对大模型进行深度训练,使其更精准地服务于甲骨文研究。
打造全球首个“甲骨文+AI”科技试验场
刘永革介绍,本次大赛旨在推动人工智能技术在甲骨文领域的创新应用,构建“学术研究—技术突破—大众传播”的全链条保护传承体系。“可以说我们打造了全球首个‘甲骨文+AI’科技试验场,激发跨学科协作,加速甲骨文研究从学术‘深闺’走向数字时代的大众化、智能化”。
经过精心谋划设计,大赛设立了三个赛道。
AI甲骨文研究邀请赛——聚焦甲骨文考释,通过大模型等AI技术和“殷契文渊”甲骨文AI协同平台的工具和数据,推动文字释读、字形演绎、书体构形、语法句法、刻辞内容等研究。“这个赛道属于学术研究领域。”刘永革解释,他们向全国几十家古文字研究单位发出邀请,期待专家们不仅在破译甲骨文字上有所突破,还要提供相应的甲骨分期断代结论。
AI甲骨文算法挑战赛——聚焦AI助力甲骨文研究中的具体难题,推进甲骨文基础数据整理,完善甲骨资料,提升甲骨文字形研究、理解与破译效率。“我们会给报名者提供公用的数据集,里面有大量甲骨碎片资料,最后看哪位报名者研究的算法成功率更高。”刘永革说。
AI甲骨文焕活创意赛——借力AI工具,邀请创作者以动态字库、虚拟展品及剧情短视频等重塑甲骨文表达,推动古老文字以鲜活形态融入现代数字语境,激发大众对甲骨文的兴趣。刘永革介绍,这个赛道就是面向社会大众,只要热爱创作创新,对甲骨文感兴趣的创作者均可报名参与。
AI焕活汉字源头
刘永革介绍,此次大赛有三大创新点。一是打造面向学者的甲骨文AI助手示范案例,帮助甲骨文研究者开拓思路,以字形匹配等AI算法,助力打磨“殷契文渊”AI协同平台工具。二是开放甲骨文多模态数据集,提示甲骨文文献数据集的整理与进化方向,期待参赛者基于开源大语言模型和数据集,打造与甲骨文相关的智能体,进一步探索汉字源头甲骨文助力大模型的可能性。三是提供示范博物馆的甲骨文数字著录方法案例,加速提升甲骨文研究效率,并在探元平台开放甲骨文素材库,激励普通大众走近甲骨文,用AI工具探索活化利用模式。
“数字化和人工智能技术为甲骨文的破译带来了新的可能性和机遇。实验室也正在尝试用数字技术助力甲骨文考释,包括文法分析、释文翻译、辞例拟补、残字补全、辞例辅助缀合等。”刘永革说。
2019年,“殷契文渊”甲骨文大数据平台向全球开放。截至目前,该平台已收录甲骨著录154种、甲骨图像23.9万余幅、甲骨论著3.5万余种。去年,实验室又推出“殷契文渊”AI协同平台,不仅集成了甲骨文的数据采集、存储与计算能力,更借助AI技术,为甲骨文的破译工作注入了新活力。
“我们将继续探索用人工智能助力甲骨文破译和活化利用,和行业伙伴共创甲骨文AI考释破译的新算法、新工具、新方法,守护中华文脉、焕活汉字源头。”刘永革表示。
来源:大河网