摘要:近几年来,数字技术和人工智能应用的飞速发展,给汉字文明传承带来了全新的机遇与挑战。近日,教育部、国家语委、中央网信办发布了《关于加强数字中文建设 推进语言文字信息化发展的意见》,明确要深入推进信息技术与语言文字深度融合,以加强数字中文建设为重点全面推进语言文字
【文化评析】
近几年来,数字技术和人工智能应用的飞速发展,给汉字文明传承带来了全新的机遇与挑战。近日,教育部、国家语委、中央网信办发布了《关于加强数字中文建设 推进语言文字信息化发展的意见》,明确要深入推进信息技术与语言文字深度融合,以加强数字中文建设为重点全面推进语言文字信息化发展,全方位释放语言文字的数据要素价值、全环节发挥语言文字资源优势、全领域赋能经济社会发展。
党的十八大以来,国家高度重视数字中文建设和语言文字信息化发展,出台了不少政策为汉字数字化保驾护航,不断完善语言文字信息化的发展环境,推动汉字文明在数字时代焕发出新的生机。2021年11月发布的《关于全面加强新时代语言文字工作的意见》对新时代语言文字工作进行了全面部署,为数字中文建设和语言文字信息化发展奠定了政策基础,指明了发展方向。2022年7月发布的《信息技术 中文编码字符集》(GB18030-2022)强制性国家标准为汉字颁发了“数字签证”,满足了社会生活各领域的使用需求,为传承汉字文明、增强中文信息处理能力提供了强有力的标准保障。2025年1月印发的《关于加强数字中文建设 推进语言文字信息化发展的意见》全面谋划数字中文建设,强调系统构建语言文字信息化体系,全面推进语言文字信息化发展。
在这些政策、标准与技术的支持与推动下,数字中文建设成果斐然。如北京师范大学“汉字全息资源应用系统”充分运用数据库、信息挖掘、可视化等现代化手段,从形、音、义、用、码五大维度,较为全面地呈现古今8万多汉字的属性体系,有效满足不同领域汉字应用的多元化需求。辽宁大学“汉字字料库”标注了从古至今的近300万笔字书汉字字料,为汉字研究提供了海量数据支持,也为基于“大汉字模型”的AI应用筑牢汉字数据根基。
以人工智能技术赋能古文字识别为例,此前,研究人员面对甲骨文、金文、战国文字等古文字以及行书、草书等变异字体,常常需要耗费大量时间和精力去辨认。人工智能技术的介入,让沉睡千年的古文字“开口说话”,为这一困境带来了破局的希望。华东师范大学借助基于人工智能技术开发的“商周金文智能镜”,使金文识别率提升到92%以上。吉林大学与中国书法网合作开发的“字鉴·书法识别”程序可以精准识别古文字、历代法帖汉字等非标准字体,为汉字书法艺术的研究和传承提供了便利。
文字博物馆的数字化建设也是一大亮点。例如,河南安阳的中国语言文字数字博物馆通过数字化手段将丰富的汉字文明资源呈现在大众面前,让汉字从博物馆走进了千家万户。此外,以古文字为主题的游戏动画,如《甲骨书信》《甲骨文风云》等也纷纷涌现,将古文字知识融入游戏与动画中,让参与者充分感受汉字文明的魅力。
数字浪潮为汉字文明传承赋予了新的生机,但要想让汉字文明薪火相传,仍然任重而道远。加强汉字数据资源建设是最要紧的工作。这一工作要求广泛收集各类汉字真实数据,涵盖甲骨文、金文、战国文字、隶书、楷书、行书、草书等多种字体,构建大规模且高质量的汉字数据库。通过对采集的字料数据进行科学精准的标注,将其转化为高质量的汉字智能数据集,让基于人工智能技术的“大汉字模型”学习到海量且精准的汉字知识,提升人机交互在理解与输出时的准确度和可靠性。
技术创新与应用一刻也不能松懈。持续探索AI前沿技术在汉字文明传承中的应用,进一步推动生成式人工智能、多模态信息处理等技术创新,让更多更智能的汉字产品赋能汉字文明的创造性转化和创新性发展,利用虚拟现实(VR)、增强现实(AR)等技术,建设线上“汉字文明体验馆”,开发能同时展示汉字形、音、义、用以及不同字体书写模态、相关历史故事的数字化产品,让汉字文明以更有趣的方式传播。
“借风出海”是汉字在数字时代的重要使命。随着经济全球化的发展,汉字的国际影响力越来越大。通过与一些国际伙伴深度合作,共同开展数字中文研究项目,实现汉字数字化资源共享,让汉字文明融入全球数字生态,进一步提升在全球数字空间的话语权。
从第一个甲骨文刻在龟甲上,到今天人工智能“读懂”汉字,汉字一直都在寻找新的契机与世界对话,汉字文明传承因此生生不息、历久弥新。在数字中文建设和语言文字信息化发展的浪潮中,我们要抓住机遇,迎接挑战,通过全社会的不懈努力,让汉字文明在信息时代和数字时代“乘风破浪”,让古老的汉字焕发新生,在世界文明舞台上绽放光彩。
来源:光明日报