【文化评析】让古籍在智能时代焕发新生

360影视 国产动漫 2025-05-13 03:55 1

摘要:近日,教育部、国家语委、中央网信办发布了《关于加强数字中文建设 推进语言文字信息化发展的意见》。数字中文建设是贯彻落实党中央、国务院关于数字中国和教育强国总体部署的重要举措。语言文字是人类信息交流、思想表达、文明互鉴的基础工具,也是国家重要的资源。加强数字中文

【文化评析】

作者:李 斌(南京师范大学文学院教授)

近日,教育部、国家语委、中央网信办发布了《关于加强数字中文建设 推进语言文字信息化发展的意见》。数字中文建设是贯彻落实党中央、国务院关于数字中国和教育强国总体部署的重要举措。语言文字是人类信息交流、思想表达、文明互鉴的基础工具,也是国家重要的资源。加强数字中文建设,能够为数字中国建设提供雄厚的语言资源基础和强大的文化传播力量。

党的十八大以来,我国在古籍数字化保护与数字文化方面颁布和实施了一系列重要政策,取得了丰硕成果。2017年《关于实施中华优秀传统文化传承发展工程的意见》明确提出要持续推进古籍数字化进程,确立了古籍数字化在新时代古籍工作中的重要地位。《关于推动数字文化产业创新发展的指导意见》提出建设数字文化产业创新生态体系。随着人工智能产业的迅猛发展,2022年国家发布了《关于推进新时代古籍工作的意见》《2021—2035年国家古籍工作规划》《关于推进实施国家文化数字化战略的意见》等文件,进一步完善了古籍保护的顶层设计,明确以数字化和智能化加速推动古籍整理利用转型升级,使古籍传承从“纸质工程”逐步迈向“数字基建”和“数字化产业”的新阶段。

古籍数字化基础设施建设初具规模。我国已经建成了古籍影像库、全文库和知识库3个层面的诸多数据库,形成了产学研的良好生态。国内诸多馆藏机构对珍本、善本古籍展开了大规模图像采集工作,形成了包含数万种古籍的影像库。高校与企业合作,建设了多种高质量图文对照的全文库与数字化检索平台,大大方便了大众阅读古籍。通过古籍书目库,我们将历史上各种历法统一为现代历法的时间本体库、历代地理实体库以及古代数十万重要历史人物的人物库,从而基本完成了书目、时间、地点、人物四大基本要素的系统整理,成为古籍数字化宝贵的基础数据。

AI等先进技术驱动的“数字古文”技术大放异彩。我国在古籍的数字化、智能化方面的技术开发与应用也蓬勃展开。面向影像库建设的图像扫描与修复技术,面向全文库建设的文字识别技术、人机交互校勘技术、繁简转换、古籍自动断句与标点技术,面向知识库建设的古籍分词、命名实体识别、实体链接、机器翻译等技术都有众多代表性成果。我国还有许多古籍尚未经整理和出版,目前智能辅助校勘技术取得突破,通过这些技术手段将大量的古籍文献以众包的方式让专家与古籍爱好者在线校勘,一年时间就可以完成数亿字古籍的图文校对工作,大大提高了古籍整理的效率。同时,智能校勘使得古籍整理从“学术生产”转变为“文化体验”,培育出新一代“数字时代的修书人”。

AI改变着古籍出版与使用形态,让古籍以新的形态走近年轻人,走出国门。传统的古籍出版主要采取影印本、标点本的形式,四大名著、唐诗、宋词等文学经典始终畅销,而《十三经》《二十四史》等大部头文献受众相对较小,《四库全书》等大型类书则以馆藏为主。而数字化检索平台的出现不仅可以解决纸质图书出版周期长、出版费用与定价高的难题,还可以通过全文检索和统计,让用户快速地获取需要的条目,让类书成为新技术条件下的“百科全书”。

大语言模型的蓬勃发展,也给古籍活化利用带来了诸多新机遇。基于古籍的大模型开发,可以让古籍文献的内容不再生涩难读,逐字句地解读古籍,调取古代各种语言文化知识,翻译为现代汉语、英语,根据读者需求随时解答问题,大大降低了阅读门槛,有利于中小学古文教育与中国文化的对外传播。同时,集成了中国古代典籍知识文化与智慧的大模型更符合中国人的思维与使用习惯,也是国产大模型实现差异化发展的特色。利用大语言模型生成小说、剧本和广告,以及文生图、文生视频技术,让古籍融入文学、影视创作与诸多有国风色彩的产品开发中。

在数字中文建设的大潮中,以人工智能赋能古籍,用智能校勘技术加快庞大古籍资料的系统整理,开发高质量古代典籍知识库,推动大模型与机器翻译技术应用,必将让千年文脉在智能时代焕发新生。

《光明日报》(2025年05月13日 03版)

来源:光明网

相关推荐