摘要:4月23日是世界读书日,如何让古籍“活”下去、“活”起来?一场由人工智能驱动的古籍数字化变革正给出答案。
新华社沈阳4月23日电(记者刘艺淳、房宁、黄泽晨)4月23日是世界读书日,如何让古籍“活”下去、“活”起来?一场由人工智能驱动的古籍数字化变革正给出答案。
2022年4月,中共中央办公厅、国务院办公厅印发《关于推进新时代古籍工作的意见》,提出“推进古籍数字化”,强调“利用智能化的研究和实践,加速推动古籍整理利用转型升级”。
6个月后,字节跳动和北京大学数字人文研究中心联合打造了“识典古籍”平台,将古籍从纸页“搬”到了网页。自2022年10月上线以来,“识典古籍”平台已陆续汇集《四库全书》《四部丛刊》等上万部古籍,使用人次上亿。近日,“识典古籍”APP上线,古籍更加触手可及。
古籍数字化,不是“识典古籍”平台的全部。团队有着更大的设想——吸引各行各业的古籍爱好者、研究者,以“众包”校对、协同审核等形式,在一个平台实现古籍智能整理的全部环节。
登录“识典古籍”平台,左侧是破碎泛黄的书页影像,右侧滚动着经AI识别的文字。从图像到可被检索的文字,古籍被研究、阅读和传播的空间变大了。“这背后是文字识别、自动标点、实体识别三大核心技术。”北京字节跳动企业社会责任部古籍项目产品负责人王宇说,AI让机器“读”懂了古文,目前平台文字识别准确率超96%,自动标点准确率达94%,命名实体识别接近98%。
“黑色代表算法识别的可信度比较高的字,一般不需要人工再去核对,蓝色则提示疑难字,得对照字形再确认。”华东师范大学中国古典文献学专业博士生刘帅已将古籍整理作为日常工作,自2024年9月开始,他已参与整理191部古籍。
王宇介绍,这是团队发起的“我是校书官”——古籍大众智能整理计划,即邀请高校师生,在智能手段的辅助下,将传统古籍加工成易于理解的文本。目前,像刘帅一样的“校书官”,在千余所高校里有万余名。这场“文化接力”让近2亿字、1600余种古籍焕发新生。
“一些非专业的同学对古籍一无所知,校对三个月后,能看出大家‘入门’了,也养成了阅读古籍的习惯,对古籍中的传统文化产生了兴趣。”刘帅说,点开校对古籍的群聊,仿佛置身于一场场学术研讨会中,大家围绕古籍内容展开讨论,相互协作攻克“认字”难关。
古籍“活”起来,不只是对故纸堆的修复,更要为未来编写文明说明书。
从20世纪80年代用“286”老式计算机辅助古籍整理,到如今AI技术让《四库全书》的天文图谱跃然屏上。全国高等院校古籍整理研究工作委员会副秘书长吴国武是见证者之一。他说,技术迭代让“养在深闺”的古籍变得触手可及,为建筑、艺术、医学等多个领域带来灵感。
“古籍相当于先人的知识体系,将经典智慧为现代人所用,是非常重要的任务。”吴国武认为,古籍事业的整体发展,需要数字化、智能化两部分来牵引。
AI助力古籍“活”起来,还有更多想象空间。在中国出版协会全民阅读工作委员会主任聂震宁看来,利用人工智能开发古籍,用古籍蕴含的浩瀚素材创作生成内容,或许是古籍的“未来式”。
来源:文化艺术馆