国内首个!羊城晚报发布岭南文化大模型,探路千年文脉的AI解法

360影视 日韩动漫 2025-03-28 12:45 2

摘要:3月28日,岭南数字创意大厦新基建高质量发展大会在羊城创意产业园举行。活动现场,由羊城晚报报业集团研发的国内首个文化领域多模态推理大模型——岭南文化大模型正式发布。

在全球大模型技术深度落地的浪潮中,羊城晚报以“技术+文化”跨界融合,探路岭南千年文脉的AI解法。

3月28日,岭南数字创意大厦新基建高质量发展大会在羊城创意产业园举行。活动现场,由羊城晚报报业集团研发的国内首个文化领域多模态推理大模型——岭南文化大模型正式发布。

据介绍,岭南文化大模型以国产DeepSeek大模型为技术基座,深度整合《岭南文化辞典》《岭南文脉》等权威典籍及粤港澳三地文化资源,通过先进的知识蒸馏与多模态融合技术,构建智能化、系统化的岭南文化数字资产库,实现岭南文化的永续保存、精准解析与创新转化。

填补了区域特色文化大模型领域空白

作为人工智能领域的技术新高地,大模型正以前所未有的速度赋能千行百业,也为文化的传承发展带来深刻变革。

作为文化大国,我国拥有极为丰富的文化资源,然而“数字化率低、转化效能弱、国际传播难”仍是制约新时代文化创新发展的主要痛点。以广东为例,广东虽拥有丰富的岭南文化资源,拥有粤剧、醒狮、广绣等国家级非遗项目165项,但仍面临“有资源缺载体”的困境,文化数字化转化率较低。

岭南文化大模型能够有效解决这一痛点,推动文化资源向文化资产转化。岭南文化大模型实验室主任邓立邦介绍,岭南文化大模式将推动文化遗产保护从“抢救式修复”向“创造性转化”跃升,通过大模型技术将散落的文化瑰宝转化为可编程、可交互、可流通的数字资产,为文化产业升级、数字经济发展注入新动能。

“我们构建的训练语料库基于高维度异构数据源整合,包括权威的岭南文化辞典、《羊城晚报》文脉专题报道以及大量非结构化的音视频影像资料,覆盖了粤剧、舞狮、剪纸、陶艺、刺绣等多维度地方艺术形态与历史建筑信息的知识图谱。”岭南文化大模型实验室主任邓立邦表示。

岭南文化大模型实验室主任邓立邦。图/羊城晚报记者 周巍 摄

同时,通过创新性的迭代蒸馏技术,将通用大模型6710亿参数压缩至70亿-700亿系列参数,形成国内首个区域性文化大模型集群,实现岭南文化遗产的智能化解析、专业理解准确率提升至95%。

根据测试评估,岭南文化大模型在图片、视频的多模态冷启动评测中领先openAl,在垂直领域(岭南文化)内拥有更为专业及准确的知识理解能力,填补了区域特色文化大模型领域空白。

大模型既看得懂脸谱又听得懂唱腔

岭南文化大模型的出现为世界了解岭南文化架起了AI桥梁。

在实际使用中,当我们向岭南文化大模型提问什么是“趟栊”,它不仅能理解,还能给出准确的文化解释;当我们把一桌岭南家宴图片上传,询问“哪些食物是咸的?”岭南文化大模型不仅能识别图片中的食物,还可以思考食物的具体做法;当我们上传粤剧剧目《紫钗记》的一段视频,它能综合视频的场景布局、人物服饰动作、声音唱腔等,准确识别出粤剧剧目......

岭南数字创意大厦新基建高质量发展大会。图/羊城晚报记者 钟振彬 摄

与通用大模型不同,岭南文化大模型在垂直领域的知识问答与创意内容生成方面有着更为出色表现。如何才能让岭南文化大模型既能看得懂脸谱、听得懂唱腔?又能跨越漫长的时间维度,去理解岭南文化的变迁?

在邓立邦看来,在岭南文化大模型的训练过程中,最大的技术挑战在于结构化与非结构化数据的深度融合算法优化,这直接决定了模型的跨模态理解能力上限。

“在技术上,我们没有简单调用通用模型,而是采用‘独立训练+知识内化’的技术路径,沿用古代师徒传艺的路径,设计了‘三阶段知识蒸馏’,实现了模型‘小而精’的技术突破。”邓立邦介绍,运用多模态能力结合推理链条,通过稀疏门控路由,实现了从“单一”到“全感知”的拓展,让大模型不仅能谈论粤剧,也能“看懂”脸谱,“听懂”唱腔。

“我们期待通过AI与文化的深度融合,让鑊耳屋的砖瓦风情、粤剧水袖的飘逸灵动、早茶氤氲的市井气息……这些鲜活的岭南文化印记,在数字世界中焕发新生。”邓立邦说。

作为根植岭南的文化大报,实际上,岭南文化大模型也是羊城晚报以创新技术驱动岭南文化创新发展的重要举措。

根据规划,羊城晚报将顺应文化数字化发展趋势,以岭南数字创意大厦为物理载体,建设岭南文化大数据中心,开发岭南文化大模型,建立岭南文化传承发展实验室,持续推动岭南文化的数字化保存、智能化解析和产业化应用,为岭南文化“双创”增添新活力。

文 | 记者 黄婷 许张超

来源:羊城派

相关推荐