刘劼教授团队:基于精准知识筛选及知识协同生成的农业大语言模型(《智慧农业(中英文)》2025年第1期)

360影视 国产动漫 2025-04-10 00:43 2

摘要:姜京池, 闫莲, 刘劼. 基于精准知识筛选及知识协同生成的农业大语言模型[J]. 智慧农业(中英文), 2025, 7(1): 20-32.

引用格式

姜京池, 闫莲, 刘劼. 基于精准知识筛选及知识协同生成的农业大语言模型[J]. 智慧农业(中英文), 2025, 7(1): 20-32.

DOI:10.12133/j.smartag.SA202410025

JIANG Jingchi, YAN Lian, LIU Jie. Agricultural Large Language Model Based on Precise Knowledge Retrieval and Knowledge Collaborative Generation[J]. Smart Agriculture, 2025, 7(1): 20-32.

官网全文免费阅读

知网阅读

基于精准知识筛选及知识协同生成的农业大语言模型

姜京池1,2, 闫莲1, 刘劼1,2*

(1.哈尔滨工业大学 计算学部,黑龙江哈尔滨 150001,中国;2.智慧农场技术与系统全国重点实验室,黑龙江哈尔滨 150001,中国)

摘要:

[目的/意义]大语言模型(Large Language Models, LLMs)依托其强大的认知理解和内容生成能力,发展迅速,有望成为智慧农业领域一种全新的研究范式。然而,由于通用LLMs缺乏农业领域知识,对于专业性问题通常会产生事实性错误或信息不完备的回复。为提升大模型在农业领域的适应性,本研究提出了一种知识图谱引导的农业LLMs——KGLLM。

[方法]该模型基于信息熵实现知识过滤,并在解码阶段显式利用知识图谱的语义信息约束其内容生成。具体而言,将输入问题中的关键实体链接到农业知识图谱,形成知识推理路径和问答依据。为保证此外源知识的有效性,进一步评估引入每条知识前后模型输出内容的熵差,对无法提升答案确定性的知识进行过滤。经筛选的知识路径将被用于调整词表概率,以增加与知识高度相关词的输出,实现知识图谱对LLMs的显式引导。

[结果和讨论]本研究在5种主流的通用LLMs上实现了农业知识图谱引导技术,包括Baichuan、ChatGLM、Qwen等开源大模型,同时与最优的知识图谱检索增强生成技术进行了对比。实验结果表明,本研究提出的方法在内容流畅性、准确性、真实性和领域忠诚度方面都有显著提升,相较于GPT-4o,在Mean BLEU、ROUGE、BertScore上分别平均提升了2.592 3、2.815 1和9.84%。通过消融实验亦证明了知识引导的农业LLMs不仅实现了冗余知识过滤,而且在解码过程中可有效调整词表输出分布,有助于提升通用LLMs在农业领域的适应性及问答的可解释性。

[结论]本研究为后续农业LLMs的构建提供了可借鉴思路,表明知识图谱引导的方法在提升模型的领域适应性和回答质量具有潜在的应用价值。

关键词: 知识图谱;农业大语言模型;信息熵;语义相似度;知识引导

文章图片

图1 检索增强生成及基于知识图谱的生成约束方法

Fig. 1 Retrieval augmented generation and knowledge graph-based generation constraint methods

图2 性能顶级的大语言模型GPT4、搜索引擎TianGong、农业专家,以及本研究提出的KGLLM模型对相关作物病虫害问题的回复

Fig. 2 Responses to crop-specific pest and disease query from top-tier LLMs GPT4, search engine TianGong, agricultural experts, and the model KGLLM

图3 知识图谱引导的农业大语言模型KGLLM

Fig. 3 Knowledge graph-guided agricultural large language model

图4 问题中实体抽取的Prompt

Fig. 4 Entity extraction Prompt in a question

图5 引入不同知识后模型回复及token预测概率对比

Fig. 5 Comparison of model responses and token prediction probabilities after introducing different knowledge

图6 Kwoo农业知识图谱及对应的问答样例

Fig. 6 Kwoo agricultural knowledge graph and corresponding question-answer exsamples

图7 根据问题检索的知识路径样例

Fig. 7 Example of knowledge path retrieved based on the question

图8 农学专家对模型生成结果的人工评估(分数取值为1—10)

Fig. 8 Expert evaluation on model's responses(Scores range from 1 to 10)

作者简介

刘劼 教授

刘劼,哈尔滨工业大学讲席教授,人工智能研究院院长,计算机和控制双学科博士生导师,国家高层次人才,智慧农场技术与系统全国重点实验室主任,物联网智能技术工信部重点实验室主任,农业农村东北规模化智慧农业重点实验室主任,ACM SIGBED CHINA创始主席,IEEE Fellow,ACM杰出科学家。智能物联网和混合信息物理系统领域的世界级学术带头人,AI传感融合、数据中心优化和高能效计算专家。

姜京池 副教授

姜京池,哈尔滨工业大学计算学部副教授。中国计算机学会(CCF)数字农业专委会委员,中国仿真学会农业建模仿真专委会委员,ACM SIGBED CHINA青工委委员,天工开悟农业大模型研发团队负责人。研究方向:智能决策、大模型、知识工程。

闫莲 博士研究生

闫莲,哈尔滨工业大学计算学部语言技术研究中心博士研究生。天工开悟农业大语言模型研发团队核心参与人员,研究方向:智慧农业、智慧医疗、大语言模型。

转载请联系编辑部授权

本期支持单位

潍柴雷沃智慧农业科技股份有限公司

华东交通大学智能机电装备创新研究院

为方便农业科学领域读者、作者和审稿专家学术交流,促进智慧农业发展,为更好地服务广大读者、作者和审稿人,编辑部建立了微信交流服务群,有关专业领域内的问题讨论、投稿相关的问题均可在群里咨询。入群方法:加小编微信17346525780,备注:姓名、单位、研究方向,小编拉您进群,机构营销广告人员勿扰。

发布征集

欢迎在我公众号发布科研团队介绍、创新科研成果及相关活动等信息。

来源:智慧农业资讯一点号

相关推荐