摘要:引用格式:庄家煜, 许世卫, 李杨, 熊露, 刘克宝, 钟志平. 基于深度学习的多种农产品供需预测模型[J]. 智慧农业(中英文), 2022, 4(2): 174-182.
引用格式:庄家煜, 许世卫, 李杨, 熊露, 刘克宝, 钟志平. 基于深度学习的多种农产品供需预测模型[J]. 智慧农业(中英文), 2022, 4(2): 174-182.
ZHUANG Jiayu, XU Shiwei, LI Yang, XIONG Lu, LIU Kebao, ZHONG Zhiping. Supply and demand forecasting model of multi-agricultural products based on deep learning[J]. Smart Agriculture, 2022, 4(2): 174-182.
基于深度学习的多种农产品供需预测模型
庄家煜1,2 ,许世卫1,2*,李杨3 ,熊露1,2 ,刘克宝3 ,钟志平1,2(1. 中国农业科学院农业信息研究所,北京 100081;2. 农业农村部农业信息服务技术重点实验室,北京 100081;3.黑龙江省农业科学院农业遥感与信息研究所,黑龙江哈尔滨 150086)
1 引 言
农产品供需分析预测有助于积极释放市场信号、引导农业生产,一直受到国内外研究者的广泛关注,通常可分为农产品产量预测和需求预测两方面。其中,产量预测研究多基于气象、遥感和作物生长机理等模型,结合线性回归、时间序列、人工智能等方法进行预测;需求预测研究多采用人均营养摄取推算法、趋势和经验估算法、结构模型预测法等。农业系统具有很强的非线性、随机性和动态特征,其模型能否有效应用依赖于模型参数的快速、准确估算。传统的统计方法不能全方位对农产品供需过程进行定量描述,需充分发挥深度学习模型所具备的时间、空间数据连续等优势。本研究结合农学、信息技术、经济学等多学科知识,在积累的大量监测数据基础之上,充分考虑农产品品种、时间、收入、经济发展等因素影响,应用长短时记忆神经网络(LSTM)等智能算法在多维变量非线性特征感知中的优势,优化传统农产品供需预测模型。在提高农产品供需过程模拟与估算精度的同时,并可为多区域、跨预测期的农业展望工作提供有效技术支撑。
2 数据与方法
2.1
数据来源
农产品供需预测模型使用的数据为1980年以来国家级和省级的数据,涉及的指标有:产量、作物种植面积、畜产品出栏量、口粮消费、工业消费、饲用消费、进出口量、价格、GDP、人口、气象要素等,数据来自于官方发布的统计年鉴或报告。部分数据则通过调查、回溯等方法进行估算,如饲用消费、工业消费、种用消费等。
2.2
研究方法
本文涉及的农产品供需预测模型主要考虑中国农产品供给与需求的特点,并基于均衡原理的假设。提出的中国农产品供需预测模型主要有2个特点:一是系统考虑农业与非农业、农业内部之间的各种产业联系,包括消费和生产方面的联系,不同产品之间的相互影响:二是将供需均衡基本假设作为先验知识融合到模型中,并作为约束条件再引入LSTM方法作为智能预测模型的核心算法。
2.2.1 模型建立
农产品供需预测模型涵盖稻谷、小麦、玉米等18种农产品。在多品种模型运算时,粮食类农产品的饲用消费需要建立在畜禽产品的生产基础之上,所以建模时将猪肉(PK)、牛肉(BV)等肉类品种划分为优先计算组,通过模型计算出肉类联合平衡表方程,再将预测的肉类产量(视结果可用性,若不可用则以存栏量、出栏量等变量替代)作为输入数据引入稻谷(RI)、小麦(WT)、玉米(MA)等主要粮食作物品种的联合平衡表方程,计算有种植竞争、消费替代的关联农产品。
供需预测模型总体思路为:将深度神经网络训练模型封装为I/O开放的模块化模型,预留出外部数据输入控制接口,实现供需平衡相关指标预测和平衡表的换算。主要功能包括模型自动训练封装、模型自动调参、模型接口参数输入、平衡表的自动换算、自动配平和最终平衡表输出等。模型可以通过选择待预测的农产品品种、模型训练的历史数据时间段,也可选择未来的几年的平衡表的输出(中长期预测),对模型预测场景进行设置。平衡表测算模型主要采用LSTM模型方法测算,辅以逻辑回归(Logistic Regression,LR)模型进行局部变量的配平。
2.2.2 模型评估方法
在模型验证时,将历史数据进行滑动处理,以最新的一年数据作为验证集,之前的数据用于建模训练,将真实值和模型预测值做对比验证。本研究涉及的模型评估主要使用平均绝对值误差(MAE)和平均绝对百分比误差(MAPE)两个指标判断模型的效果。
3 结果与分析
3.1
单品种建模预测
以耦合度较小的禽蛋供需预测(2021-2030年)为例,预测时使用一种双输入模型,将样本数据分为禽蛋历史平衡表数据和影响禽蛋供需的各要素数据。其中,卷积层输入数据为影响禽蛋供给与需求各分项的影响因素数据,卷积处理后对数据进行特征提取。在全连接层接收平衡表分项数据,与先前的因素特征组合成新的特征,通过LSTM算法进行禽蛋供需预测,流程如图1所示。
图1 基于LSTM的禽蛋供需预测流程
Fig. 1 Egg supply and demand forecasting process based on LSTM
图1中模型网络采用串联结构,可以提高模型的表达能力。模型采用模块分组的形式,以模块为基础,重复提取不同数量的特征。模块的基本构成为:先对输入进行3´3的卷积,输出为n/4个通道;然后连接2´2的卷积,输出为n/4个通道;对数据进行两次特征变换,最后加入一个1´1的卷积,提高网络的表达能力,同时组合不同通道的信息,输出为n个通道(其中n为滤波器的个数)。在主体网络结构中引入模型池化层,以合成初始特征区域内某一个特征,并有效减小过拟合现象的发生。丢弃层(Dropout)使隐层神经元随机失活,防止模型过拟合,同时可以提高模型的泛化能力。由于样本数据存在分布不均匀现象,采用加权交叉熵作为目标的损失函数。全连接层加入时序信息特征,综合考虑时间特征。对于预测出的结果,需要满足平衡表的分项之间的关系,同时使用Lasso回归模型进行校正。首先,将禽蛋的历史数据处理成一系列的时间序列,并利用LSTM模型学习其周期特征,训练过程中损失随训练次数(Epoch)的变化曲线如图2所示。
图2 禽蛋供需预测的LSTM模型训练过程
Fig. 2 LSTM model training process ofegg supply and demand forecast
3.2
多品种集群建模预测
通过LSTM方法优化的农产品供需预测模型可以实现多品种集群建模预测,利用本研究供需预测模型对中国主要农产品产量进行预测,预测结果与国家统计公布的实际结果进行对比,结果如图3所示。产量预测模型的三年(2019—2021年)总体MAPE为3.02%,其中2019年MAPE为3.90%,2020年MAPE为1.74%,2021年为3.42%。可以看出2020年和2021年的产量预测精度要好于2019年,说明随着样本容量的增加,智能学习模型预测效果会逐步变好。
图3 基于LSTM模型2019—2021年主要农产品产量预测结果与实际对比
Fig. 3 2019—2021 production forecast and actual results of major agricultural products
4 总结
为充分发挥大数据应用的时间连续、空间数据连续等优势,进一步提高多品种供需的模拟与估算精度,本研究提出了一种基于深度学习模型LSTM的农产品供需分析预测模型,可实现多元高频数据协同分析。对解决农产品供需分析过程中因单一信息源造成的“视觉盲区”,全息化农产品供需预测预警具有一定的探索性和开创性。本方法在对农产品供需模型参数敏感性分析和参数校正基础上,以1980年以来中国农产品供需平衡表数据作为基础学习样本,构建了基于长短时记忆神经网络和均衡关联的农产品供需预测模型。可实现主要农产品供给、需求的定量化模拟与估算。本文构建的农产品供需预测模型,利用均衡理论对农产品供需各个分量进行约束,同时综合考虑农产品产业链各环节的历史特征以及影响因素,避免了人工经验干预引入的不可控误差,并通过循环神经网络优化了模型的参数,提高了模型的预测性能。
通讯作者简介
许世卫 二级研究员
许世卫, 1962年出生,管理学博士,二级研究员,博士生导师。现为农业农村部市场预警专家委员会秘书长、农业农村部农业信息服务技术重点实验室主任、北京市农业监测预警工程技术研究中心主任、中国农业科学院智能化农业预警技术与系统重点开放实验室主任、中国农学会农业监测预警分会理事长、北京农学会副会长。是中国科协八大、九大、十大全国代表、国家863计划现代农业技术领域主题专家、国家大数据专家咨询委员会委员、全国农业科研杰出人才、享受国务院特殊津贴专家。长期从事农业信息学与信息监测预警研究。在农业信息监测预警技术与系统、粮食与食物安全信息分析、农业大数据与信息智能服务技术等方面进行了重要探索,取得了多项科技成果。在农业信息学科和监测预警领域,建立了农业信息分析学,创建了中国农产品监测预警CAMES模型系统,倡导和主持召开了中国农业展望大会。先后主持和参加国家自然科学基金重大项目、重点项目、国家科技支撑项目、国家软科学重点课题、农业农村部信息预警项目、“948”项目、中国工程院重大咨询项目、科技部基础性和社会性公益专项、国际合作项目等类型的科研项目与课题多项。公开发表学术论文220多篇,出版专著37部;制定国家标准、行业标准11项;授权国家专利77项(发明33项);获省部级科学技术奖12项;先后指导培养硕士研究生、博士研究生、博士后80多名;应邀到FAO、OECD、EU、IFPRI等国际组织及美国、英国、法国、德国、意大利、澳大利亚、日本、俄罗斯等30多个国家的科研机构和大学访问及学术交流。转载请联系编辑部授权
刘继芳研究员团队:基于高斯混合-隐马尔科夫融合算法识别奶牛步态时相(《智慧农业(中英文)》2022年第2期)
李奇峰研究员团队:商业化肉牛繁育大数据平台设计与关键技术(《智慧农业(中英文)》2022年第2期)
张玉安教授团队:基于迁移学习的多尺度特征融合牦牛脸部识别算法
为方便农业科学领域读者、作者和审稿专家学术交流,促进智慧农业发展,为更好地服务广大读者、作者和审稿人,编辑部建立了微信交流服务群,有关专业领域内的问题讨论、投稿相关的问题均可在群里咨询。
为方便农业科学领域读者、作者和审稿专家学术交流,促进智慧农业发展,为更好地服务广大读者、作者和审稿人,编辑部建立了微信交流服务群,有关专业领域内的问题讨论、投稿相关的问题均可在群里咨询。入群方法:加小编微信331760296,备注:姓名、单位、研究方向,小编拉您进群,机构营销广告人员勿扰。
发布征集
来源:智慧农业资讯一点号