基于无人机遥感表型监测的苎麻优质种质资源筛选方法

360影视 欧美动漫 2025-06-20 00:42 2

摘要:付虹雨, 王薇, 廖澳, 岳云开, 许明志, 王梓薇, 陈建福, 佘玮, 崔国贤. 基于无人机遥感表型监测的苎麻优质种质资源筛选方法[J]. 智慧农业(中英文), 2022, 4(4): 74-83.

引用格式

付虹雨, 王薇, 廖澳, 岳云开, 许明志, 王梓薇, 陈建福, 佘玮, 崔国贤. 基于无人机遥感表型监测的苎麻优质种质资源筛选方法[J]. 智慧农业(中英文), 2022, 4(4): 74-83.

FU Hongyu, WANG Wei, LIAO Ao, YUE Yunkai, XU Mingzhi, WANG Ziwei, CHEN Jianfu, SHE Wei, CUI Guoxian. High quality ramie resource screening based on UAV remote sensing phenotype monitoring[J]. Smart Agriculture, 2022, 4(4): 74-83.

1 引 言

苎麻属荨麻科苎麻属,作为一种传统的天然纺织工业原料,具有抗菌、透气、凉爽等众多优点。近年来,苎麻独特的文化、药用及生态价值被逐渐挖掘出来,并在医药研究、饲料制作、土壤修复等方面得到广泛应用。中国是苎麻品种变异类型和苎麻属野生种较多的国家,但随着土地资源紧缺以及优良品种的推广应用,这一宝贵的作物资源出现严重的品种单一化趋势,导致苎麻种质资源面临威胁,对苎麻种质资源多样性调查和保护的需求日趋加大。

作物种质资源中蕴含着丰富的遗传多样性,并且在长期环境适应及人工选择的互作影响下,形成了表型性状的多样性,如农艺性状、产量性状、抗性性状、品质性状等,构成选育作物新品种的物质基础。面对成千上万个种质资源,表型数据的测量是一件巨大繁琐的工程。传统的人工测量方法不仅耗时耗力,并且受环境和观察者主观因素影响较大,难以实现多地点、多时序的种质资源表型测量工作。高通量表型技术的发展为作物表型性状评估提供新途径,如 Marefat‐zadeh等利用半自动室内高通量技术对来自不同地区的589 份番茄种质资源进行了特征分析,证明了高通量表型技术在作物种质资源遗传多样性研究中的应用潜力。

随着室内高通量表型技术的日益成熟,该项技术的应用逐渐由受控环境转向田间复杂环境,越来越多的研究者开始关注高通量表型技术在田间作物生长监测上的应用。田间表型技术依托无人机遥感技术、光谱技术、人工智能等技术的发展,在作物株高测量、品种识别、营养诊断、产量估测、病虫害监测等方面取得突破。如Jiang等基于无人机多光谱遥感获取的植被指数,采用随机森林回归方法估测藜麦叶面积指数(Leaf Area Index,LAI)和叶绿素含量,估测精度分别为0.977~0.980和0.983~0.986。Weiss和Baret基于无人机遥感系统获取葡萄树树冠影像,采用三维重建技术提取了葡萄树高度数据,其精度可达到88%。Ganeva等基于无人机遥感图像,在育种试验中精确提取了冬硬粒小麦LAI、吸收光合有效辐射分数、植被覆盖分数、叶片叶绿素含量(SPAD值)、冠层叶绿素含量、分蘖和产量,并分析了所研究基因型的遗传多样性、接近性和相似性。Tanger等研究了高通量表型技术用于识别水稻重要性状遗传变异的潜力,发现高通量表型技术获得性状识别的数量性状位点结果与人工观测性状的QTL(Quantitative Trait Locus)结果相对应。

当前,基于无人机遥感的作物种质资源田间表型高通量监测及辅助育种研究仍处于初步探索阶段,以往研究往往受限于作物品种,或侧重对单一表型信息进行监测,缺乏对作物关键表型的综合考虑。因此,本研究以更多类型的苎麻种质资源为对象,根据苎麻种质资源评价中常用的表型考察指标,探究了无人机遥感技术在苎麻种质资源多样性调查和评价中的可行性,并探索利用遥感技术得到的作物表型分析结果筛选优质品种、辅助作物育种的可行性。主要工作为利用无人机遥感系统获取田间苎麻冠层影像,在此基础上采用图像处理技术、机器学习技术提取苎麻种质资源主要表型(株高、株数、LAI、SPAD值、含水量),最后基于遥感表型对苎麻种质资源进行遗传多样性和差异研究。

2 材料与方法

2.1 研究区域

研究区域位于湖南省长沙市芙蓉区湖南农业大学耘园种植基地(28°11'02"N,113°04'10"E),区域内共栽有154份苎麻品种(图1),于2017年12月育苗移栽,2018年6月首次收获。区域内共包含154个小区,各小区面积为3.6 m2,小区内种植8蔸苎麻(2行×4蔸),基因型间距离为0.6 m,排水沟宽为0.5 m。试验区土壤成分均一且土壤肥沃,灌溉排水便捷,田间水肥管理一致。为完成后期影像的重建,提高经纬、高程位置校准的精度,试验地布置了6个地面控制点。

图1 苎麻种质资源试验小区位置及分布图

Fig.1 Location and distribution map of ramie germplasm resources test plot

2.2 数据采集

于2022年苎麻苗期(3月15日、3月23日)、封行期(3月29日、4月7日)、旺长期(4月12日、4月20日)进行了6次数据采集,包括地面测量数据和无人机影像数据。为保证数据的时效性,地面数据测量与无人机航拍在同一天同步进行。

2.2.1 地面数据采集

采集了作物株高、SPAD值、LAI、含水量、株数作为地面数据。其中,株高利用直尺测量苎麻植株底部至冠层顶端的距离;SPAD值通过日本KONICA MINOLTA公司生产的SPAD-502型叶绿素仪测量;LAI采用LAI-2200冠层分析仪测量。叶片含水量为叶片鲜重与烘干叶片重量的差值。以上数据均通过随机选取各小区10株苎麻求取平均值获取。于2022年4月20日,通过人工目视方法获取各小区苎麻植株数量。

2.2.2 遥感影像采集

采用大疆悟2搭载蝉思X5s高清数码相机获取苎麻冠层RGB影像,采用大疆精灵4获取苎麻冠层多光谱影像。

为保证太阳辐射稳定和充足,飞行作业均选择在当地时间12:00—14:00进行。采用DJI-GS Pro在指定区域内自动生成航线,设置主航向重叠率80%,主航线间图像重叠率70%,飞行高度为20 m,云台俯仰角为-90°,相机曝光模式为自动。

2.3 遥感影像预处理

2.3.1 遥感影像拼接

采用Pix4dmapper软件生成研究区域的正射影像以及数字地表模型(Digital Surface Model,DSM)影像(图2)。拼接过程中,为获取准确的地理参考,对导入地面控制点的三维空间位置信息进行地理校正。

图2 苎麻种质资源试验区域正射影像及数字地表模型

Fig. 2 Orthophoto image and digital surface model of ramie germplasm resources test area

2.3.2 遥感特征值提取

从无人机遥感影像中提取的遥感特征值包括纹理特征值、光谱特征值以及HDSM(高程数据)。选用灰度共生矩阵作为纹理特征值;植被指数作为光谱特征值,植被指数通过对不同波段的反射率进行线性或非线性方式组合而成;HDSM通过对不同时期获取的DSM进行差值运算提取。具体计算公式见表1。

表1 遥感特征值的计算公式

Table 1 The calculation formula of remote sensing index

注:i表示像素点行数;j为像素点列数;p(i,j)表示图像中(i,j)位置的灰度值;σx,σy为px(i)和px(j)的方差,N为行或列数;NIR、R、B、G分别表示近红外波段、红波段、蓝波段、绿波段的平均反射率;r表示红色标准值;g表示绿色标准值;b表示蓝色标准值。DSMi表示第i阶段苎麻冠层的DSM,DTM为苎麻未生长前地面的DSM

通过绘制矩形感兴趣区域(Area of Interest,AOI)提取单位小区的平均遥感特征值。采用Arc GIS10.2软件中的栅格工具,沿小区田块边缘绘制AOI。绘制时,小区四周边缘余留10%以消除边缘效应干扰。

2.4 苎麻遥感表型监测

2.4.1 苎麻株数监测

在前期研究中,利用2019年和2020年获取的苎麻种质资源冠层影像,采用全卷积一阶段目标检测算法(Fully Convolutional One-Stage Object Detection,FCOS)构建了苎麻植株计数模型。FCOS模型采用Resnet101作为backbone,特征金字塔(Feature Pyramid Networks,FPN)用于提取影像中的苎麻植株特征,训练次数为20次。图3为苎麻植株检测结果,蓝框标注实际植株样本,红框标注识别样本。

图3 基于全卷积一阶段目标检测算法的

苎麻植株检测结果

Fig. 3 Ramie plant counting results based on fully convolutional one-stage object detection(FCOS)

2.4.2 苎麻生理参数监测

混合各时期采集的样本数据,按7:3比例划分为训练集和验证集。以往研究表明,作物生理生化指标含量对不同遥感特征的响应存在差异,如作物LAI被证明与相对活力指数(Relative Vigor Index,RVI)、转换型土壤调节植被指数(Transform Soil Adjusted Vegetation Index,TSAVI)呈线性相关,与绿色植被指数(Green Vegetation Index,GVI)、垂直植被指数(Perpendicular Vegetation Index,PVI)更适合用二次方程拟合。含水量与ExG、ExR等植被指数具有极显著相关性。本研究以田间实测表型数据和遥感特征值为输入参数,递归特征消除方法筛选敏感特征,采用4种广泛使用的机器学习方法:线性回归(Linear Regression,LR)、随机森林回归(Random Forest Regression,RF)、支持向量机回归(Support Vector Machines,SVM)、偏最小二乘回归(Partial Least Squares Regression Analysis,PLSR)构建苎麻生理参数估测模型。使用决定系数(Coefficient of Determination,R2)、均方根误差(Root Mean Square Error,RMSE)作为模型评价指标,R2越高,RMSE越低,表明模型拟合精度越高。

2.5 苎麻种质资源遗传多样性分析

传统苎麻种质资源评价方法存在费时费力、破坏性强等缺陷,为此,本研究采用遥感监测得到的表型数据对苎麻种质资源表型遗传多样性和遗传变异进行分析,以实现作物种质资源的高效评价与筛选。变异系数和多样性系数为遗传多样性提供了信息支撑,变异系数越高,遗传多样性系数越高,遗传多样性越显著。主成分分析不仅能够提供表型性状之间的相关性信息,还能够根据主要成分的个体性状值提供基因型定位信息。

以上分析均在SPSS软件中实现,变异系数和多样性系数的计算公式如下:

其中,CV为变异系数;H'为多样性系数;Pi为某表型性状第i级内个体数占总个体数的百分比,%;Sd表示标准偏差, Mean表示平均值。

3 结果与分析

3.1 苎麻种质资源表型性状统计

基于不同生育期获取的地面实测数据对苎麻种质资源表型性状进行统计描述,结果见表2。从苗期到旺长期,苎麻种质资源的SPAD值和含水量总体呈现下降趋势,这一变化趋势与苎麻生长规律吻合。叶片含水量是反映水分供应与蒸腾之间平衡关系的重要指标,从苗期到旺长期,气温逐渐升高,干旱胁迫下苎麻叶片萎蔫度增加,叶片相对含水量下降。伴随作物生长,作物叶片数量和面积的改变,使得LAI处于连续动态变化之中。本研究中,从苗期到旺长期,地面实际测量的LAI逐渐增大,这是由于随着麻茎生长,出叶总数逐渐增加,叶片面积逐渐变大,苎麻行间荫蔽加重,因此LAI也随之持续增长。苎麻株高整体表现出随生育期后移,逐渐增高的趋势。

表2 苎麻种质资源表型性状统计描述

Table 2 Statistical description of ramie phenotypic characters

从不同时期苎麻种质资源存在的表型差异来看,前3个生育期内,苎麻叶片SPAD值总体在24.70~46.51的范围,苗期SPAD值表现出明显的品种差异,变异范围为25.50~46.51,标准差达到4.02,这表明苎麻种质资源在苗期光效利用上存在较大变异,苗期可能是影响苎麻有机质最终累积量的关键时期。随着苎麻生长,SPAD值在品种间的差异减小,封行期苎麻种质资源SAPD值的标准差为3.39,旺长期为3.36;苎麻种质资源含水量在前3个时期的总体范围为60.81%~95.84%,按不同时期苎麻种质资源含水量标准差排序,表现为旺长期>封行期>苗期。旺长期的含水量差异范围为60.81%~85.06%,封行期苎麻种质资源的含水量在71.31%~93.49%的范围,苗期苎麻种质资源含水量范围为79.69%~95.84%。不同生育期内,苎麻种质资源表现出的高含水量差异有助于筛选干旱条件下耐旱性强的品种;前3个生育期内,苎麻种质资源LAI总体在0.91~7.64的范围,在各时期间的变化幅度不大。随着生育期的后移,苎麻种质资源间株高差异逐渐变大,标准差由苗期的10.28变化到旺长期的22.42。

3.2 苎麻种质资源遥感表型监测

3.2.1 苎麻种质资源株高监测

以实测苎麻株高为因变量,HDSM为自变量,分别采用线性回归、指数回归、多项式回归进行线性拟合,结果见表3。株高监测精度R2为0.70~0.86,RMSE控制在4.59~6.86 cm范围。3种回归模型的拟合效果存在差异,总体精度表现为多项式回归>线性回归>指数回归。采用多项式回归模型对苎麻种质资源全生育期内的株高数据进行拟合,基于全生育期的苎麻株高提取精度很高,实测株高与HDSM之间的R2为0.93,RMSE为5.65 cm,表明利用无人机遥感监测苎麻株高具有可行性。

表3 苎麻种质资源株高拟合模型

Table 3 Plant height fitting model of ramie

germplasm resources

将各生育期数据按7:3的比例随机划分为训练集和验证集,并采用训练集数据构建不同生育期苎麻株高校正模型。其中,苗期、封行期、旺长期苎麻株高校正模型分别为公式(20)~(22)。

表4为苎麻株高校正模型的校正效果,由表4可知,校正后验证集的精度明显提升,校正后的HDSM与实测株高有较高拟合度。

表4 苎麻株高校正模型的校正效果

Table 4 Effect of ramie height correction model

3.2.2 苎麻种质资源生理参数监测

LR、RF、SVM、PLSR等4种机器学习算法估测苎麻生理参数结果如表5所示。LR在苎麻SPAD值估测中表现最佳,测试集R2 最高达到0.66,RMSE为2.03;对含水量估测表型也为最佳,R2 = 0.79,RMSE=2.21,对比训练集的估测精度(R2 = 0.78,RMSE=2.29),测试集的拟合指标得到了提高,说明该模型具有较强的泛化能力和稳定性。SVM在苎麻LAI估测中表现最佳,训练集和测试集的R2 分别为0.74和0.74,RMSE分别为0.60和0.63,训练集与测试集的相似精度表明该模型是可靠稳定的。因此,本研究基于遥感影像提取的苎麻生理参数具有较高的准确性,后续研究将基于最佳模型估测值对苎麻种质资源进行分析。

表5 苎麻种质资源生理参数监测结果

Table 5 Monitoring results of physiological parameters of ramie germplasm resources

3.3 苎麻种质资源的遥感表型差异

对苎麻种质资源遥感表型进行变异性分析(图4)。不同时期苎麻种质资源LAI的变异系数范围为18.94%~23.42%,平均变异系数为20.83%;HDSM的变异系数范围为20.06%~27.27%,平均变异系数为24.61%;株数的变异系数为35.48%。以上结果表明,苎麻种质资源在遥感提取的LAI、株高、株数结果上具有较大差异。在实际生产中,株高、有效株数是构成苎麻产量的主要因素,LAI能反映苎麻群体冠层结构以及光合作用能力,也与最终产量密切相关。因此,考察苎麻资源的株高、株数、LAI差异将有助于苎麻产量的评估和高产品种的选育。含水量的变异系数范围为2.3%~4.59%,不同种质资源间的差异性随着生育期的后移逐渐增大,在旺长期(4月20日)达到最大值4.95%,这是由于该时期气温上升,降水减少,土壤含水量降低,相比苎麻生长早期,该时期可以看作是干旱胁迫。不同苎麻种质资源含水量变异范围的增大表明品种耐旱能力存在差异。

图 4 基于遥感衍生性状的苎麻种质资源差异性分析

Fig.4 Difference analysis of ramie germplasm resources based on remote sensing derived characters

3.4 苎麻优质种质资源表型筛选

对基于遥感的苎麻种质资源表型进行主成分分析(图5),两个主要成分解释了所有种质资源性状超过43.39%的总变异。第一主成分中,株高和LAI的载荷量较高,两者都是反映苎麻结构特征的重要指标,因此主成分1(因子1)可用于苎麻种质资源结构特征评价。不同时期LAI和SPAD值在第二主成分中具有较高的贡献率,LAI能够反映苎麻光截获能力,叶绿素含量也与植物光合作用密切相关,因此,主成分2(因子2)可以作为高光效苎麻资源的筛选指标。

图5 苎麻种质资源遥感表型的主成分分类

Fig. 5 Principal component classification of remote sensing phenotypes of ramie germplasm resources

在苎麻种质资源多样性分析基础上,进一步采用主成分分析方法提取了筛选特异苎麻品种的综合性指标,根据综合性状能够获得关于基因型差异的补充信息,苎麻种质资源在因子1-因子2坐标系中的分布如图6所示。根据种质资源所在象限,可以判断特定性状对应的最强影响。越靠近坐标轴原点,表明种质资源在第一、二性状上是平衡的,而位于边缘的种质资源则受到特定性状的影响。如品种5-5和品种1-9在因子1上具有相似的性状,但是5-5具有较低的因子2特征值,1-9具有较高的因子2特征值,表明1-9比5-5的光效利用率会更高。结果表明,通过查找不同苎麻品种在因子1-因子2坐标系中的分布,可以判断结构相关性状和光效利用相关性状对应的影响。

图 6 苎麻种质资源在因子1-因子2坐标系中的分布

Fig.6 Distribution of ramie germplasm resources in factor 1-factor 2 coordinate system

4 结 论

作物种质资源的表型多样性是品种选育的动力,本研究结合无人机遥感技术、机器学习技术提出了一种快速、无损的苎麻种质资源表型多样性评价方法。主要结论如下:

(1)基于无人机遥感的苎麻种质资源表型估测是可行的。田间实测表型数据与遥感表型之间的拟合效果较好,其中苎麻株高估测精度为0.93,RMSE为5.65 cm;SPAD值R2为0.66,RMSE为2.09、含水量R2为0.79,RMSE为2.21%、LAI的R2为0.74,RMSE为0.63。说明无人机遥感获取的低空高分辨率影像信息不仅能实时、高频地为分析作物长势状况提供数据支撑,还能作为现有地面、航空、卫星遥感的补充,构建更为全面、立体的农业遥感监测系统。

(2)选择LR、SVM、RF、PLSR分别构建了基于无人机遥感的苎麻生理参数估测模型,4种机器学习算法的估测效果相当,LR在苎麻SPAD值、含水量估测中表现最佳,而 SVM在LAI估测中表现最佳。

(3)提取的遥感表型具有反映苎麻种质资源基因型差异的潜力,其中LAI、HDSM和株数的变异系数分别达到20.83%、24.61%和35.48%,说明基于无人机遥感技术的作物种质资源表型多样性调查是可行的。

(4)对遥感表型进行主成分分析,因子1可用于苎麻种质资源结构特征评价,因子2可以作为高光效苎麻资源的筛选指标,主成分分析结果为苎麻种质资源规模化高效鉴定,基因型分析与育种利用创造了可能。

利用无人机遥感技术快速、无损、高效提取大规模田间表型数据对作物品种筛选以及加速作物育种进程具有重要意义。但如何挖掘遥感数据,从中萃取可靠的、有意义的生物学知识仍然是未来研究的重点。在今后的研究中,应结合特定环境下作物的实际育种目标,通过引入最新的机器学习、深度学习等人工智能方法提高遥感表型的估测精度。另外,作物品种选育高度依赖基因型和环境因素,今后研究应更加重视表型分析技术与基因型技术的融合,以期筛选特定环境胁迫下适应性更强的作物品种。

为方便农业科学领域读者、作者和审稿专家学术交流,促进智慧农业发展,为更好地服务广大读者、作者和审稿人,编辑部建立了微信交流服务群,有关专业领域内的问题讨论、投稿相关的问题均可在群里咨询。

发布征集

来源:智慧农业资讯一点号

相关推荐