智慧农业关键技术机器学习在智慧农业中的应用

360影视 动漫周边 2025-03-09 22:45 2

摘要:照片、视频等各种数字图像是机器学习和大数据技术重要的应用对象之一。图像处理就是对输人的原始图像进行某种线性或非线性的变换,使输出结果符合某种需求。图像处理技术的基本内容有:图像变换、图像增强、图像去噪、图像压缩、图像复原、图像分割和二值图像处理以及常用的小波变

智慧农业关键技术机器学习在智慧农业中的应用

照片、视频等各种数字图像是机器学习和大数据技术重要的应用对象之一。图像处理就是对输人的原始图像进行某种线性或非线性的变换,使输出结果符合某种需求。图像处理技术的基本内容有:图像变换、图像增强、图像去噪、图像压缩、图像复原、图像分割和二值图像处理以及常用的小波变换、傅里叶变换等。图像的理解与分析是对原始图像进行特征的选择和提取,对原始图像所包含的知识或信息进行解读和分析的过程。图像处理技术是计算机视觉的基础,计算机视觉通过图像分析,让计算机模拟人眼和人脑进行工作,计算机视觉的发展离不开机器学习的支持,随着深度学习的不断发展和图像识别精度的大大提高,计算机视觉领域的发展前景非常广阔。机器学习、大数据以及图像处理技术的迅速发展,为其在农业中的应用提供了强有力的支撑,当然机器学习在智慧农业中的应用并不仅仅依靠图像处理分析,本节将着重介绍机器学习在智慧农业中的应用。

1 机器学习

①.机器学习的定义

机器学习在大型数据库中的应用称为数据挖掘。在数据挖掘中,需要处理大量的数据以构建简单有用的模型,如具有高精度的预测模型。数据挖掘的应用领域非常广泛:在金融业,银行分析其历史数据,构建用于信用分析、诈骗检测、股票市场等的应用模型;在制造业,学习模型可以用于优化、控制以及故障检测等;在医学领域,学习程序可以用于医疗诊断等;在电信领域通话模式的分析可用于网络优化和提高服务质量:在科学研究领域,物理学天文学以及生物学等只有用计算机才可能对大量数据进行快速分析。

机器学习还可以帮助我们解决人脸识别、语音识别以及机器人方面的许多问题。以人脸识别问题为例:即使姿势、光线、发型等不同,我们每天还是可以通过看真实的面孔或照片来辨认我们的家人和朋友,但是我们做这件事是下意识的,而且无法解释我们是如何做到的,我们不能够解释我们所具备的这种技能,也就不可能编写相应的计算机程序。但是我们知道,脸部图像并非只是像素点的随机组合:人脸是有结构的、对称的,脸上有眼睛、鼻子和嘴巴,它们都位于脸的特定部位,每个人的脸都有各自的眼睛、鼻子和嘴巴的特定组合模式。通过分析一个人脸部图像的多个样本,学习程序可以捕捉到那个人特有的模式,然后在所给的图像中检测这种模式,从而进行辨认,这就是模式识别。

机器学习使用实例数据或过去的经验训练计算机,以优化某种性能标准。我们依赖于某些参数的模型,而学习就是执行计算机程序,利用训练数据或以往经验来优化该模型的参数。模型可以是预测性的,用于预测,或者是描述性的,用于从数据中获取知识,也可以二者兼备。

简单地讲,机器学习就是让机器模拟人类的学习过程来获取新的知识或技能,并通过自身的学习完成指定的工作或任务,目标是让机器能像人一样具有学习能力。

机器学习的本质是样本空间的搜索和模型的泛化能力。目前,机器学习研究的主要内容有3类,分别是模式识别(patternrecognition,PR)、回归分析(regression analysis,RA)和概率密度估计(probability density estimation,PDE)模式识别又称为模式分类,是利用计算机对物理对象进行分类的过程,目的是在错误概率最小的情况下,使识别的结果与客观物体尽可能相一致。显然,模式识别的方法离不开机器学习。回归分析是研究两个或两个以上的变量和自变量之间的相互依核关系,是数据分析的重要方法之一,概率密度估计是机器学习挖掘数据规律的重要方法。

机器学习是人工智能的一个分支,它是实现人工智能的一个核心技术即以机器学习为手段解决人工智能中的问题。机器学习通过一些让计算机可以自动“学习”的算法,从数据中分析获得规律,然后利用规律对新样本进行预测。

机器学习和人工智能有很多交集,其中,深度学习就是横跨机器学习和人工智能的一个典型例子。深度学习的典型应用是选择数据训练模型,然后用模型进行预测。

数据挖掘是从大量的业务数据中挖掘隐藏的、有用的、正确的知识促进决策的执行。数据挖掘的很多算法都来自机器学习,并在实际应用中进行优化,机器学习最近几年也逐渐跳出实验室,解决实际问题,数据挖掘和机器学习的交集越来越大。

人工智能、机器学习和深度学习三者之间是包含关系,如图1 所人工智能的研究最早包含了机器学习,或者说机器学习是其核心组成部分,人工智能与机器学习密不可分。目前,人工智能的热点是深度学习,深度学习是机器学习的一种方法或技术。深度学习在图像识别和语音识别中识别精度的大幅提高,加速了人脸识别、无人驾驶、电影推荐、机器人问答系统和机器翻译等各个领域的应用进程,逐步形成了“人工智能+”的趋势。

图1 机器学习与人工智能、深度学习的关系

②.机器学习的分类

根据机器学习算法的学习方式划分,机器学习可分为以下三种。

(1)有监督学习(supervised learning)。

有监督学习是利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的学习过程,也称为监督学习。有监督学习的过程是:首先利用有标号的样本进行训练,构建相应的学习模型;然后,再利用这个模型对未知样本数据进行分类和预测。该学习过程与人类认识事物的过程非常相似。常用于分类的算法有:逻辑回归、决策树、最近邻、随机森林、支持向量机、朴素贝叶斯等:常用于数字预测的算法有:线性回归、最近邻、GradientBoosting、AdaBoost等。

(2)无监督学习(unsupervised learning)。

无监督学习是对无标号样本进行学习以发现训练样本集中的结构性知识的学习过程,也称为没有老师的学习。无监督学习事先并不需要知道样本的类别,而是通过某种方法,按照相似度的大小进行分类的过程。它与有监督学习的不同之处在于,事先并没有任何训练样本,而是直接对数据进行建模。常用于无监督学习的算法有:聚类算法和关联分析。

(3)半监督学习(semi-supervised learning)。

半监督学习是有监督学习和无监督学习相结合的学习.是利用有类标号的数据和无类标号的数据进行学习的过程。其特点是利用少量有标号样本和大量无标号样本进行机器学习。在数据采集过程中,采集海量的无标号数据相对容易,而采集海量的有标号样本则相对困难。因为对无标号样本的标记工作可能会耗费大量的人力、物力和财力。例如,在利用计算机辅助医学图像分析和判读的过程中,可以从医院获得海量的医学图像作为训练数据,但如果要求把这些海量图像中的病灶都标注出来,则是不现实的。现实世界中通常存在大量的未标注样本,但有标记样本则比较少,因此半监督学习的研究是非常重要的。

2 机器学习的应用实例

目前,在很多行业都开始应用机器学习技术,从而获取更深刻的洞察,为企业经营或日常生活提供帮助,提升产品服务水平。机器学习已经广泛应用于数据挖掘、搜索引擎、电子商务、自动驾驶、图像识别、金融投资、自然语处理、计算机视觉、医学诊断、信用卡欺诈检测、证券金融市场分析、游戏和机器人等领域。在分析中使用机器学习的现实意义是获得有用信息,机器学习相关技术的进步促进了人工智能在多个领域的发展。

①.关联分析

关联分析通过对数据集中某些项目同时出现的概率来发现它们之间的关联关系,其中一个典型的应用是购物篮分析。它的任务是发现顾客所购商之间的关联性,分析消费者的购买行为习惯,从而制定相应的营销策略,还可以为商品促销、产品定价、位置摆放等提供信息。我们还可以据此对不同的进行群体划分。关联分析主要包括Apriori算法和FP-growth算法等。

②.分类算法

分类算法是应用分类规则对记录进行目标映射,将其划分到不同的分类中,构建具有泛化能力的算法模型,即构建映射规则来预测未知样本的类别。

分类算法包括预测和描述两种,经过训练集学习的预测模型在遇到未知记录时,应用规则对其进行类别划分,而描述型的分类主要是对现有数据集特征进行解释并进行区分,例如,对动植物的各项特征进行描述,并进行标记分类,由此来决定其属于哪一类目。

分类算法主要包括决策树、支持向量机、最近邻算法、贝叶斯网络(Bayesian network)和神经网络等。

分类算法在模式识别方面有很多应用。比如光学字符识别就是从字符图像识别字符编码。这是一个多类问题的例子,类与我们想要识别的字符一样多。再如人脸识别,输入的是人脸图像,类是需要识别的人,并且学习程序应当学习人脸图像与身份识别之间的关联性。人脸类多,输入图像大,并且人脸是三维的,不同的姿势和光线等都会导致图像的显著变化。另外,对于特定人脸的输入也会出现问题,比如说眼镜可能会把眼睛和眉毛遮住,胡子可能会把下巴盖住等。

在医学诊断方面,输入的是关于患者的信息,按疾病分类,输入的信息包括患者的年龄、性别、既往病史、目前症状等。当然,患者可能还没有做过某些检查,相关输入也会缺失。检查需要时间,可能要花很多钱,也许还会给患者带来不便。因此,除非我们确信检查将提供有价值的信息,否则我们将不对患者进行检查。在医学诊断的情况下,错误的诊断结果可能会导致我们采取错误的治疗或根本不进行治疗。在不能确信诊断结果的情况下,分类器最好还是放弃判定,而等待医学专家来做决断。

对于语音识别,输入的是语音,类是可以读出的词汇。这里要学习的是从语音信号到某种语言的词汇的关联性。由于年龄、性别或口音方面的差异,不同的人对于相同词汇的读音不同,这使得语音识别问题相当困难。语音识别的另一个特点是其输入信号是时态的,词汇作为音素的序列实时读出,而且有些词汇的读音会较长一些。一种语音识别的新方法涉及利用照相机记录口唇动作作为语音识别的补充信息源。这需要传感器融合技术,集成来自不同形态的输入,即集成声音和视频信号。

还有离群点检测,即发现那些不遵守规则的例外实例。在这种情况下,学习规则之后,我们感兴趣的不是规则,而是规则未能覆盖的例外,它们可能暗示我们需要注意的异常。

③.回归分析

回归分析是一种研究自变量和因变量之间关系的预测模型,用于分析当自变量发生变化时因变量的变化值,要求自变量互相独立。回归分析可以分为线性回归、逻辑回归和多项式回归等。

假设我们想要预测二手车的价格。该系统的输入应该是我们认为会影响车价的一些属性,比如品牌、车龄、发动机性能、里程或其他信息,而输出的则是车的价格。这种输出为数值的问题是回归(regression)问题。

例如,设x表示车的属性,y表示车的价格,调查一下以往的交易情况,我们能够收集训练数据,而机器学习程序用一个函数拟合这些数据来学习关于x的函数y。若x表示二手车的里程数,则拟合函数可以写成:

y= ar + a我们可以利用以往的数据来求解其中anao的值,进而求出这个拟合函数回归和分类均为有监督学习问题,其中输入变量x和输出变量y是给定的,我们的任务是学习从输入到输出的映射。我们的估计要尽可能地接近训练集中给定的正确值。刚才说的模型是线性的,最佳拟合训练数据优化的参数只有两个:co和coo。如果模型是更加复杂的情况,那就要用更加复杂的拟合函数,比如二次函数或更高阶的多项式。

自动汽车导航也是回归算法的一个应用。其中,输出是每次转动车轮的角度。该角度使得汽车前进而不会撞到障碍物或偏离车道。在这种情况下,输入由汽车上的传感器(如视频相机、GPS等)提供,训练数据可以通过监视和记录驾驶员的动作收集。

④.非监督学习

在有监督学习中,我们的目标是学习从输入到输出的映射关系,其中输出的正确值已经由指导者提供。然而,在非监督学习中却没有这样的指导者,只有输入数据。我们的目标是发现输入数据中的规律,输人空间存在某种结构,使得特定的模式比其他模式更常出现,而我们希望知道哪些模式经常出现,哪些模式不经常出现。在统计学中,这称为密度估计(densityestimation)。

密度估计的一种方法是聚类(clustering),其目标是发现输入数据的筷或分组。对于拥有老客户数据的公司,客户数据包括客户的个人统计信息及其以前与公司的交易信息,公司也许想知道其客户的分布,搞清楚什么类型的客户会频繁出现。这种情况下,聚类模型会将属性相似的客户分派到相同的分组,为公司提供其客户的自然分组。找出了这样的分组,公司就可能作出一些决策,如对不同分组的客户提供特别的服务和产品等。这样的分组也可以用于识别“离群点”,即那些不同于其他客户的客户,这可能意味着一块新的市场,公司可以进一步开发。

3 机器学习与智慧农业

①.机器学习在智慧农业中的应用

智慧农业(intelligent agriculture)将各种技术纳入传统农业实践,以提高农业生产力和效率可持续性。物联网等现代技术为智慧农业奠定了基础,实现了人力和物力成本的最小化,提高了农业生产率。物联网生成大量数据,可用于实践,如作物监测或疾病监测。分析对这些数据的解释有助于理解土壤等各种农业因素之间的关系特征和气候变量,有助于及时作出决策和规划。典型的决策支持系统已用于生物安全应用、质量保证、农场和资源管理以及土地使用。机器学习通过建模在这些决策支持系统中发挥重要的作用。

我们可以将智慧农业体系结构分为三层(如图2所示)。第一层是物理层,它代表靠近农场的元素。该层主要由传感器和执行器组成。第二层是边缘层,表示计算设备,用于本地或远程分析或解释在物理层中收集的数据,该层通常由具有低到中等计算资源的设备组成。第三层是云层,代表IT基础设施,支持数据的存储、处理和分析。云层通常由具有高吞吐量和大存储容量的计算资源组成。云层支持边缘层,根据物理层收集的数据对农场事务进行决策。

图2 智慧农业体系结构

物联网在农业领域的应用非常重要,物联网的应用可以分为监测、预测/预报、控制和物流/文件任务等,使用的设备分别为车辆、空中拍摄设备和空中卫星等。监测收集各种参数,包括土壤数据,如湿度和化学成分:作物数据,包括叶面积和株高:气象数据,包括降雨和湿度等气象数据。例如,使用无线传感器网络监测以保护马铃兽免受真菌病害;使用土壤传感器进行土壤湿度的监测,并利用决策树的变体来处理数据,以促进灌溉规划。物联网设备称为执行器,提供远程控制以修改过程或环境。农业中的常见应用包括灌溉、化肥和农药的施用、照明和接人。应用物联网优化温室生长条件,如湿度、光度和灌溉。物联网使信息能够从生产者向消费者流动,如搬运、包装、运输和配送等信息。

②.机器学习在农业数据分析中的应用现状

机器学习在农业数据分析中的广泛应用为农业部门的研究提供了支持,如表1所示。这些应用包括疾病检测、土壤分类和农产品分析等等。机器学习已被用于预测自然事件,如饥荒、干旱和霜冻。事实上,人们已通过早期预测霜冻对农作物造成的损害,通过识别天气因素之间的关系,设计了决策系统,对霜冻事件进行早期的二元预测。还有人提出了通过电子鼻收集各种气味,使用神经网络进行分析,将树木分类为健康树或感染树。人们还发现新系统与集成电路一起使用能够提高机器学习对受感染植物的识别率。

表1 机器学习在农业数据分析中的应用

农业数据往往是不平衡的、稀疏的,并且充斥着各种各样的信息噪声。例如,在疾病预测中,数据通常是不平衡的,这会导致较差的分类模型或有时过于乐观的模型性能估计。此外,关于关键方面的评注,模型可信度非常有限。可信赖性对于农业社区采用机器学习驱动的智慧农业实践及其有效性至关重要。

来源:青钱柳

相关推荐