DOE_全因子实验设计与实战案例

360影视 动漫周边 2025-03-11 06:13 2

摘要:DOE是Design Of Experiment的英文缩写,翻译过来就是实验设计。举一个生活中一个典型的例子,有些小宝宝小时候都需要进行奶粉喂养,那一杯150ml的奶,水加多少,奶粉加多少,才是最适合宝宝消化吸收的最佳比例呢?极端一点讲,一滴水不加,让孩子干吃

1. 什么是DOE

DOE是Design Of Experiment的英文缩写,翻译过来就是实验设计。举一个生活中一个典型的例子,有些小宝宝小时候都需要进行奶粉喂养,那一杯150ml的奶,水加多少,奶粉加多少,才是最适合宝宝消化吸收的最佳比例呢?极端一点讲,一滴水不加,让孩子干吃奶粉肯定不行,或者说一点奶粉不加,让孩子库库喝水,显然一点营养也没有,也是不现实的。通过研究奶粉与水的最佳比例,使得宝宝吃饱的同时又能够快速增长体重,这个就是实验设计。

2. DOE的类型

简单来说,根据DOE的目的,有两个大类:因子设计和回归设计。所谓的因子设计,就是要研究一个系统里面,究竟有哪些因子X会显著影响着Y。而回归设计呢,就是基于样本数据得到回归方程,基于回归方程,进行一些特定因子条件下响应变量的预测。

基于上述内容,我们常见的DOE有全因子实验设计,部分因子实验设计,响应曲面设计、混料设计等。其中,响应曲面设计又包括CCD中心复合设计,CCI中心复合有界设计,CCF中心复合表面设计,Box-Behnken设计等。

今天我们进行最基础的DOE类型学习,即全因子实验设计与分析。

3. DOE基础术语

3.1 响应变量

以开篇的奶粉的例子为例,宝宝的体重增长速度可以作为响应变量Y;

3.2 因子

因子可以分为可控因子和噪声因子。

可控因子指的是会影响响应变量变化的可以人为调控的因子,如水的含量和奶粉的含量。

噪声因子,指的是不可认为调控的因子,例如冲奶粉的时候每个人对于刻度的读取是有细微差别的,每个批次的奶粉中的营养含量也是有细微差别的,这些都是在实验设计的时候无法具体管控的。

3.3 水平

指的是因子的取值状态,一般研究的是两水平实验设计,如奶粉含量高水平是60%,低水平是40%。

3.4 处理

也称作运行。例如按照60%的奶粉,40%的温水混合充一次奶粉,就叫一次处理。

3.5 实验单元

单次按照设定的因子条件允许或者处理得到的结果就叫一个实验单元,例如上述的一杯奶就是一个实验单元。

3.6 实验模型与误差

基于因子的不同水平得到的试验结果,通过数据分析拟合出来的响应变量Y与因子X1、X2...之间的关系称作实验模型:

Y=f(X1,X2...Xn)+ε

其中ε称作模型误差,其包括有一些噪声因子引起的实验误差,也包括基于模型本身的失拟误差。所谓的失拟误差研究的是通过给定的样本值拟合出来的数据模型与实际模型之间的差距,如果失拟误差过大,则说明拟合的模型无法真正代表总体真正的状态。

3.7 主效应与交互效应

主效应指的是响应变量单纯因为某个因子变化而产生的变化。

交互效应指的是,响应变量的变化并不单单一个因子的作用引起,而是由两个及以上的多个因子的变化产生。

4. DOE基本原则

4.1 重复试验

通过重复试验,可以有效评估实验误差的大小,这有利于我们后续甄别,响应变量的变化究竟是不同的因子水平带来的,还是单纯的试验误差引起的。

4.2 随机化

指的是以完全随机化的顺序进行实验,这样可以有效避免一些未知的潜在因素造成实验误差过大。

4.3 区组化

如果我们知道一天当中上午和下午实验会对实验结果产生明显的影响,那就不要将实验安排在全天,而是集中安排在上午或者下午进行,这样的操作就叫做区组化。

5. 全因子实验设计分析流程

我们首先来看一个实际生产过程中的案例:

假设当前我们所在的生产过程有一个焊接工艺,焊接过程使用的一个易损件叫做焊接头,其在焊接过程中会因为压力、凹槽角度、安装角度等因素导致断裂,为了实现焊接头使用寿命的最大化,组织需要研究究竟什么样的参数条件下,才能够实现焊接头的寿命最大化。我们期望的寿命是不低于90万次。

5.1 DOE计划

我们利用Minitab,来安排一组实验设计计划:

点击统计-DOE-因子-创建因子设计。

选择两水平因子设计(默认生产元),因子数根据团队意见和经验,根据我们上述得到的结论,怀疑的因子有三个,分别是焊接压力,凹槽R角以及安装角度,所以我们选择的因字数为3.

接着选择设计,选择全因子设计,中心点数选择3,角点仿形数选择1(也就是为了节约资源,不进行过多的重复试验,试验误差通过中心点的数据进行评价),区组数选择1,然后点击确定。

点击确定之后,选择因子,将我们的因子进行命名,同时将各因子的高低水平进行定义,记住不要单位。

还有一件事情不要忘了,就是我们前文强调的随机化。点击确定后回到上一个页面,这个时候页面中的设计按钮被点亮,选择设计,勾选随机化运行顺序,之后我们就可以得到一个初步的实验设计计划。

按照计划中的运行序,根据不同的试验条件,就可以得到11个关于焊接头使用寿命的数据。

5.2 拟合选定模型

5.2.1 看方差分析表中的总效果

H0:模型无效,H1:模型有效。

如果对应的回归项的P值<0.05,则拒绝原假设,说明模型有效。

这是DOE分析的第一步。如果拟合出来的模型都无效,后续的分析则无法开展。

那么,有哪些原因会造成拟合出来的模型无效呢?

(1)实验误差太大,或者说噪声因子的影响过于强烈;

(2)实验设计在计划阶段漏掉了某个重要的因子;

(3)模型本身有问题,导致失拟。因为全因子试验设计拟合的是线性模型,一旦实际模型存在弯曲,则就会导致模型失拟。

5.2.2 观察方差分析表中的失拟项

H0: 无失拟,H1:有失拟

若P值<0.05,则拒绝原假设,说明模型有失拟。说明模型中有重要的缺失,应该补上,例如高阶项,高阶交互作用项等。

5.2.3 看方差分析表中的弯曲项

本项遵循的假设检验是:

H0:模型无弯曲,H1:模型有弯曲。

如果弯曲项的P值>0.05,说明无法拒绝原假设,也就是说模型不存在弯曲。

5.2.4 拟合总效果的多元相关系数

R-sq指的是相关系数r的平方,我们在之前分享的相关分析的有关内容中有过介绍,这里不再赘述,DOE针对因子数量引入了R-sq adj,其中R-sq与R-sq adj两者之间越接近,说明模型拟合得越好。

5.2.5 s值

我们知道,所有的实际的观测值与理论模型之间肯定会有差别,也就是所谓的误差,这是不可避免的实验事实。但是我们总是假设,这样的误差服从均值为0,方差为σ²的正态分布。而方差分析表中给出的s值就是σ的无偏估计量,通过s值可以得到模型理论值的基于观测值的95%置信区间。也就是说,s值越小,说明模型越好。

5.2.6 各项效应的显著性

方差分析表中会给出各项效应的P值,P值小于0.05时,一般认为该效应显著。对于不显著的项,后期可能会在修订模型的时候将之删去,但是需要注意的是,假如说主效应A不显著,但是因子A与B的交互作用显著,这个时候仍然需要保留因子A,否则可能会造成模型的失拟。通过帕累托效应图与正态效应图可以帮助我们快速明确哪些显著与非显著项。

5.3 残差分析

是不是模型经过检验,结论是有效之后我们就可以直接将模型进行引用了呢?答案是否定的。不同的模型后面,都会与观测值之间存在误差,也叫残差。残差我们一般假设服从均值为0,方差为σ²的正态分布,所谓的残差分析,就是观察残差在不同的分析环境下是否始终遵循这个规律。

5.3.1 观察残差对于以观测值顺序为轴的散点图

所有的点应该围绕0为中心值的中线上下随机跳动。如果存在有明显的漏斗形或者喇叭状的异常趋势,则可能说明模型选择有误,需要对响应变量进行一定的转换,如开根号,取对数等。

5.3.2 观察残差对于以响应变量拟合预测值为轴的散点图。

重点观察是否存在漏斗形或者喇叭形的趋势。如果存在异常趋势,说明模型中可能缺少关于因子的高阶项。

5.3.3 观察残差的正态检验图。

所有的点应该大致分布在同一条直线上。

5.3.4 观察残差对于各自变量为横轴的散点图。

重点观察是否有弯曲的趋势,如果存在弯曲,则说明可能模型缺少高阶项。

5.4 判断模型是否需要改进

经过5.2-5.4的步骤分析之后,我们会根据残差分析结果和各效应的显著性进行模型的修改或者因子的删减,直到没有任何异常出现,最终我们会得到一个最符合我们期望的回归方程。

5.5 对选定的模型进行分析和解释

5.5.1 输出各因子的主效应图和交互作用图;

各因子的主效应图和交互作用图可以进一步确认各因子的显著性,从而进一步验证我们的结论。

5.5.2 输出等高线图、响应曲面图等;

等高线图和响应曲面图可以帮助我们观察因子在什么状态下可以输出我们想要的响应变量,如得到响应变量的目标值,最大值或者说最小值。

5.5.3 实现最优化

通过DOE的相应优化器功能可以直接告诉我们达到我们期望的响应变量的具体的因子水平。

5.6 判断目标是否达到

我们进行DOE的目的是寻找既定的因子条件下的响应变量的最大值,目标值或者说最小值。例如我们上述的案例中,DOE的目标是为了找到期望的焊接头的寿命最大值,如果经过初步的全因子实验设计,并没有达到我们期望的最佳寿命,这个时候我们可能需要进行新的实验设计,改变因子水平,或者说进行响应曲面设计,寻找更佳的实验结果。

5.7 验证试验

如果我们认为DOE获得了我们想要的结果,那么接下来,我们还需要进行进一步的验证试验,确保在我们设置的因子条件下能够获得我们预期的效果。当然实验结果的好坏评价标准是基于选定的回归方程计算出来的预测值的95%的置信区间(有点拗口,但是不重要,所有的置信区间Minitab都会帮我们计算出来,我们只需要在后续的验证实验中将实验结果与预测区间进行比对,如果落在预测区间则说明DOE输出有效)。

6 DOE实战案例

6.1 实验数据

按照既定的DOE计划进行实验,得到的数据如下:(注意,必要时,需要对相关的测量设备进行测量系统分析)

注意,数据已经进过特殊处理,不可直接用于行业设置。

下面,我们就用上述的分析流程来解析这个DOE案例:

6.2 拟合模型

选择统计-DOE-因子-分析因子设计:

在相应一栏中选择我们的响应变量-焊接头寿命

然后在项按钮中,将ABC三阶交互作用取消,一般认为,三阶交互作用不会显著,为了缩短最佳模型拟合的周期,一般不会选择三阶交互作用:

接着在图形按钮选择正态:

下面来分析模型的有效性:

根据上述的方差分析结果,模型P值为0.029,<0.05,说明模型有效;

另外再来看弯曲项的P值为0.609,>0.05,说明模型没有明显弯曲;

失拟项P值为0.859,>0.05,说明模型没有明显的失拟。

接着来看个项显著性:

从帕累托图和标准化效应正态图可以看出,因子A、B与AB交互作用显著。

6.3 残差分析

选择统计-DOE-因子-分析因子设计-图形-四合一,同时残差与变量一栏中选择三个因子,点击确定,可以得到各个残差分布图:

先从四合一图中可以看到,残差与观测值顺序散点图分布随机无异常,残差与拟合值散点图分布随机无异常,残差正态分布图所有点大致分布在一条线上也没有异常,同时残差与各主效应散点图上也没有明显的弯曲,说明模型残差无异常。

6.4 模型优化

因为模型中因子C,BC与AC交互作用并不显著,所以我们需要将之从拟合模型中删除:

选择统计-DOE-分析因子设计-项,将C、BC与AC从模型中删除:

修剪之后的方差分析结果如下所示:

紧接着按照6.2的分析流程重新开始分析,这里不再赘述,结论就是:模型有效,无弯曲,无失拟,接下来的步骤很重要:我们需要看一下修剪之后的模型是否拟合得更好了?

从上述的R-sq与R-sq adj之间的变化来看,调整前与调整后两者之间的差距有明显变小,说明调整之后的模型拟合的状态更好!

6.5 新模型残差分析:

重复6.3的步骤,得到残差各个分布图:

从等方差角度分析,残差各分布图无异常。

至此,我们可以初步判断,模型可以确定下来,基于此模型我们可以进行下一步的分析。

Minitab给出的拟合回归方程为:

6.6 对选定的拟合模型进行分析和解释

选择统计-DOE-因子-因子图,得到主效应图如下:

从主效应图上可以看出,因子C(安装角度)确实相较于因子A与因子B,没有那么影响响应变量。AB交互作用反映在两条直线的平行度,焊接压力与R角的交互作用图明显不平行,符合模型结论。

接着我们看等高线图和响应曲面图:

选择统计-DOE-因子-等值线图&曲面图

从等值线图和曲面图可以看到,为了让焊接头的寿命尽可能的大,应该让R角尽可能的大,同时焊接压力也要足够小(颜色最深)。

等值线图与曲面图可以让我们从宏观上判断各个因子的走势,但是具体的什么样的参数设置可以实现焊接头寿命的最大化呢?

这个就是Minitab相应优化器的强大功能!

选择统计-DOE-因子-相应优化器-最大化,可以得到具体的焊接头达到当前样本量估计出来的最大寿命:

可以看到,Minitab给出的结果是,当焊接压力为20N,R角为5°时,焊接头的使用寿命可以达到91.2万次,这满足了我们期望的90万次的目标,可以认为,我们DOE的目标初步达成。

6.7 实验验证

至此,我们得到了使得焊接头寿命最大化的因子设置,但是还需要做最终的试验验证,即按照设定的条进行进行重复试验,观察寿命值是否能够落在指定的置信区间内。

置信区间是多少呢?

选择统计-DOE-因子-预测:

将相应优化器给出的压力值和R角输入进去,就可以得到置信区间与预测区间了:

这里需要简单区分两个概念:

1. 95%置信区间

这里的置信区间,指的是基于目前的实验数据得到的回归方程,按照当前的参数设置,未来的多次相同条件的实验结果的均值会落在这个区间内;这个区间可以作为DOE的实验结论。

2. 95%预测区间

这个代表着未来某一次按照当前的参数条件得到的实验结果的观测值会落在这个区间。往往预测区间作为实验验证的判定区间。

来源:清新教育

相关推荐