R语言两层2^k析因试验设计（因子设计）分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)

2024-04-18 28

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： R语言两层2^k析因试验设计（因子设计）分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)

因子设计相对于一次一个因子设计的优势

假设一次只研究一个因素。例如，在将浓度保持在 20% (-1) 并将催化剂保持在 B (+1) 时研究温度。

为了使效果具有更普遍的相关性，有必要使效果在所有其他浓度和催化剂水平上都相同。换句话说，因素（例如，温度和催化剂）之间没有相互作用。如果效果相同，则因子设计更有效，因为效果的估计需要更少的观察来达到相同的精度。

如果在其他浓度和催化剂水平下效果不同，则阶乘可以检测和估计相互作用。

非重复因子设计中的正态图

正态分位数图

一组数据的正态性可以通过以下方法来评估。让表示的有序值 . 例如，r(1) 是 r1,...,rN 的最小值，r(N) 是 r1,...,rN 的最大值。所以，如果数据是：-1, 2, -10, 20，那么。

N(0,1)的累积分布函数 (CDF) 具有 S 形。

x <- seq
plot(x,pnorm)

因此，一组数据的正态性检验是绘制数据的有序值 r(i) 与 pi=(i-0.5)/N 的关系。如果该图与正态 CDF 具有相同的 S 形，则这表明数据来自正态分布。

下面是从图中模拟的 1000 个随机样本的 r(i) 与 pi=(i?0.5)/N,i=1,...,N 的关系图

N <- 1000
x <- rnorm(N)
p <- ((1:N)-0.5)/N
plot

我们还可以构建一个正态的分位数-分位数图。可以证明 Φ(r(i))Φ(r(i)) 在 [0,1] 上具有均匀分布。这意味着 E(Φ(r(i)))=i/(N+1)（这是来自 [0,1] 上的均匀分布的第 i 阶统计量的期望值。

这意味着 N 点 (pi,Φ(r(i))) 应该落在一条直线上。现在将 Φ?1 变换应用于水平和垂直尺度。N个点

形成正态概率图 . 如果是从正态分布生成的，然后是点图应该是一条直线。

在 R qnorm() 中是 Φ-1。

plot(qnorm(p),sort(x))

我们通常使用内置函数 qqnorm() （并 qqline() 添加一条直线进行比较）来生成 QQ 图。请注意，R 使用稍微更通用的分位数 (pi=(1?a)/(N+(1?a)?a)，其中 a=3/8，如果 N≤10，a=1/2，如果N>10。

qqnorm(x);qqline(x)

该图与直线的显着（系统性）偏差表明：

正态假设不成立。
方差不是恒定的。

一个主要应用是在因子设计中，其中 r(i) 被有序因子效应代替。设 ^θ(1)<^θ(2)<?<^θ(N) 为 N 个有序因子估计。如果我们绘制

那么接近 0 的阶乘效应 ^θi 将沿直线下降。因此，偏离直线的点将被认为是重要点。

基本原理如下：1. 假设估计效应 ^θi 为 N(θ,σ)（估计效应涉及 N 个观测值的平均值，CLT 确保 N 小至 8 的平均值接近正态）。2. 如果 H0:θi=0,i=1,...,N 为真，那么所有估计的影响都将为零。3. 估计效应的结果正态概率图将是一条直线。4. 因此，正态概率图是检验所有估计的效应是否具有相同的分布（即相同的均值）。

当一些效应不为零时，相应的估计效应将趋于更大并偏离直线。
对于正面影响，估计的影响落在该线之上，而负面影响落在该线之下。

示例 - 研究化学反应的设计

一个工艺开发实验研究了四个因素因子设计：催化剂装料量 1、温度 2、压力 3和其中一种反应物的浓度 4。因变量 y 是 16 个运行条件中每个条件下的转化百分比。该设计如下图所示。

该设计未重复，因此无法估计因子效应的标准误差。

fct1 <- lm

可以获得因子效应的正态图。

Plot(fac

对应的效果 x1, x4, x2:x4, x2 不会沿着直线下降。

半正态图

相关的图形方法称为半正态概率图。让

表示无标识因子效应估计的有序值。

根据半正态分布的坐标绘制它们 - 正态随机变量的绝对值具有半正态分布。

半正态概率图由点组成

该图的一个优点是所有较大的估计效应都出现在右上角并落在该线之上。

可以获得过程开发示例中效果的半正态图half = TRUE。

Lenth 方法：检验没有方差估计的实验的显着性

半正态图和正态图是涉及视觉判断的非正式图形方法。最好根据正式的显着性检验来定量地判断与直线的偏差。

在 2k 设计 N=2k-1 中估计 θ1,θ2,...,θN的因子效应。假设所有因子效应具有相同的标准差。

伪标准误差 (PSE) 定义为

其中中位数是在 ∣∣^θi∣ 中计算的和

估计的因子效应为：

ef <- 2*fat1$coeffic

s0=1.5?median∣∣^θi∣∣的估计是

s0 <- 1.5*median(abs(eff))
s0

修整常数 2.5s0 是

2.5*s0

∣∣^θi∣∣≥2.5s0 的效果 ^θi 将被修剪。下面是标记为 TRUE ( x1,x2,x4,x2:x4)的效果

abs(eff)<2.5*s0

然后将 PSE 计算为这些值中位数的 1.5 倍。

PE <- 1.5*median
PE

ME 和 SME 是

ME <- PE*qt
ME

PE*qt(p =(1+.95^{1/15})/2,df=(16-1)/3)

因此，效果的 95% 置信区间为：

lor <- round(ef-ME,2)
uper <- round(ef+ME,2)
kable(cbind)

具有 ME 和 SME 的效果图通常称为 Lenth 图。PSE,ME,SMEPSE,ME,SME 的值是输出的一部分。下图中的尖峰用于显示因子效应。

Plot(fat1,cex.fac = 0.5)

该选项 cex.fac = 0.5 调整用于因子标签的字符大小。

R语言两层2^k析因试验设计（因子设计）分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)

因子设计相对于一次一个因子设计的优势

非重复因子设计中的正态图

正态分位数图

示例 - 研究化学反应的设计

半正态图

Lenth 方法：检验没有方差估计的实验的显着性

热门文章

最新文章

相关课程

相关电子书

相关实验场景