最簡單的實驗設計方式:完整設計complete design

觀察到兩現象中間的相關性或差別是研究推進的基本步驟,我們規劃實驗戰略決定所要取的論證為何,規劃待檢驗的參數(因子)決定觀察對象,設計控制組決定因子、水準的改變是否造成差異。

良好的試驗設計可以幫助我們決定更佳的試驗水準、試驗組數,並檢視 “差異” 究竟來自於因子、水準,亦或是來自於誤差、因子交互作用,因此試驗設計為研究生的必修課。

本文講述最簡單的實驗設計方式:完整設計complete design

先修概念:因子 & 水準

先介紹因子與水準兩個重要觀念

因子:實驗中欲探討之因素、參數

水準:因子的多寡、因子量

舉例而言,今天我欲探討NaCl、KCl兩種鹽類的不同濃度組合對於植物B生長之影響, NaCl 使用90, 200mM,KCl使用50,100,150mM 三種鹽濃度來處理植物,每測試作三重複,於是我有:

  • 兩個因子:NaCl、KCl
  • NaCl因子兩個水準:90, 200mM
  • KCl因子三個水準:50,100,150mM

有了因子和水準的概念,後續試驗設計的理解才能順暢

完整設計的定義

將所有因子的水準完整組合做同數重複測試,稱為完整測試,以下是完整設計的設計表:

統計項目代號
因子A的水準數m
因子A的重複數 nA
因子B的水準數 k
因子B的重複數 nB
………重複到所有因子完畢
總實驗數N= nA*m+ nB *k……
完整設計complete design試驗表

看起來很複雜,其實就是所有的 因子數*水準數*重複數 的全部組合,通常為求方便所有因子的重複數會一樣(nA= nB =n),則總實驗量N=n*m*k,以前述鹽類處理的範例而言:

統計項目代號
因子A的水準數 (NaCl的水準數,90, 200mM)m=2
因子A的重複數 (NaCl的重複數,三重複) nA=3
因子B的水準數 (KCl的水準數,50, 100, 150mM) k=3
因子B的重複數 (KCl 的重複數,三重複) nB=3
總實驗數N=2*3*3=18
鹽類範例的完整設計complete design試驗表

透過這種方式可簡單計算出單次試驗需做的實驗總量,並顧及到在固定因子下所需的控制組不會遺漏。

例題:若需欲探討5種益生菌,分別使用4種菌數的組合,每組做三次,對某種壞菌E做生長抑制測試,請說明因子、水準、重複數分別為何? 總實驗數為何?

完整設計的類型與處理

無重複取樣分析

統計項目代號
因子A的水準數 (NaCl的水準數,90, 200mM)m=2
因子A的重複數 (1)1
因子B的水準數 (KCl的水準數,50, 100, 150mM) k=3
因子B的重複數 (1)1
總實驗數N=1*m*k
N=1*2*3=6

重複數n=1的分析,這是最簡單的實驗設計,仍然可以針對因子進行分析,但會有兩個缺點:

  1. 只能確定檢驗的對象 (特定因子水準組合間) 確實造成差異,但不確定誤差來源為何 (是兩因子交互作用或隨機誤差)
  2. 重複n=1的取樣是否真能代表母體? 這是很大的問題

水準重複設計

統計項目代號
因子A的水準數 (NaCl的水準數,90, 90, 200mM)m=2, 其中一種做2次
因子A的重複數 (3)3
因子B的水準數 (KCl的水準數,50, 100, 150mM) k=3
因子B的重複數 (3)3
總實驗數N=3*(m+k)+多做的*組合數*重複數
N=2*3*3+1*3*3=18+9=27

以鹽類實驗為例,若我在同一次實驗中將 NaCl的水準 90mM重複兩次就是水準重複設計,當研究生為求保險多做一份材料時,就會出現這樣的設計。

由於90mM的水準是重複的,實際分析時應將兩次90mM的水準取平均做估計,但實際上我需要做的總實驗量相當於n=3,m=3,k=3的實驗。

分版分析

分版分析指的是同樣因子水準設計下做了多次的實驗,每次的結果視為一版(replicate),也有人稱為批次間差異 (batch),研究生實驗量大欲切分或是被指導教授要求重現實驗時就會出現分版分析

若我將同樣的鹽類試驗做兩次,則稱為兩版,可以分別分析各版版內差異與各版版間的差異

多因子完整分析

若欲考慮第三、四或更多種鹽類的添加是否也會對植物B生長造成影響,則亦可用完整設計計算總實驗量。此時,總實驗量為 (總因子數*各因子水準數*重複數)。

然而,隨著重複數、因子數、水準數的上升,完整設計的實驗總操作量N會急遽上升,不符合經濟效益。對此問題,可用直交設計 (orthogonal design) 來設計實驗解決。

參考著作

張伽臨. (2002). 實驗統計原理 (ISBN:9789578324602nd ed.). 九州圖書.