預實驗能在執行主實驗前,幫助我們用較小的代價先行測試,是一種穩健的研究方式。預實驗我們會寫一系列文章詳細介紹,可參考:4.2 預實驗系列

本周所介紹的篩選型預實驗,是能夠快速在限定範圍內找到目標對象的預實驗方式

分離並選取:篩選型預實驗

篩選的定義,是在限定範圍內 (常稱為pool、池子),以一或多個篩選基準區分出目標與非目標的差異,從而分離並選取想要目標的動作。這裡提到的非目標可能是基質、干擾物、無關物等。

白話來說,只要你想區分兩個以上的東西,或是在一個範圍內大海撈針找某個東西,就屬於這類型

舉個例子,若我現在想帶朋友吃附近的美食

  • 我將附近定義為 “中山區” 就是限定範圍
  • “價錢不要太貴”、”最好是泰式料理” 就是篩選基準
  • “平價泰式料理” 就是 目標
  • “昂貴西式牛排” 就是 非目標
  • “昂貴泰式料理”、”平價西式牛排” 也算非目標,但實際在篩選時會因為評分的比重讓兩者有先後之分

你可以從上述的例子看出來,所設定的篩選基準就像是一把尺,而這把尺的位置會直接影響到篩選型預實驗的結果,我們可以從以下兩方面來找到這把尺:

  • 內生性:根據原本的狀態直接分辨
  • 外添加:外界造成改變,根據兩物對改變的反應不同來區分

舉個例子,現在我想區分一碗鹽與沙的混合物

  • 內生性的方法:沙子的顏色(沙與鹽的顏色天生不同)
  • 外添加的方法,將整碗溶於水後過濾(沙與鹽對於加水後,反應分為可溶與不可溶)

然而無論是質或是量,研究對象的外部因素通常遠比內部因素好控制。假設我想觀察小鼠體內胰島素的降血糖效果,與其等小鼠自己的胰島素發揮作用 (內生性),不如直接注射胰島素可以得到比較穩定的結果 (外添加)

因此篩選型預實驗的實際運用,常以「外加某些因子,阻止不想要反應的出現,最後留下來就是我要的」這種形態來處理。

同樣以沙與鹽的例子解釋,如果我希望找到能不溶於水的物質,那我就會加水(給定條件),去除可溶物鹽(不要的),最終留下不溶於水的沙(目標)

篩選型預實驗的應用

這種預實驗的應用相當廣泛,在研究題目的開頭(尋找研究對象)或是中程(尋找跟研究對象有關的物質)都有,就我的領域內主要有兩大方面

體學

如蛋白體、代謝體、基因體等體學,在概念上都屬於篩選型預實驗的範疇。

  • 限定範圍:設定在某一個環境下 (某種生物、變異株或經過某種處理)
  • 篩選基準:某個物質的表現量等,蛋白體就是蛋白質、代謝體就是代謝物、基因體就是基因表現量
  • 目標&非目標:可能是表現量>或<原來的某個程度,或是相對於標準基因的表現量

篩選變異

只要設下標準,並且能觀察到差異就算這類,在生物學上有極廣的應用,族繁不及備載,舉幾個代表:

  • 顏色差異:藍白篩、用顏色篩選色素產量
  • 抗性差異:用殺草劑、抗生素篩選基因轉殖的植物、細菌
  • 表型差異:孟德爾的豌豆、基因缺陷株的外表
  • 營養缺陷:無法自行合成某種營養的菌株、吃到某種營養會自滅的菌株等,如酵母菌雙雜交

影響數據解讀的因素

篩選型預實驗有許多注意事項,且每一項都可能嚴重影響數據解讀,建議逐項看完

篩選型預實驗天生有較高的代換失效風險

我們必須知道的是,篩選型預實驗的結果是在一對多而非一對一環境下所得到,這本身隱含著一個假設前提 “目標在一對多的情況下,表現、狀態和一對一相同”

每多出一個假設,就會多出一分錯誤機率,這是篩選型預實驗的必然缺陷。想要快速一對多的全看就得犧牲正確率,想要慢慢一對一的確認就得犧牲速度,有一好沒倆好

此外,一對多與一對一最大的不同在於,一對多還牽涉到 “多” 的交互作用,這在一對一的狀態下是沒有的,而這個 “多” 可以在很多方面影響結果:

  • 多個因子交互作用,產生的效果比單一因素大,因此超越篩選門檻勝出 (善於烙人)
  • 不相干的因子遮擋調目標物的機會,可能是無關物太多、無關物抑制目標物等原因

由於這個 “多” 造成的變化太多了,很可能得出來的結果是遭到干擾的,僅憑一個篩選預實驗的結果就往後頭做是很危險的,尤其在原先的一對一實驗還是經過多層代換的情況下更是如此。

舉個例子,酵母菌雙雜交試驗是用營養缺陷基因來篩選出目標酵母菌,簡略的論述結構如下:

  1. 沒有營養基因的酵母菌會餓死
  2. 基因轉殖會將目標基因與營養基因一起送給酵母菌
  3. 如果酵母菌有營養基因,他應該不會餓死且具有目標基因
  4. 所以沒餓死的就是有目標基因的酵母菌

可以看到我們並不是直接觀測 “目標基因的存在” 來決定結果,而是經過了如下的代換:

“目標基因的存在”>>>”營養基因的存在”>>>”不會餓死”

在這個代換鏈上,任何一點不成立都會導致錯誤的結果。這僅是一對一確認的情況下,如果加上篩選型預實驗的 “一對多” 就會變成:

“目標基因的存在”>>>”營養基因的存在”>>>”不會餓死” >>> “一對一與一對多的結果一樣”

明顯這條代換鏈的錯誤風險是更高的,多背了一個代換的風險,更悲劇的是在實際狀況中證明 “一對一與一對多的結果一樣” 這個代換的錯誤率超高

為了對沖掉較高的代換失效風險,即便我們在篩選型預實驗中得到正面結果,也別太快做出正面結論,一定得再用多個方式一對一的確認篩選出來的目標確實是我們要的東西

小心決定你的篩選基準

篩選型預實驗的成敗就決定在篩選基準的那一刀,拿了不對的篩選基準、設定了不對的篩選水平,不但會造成執行、分析、確認上的困難,還會造成不必要的偽陽性與偽陰性。

因此,在開始實驗前請想清楚以下三個問題:

  1. 你要選甚麼當作篩選基準? 白話說就是你想拿甚麼當刀?
  2. 你需要幾個篩選基準? 白話說就是需要幾把刀?
  3. 你的篩選水平要多高? 白話說就是那一刀要切多高?

第一個問題很直觀,正如我們想找到尼斯湖水怪,我們不可能拿 “有陸地的地方” 作為篩選基準,這無異於緣木求魚,篩選再多次都找不到

第二個問題,選用基準的數量是門藝術,用的好可以大幅降低工作量

如果我們用很多篩選基準,固然可以增加篩到正確目標的機率,但反過來看正確目標偶然表現不好被誤殺的機率也越高 (偽陰性高)。反過來說若只用一個篩選基準,可以阻止誤殺但可能會留下非目標物 (偽陽性)。

我們用前述的泰國料理例子來解釋:

  • 我原先設定了”價錢不要太貴”、”最好是泰式料理” 兩個篩選基準
  • 如果我改成只設定平價,那 “昂貴泰式料理” 這個非目標就會被囊括進來

第三個問題在體學上相當重要,比方說基因高表現量要原先的2.5倍還是3倍? 這個分界線的位置很可能就增加 (減少) 成千上百個基因的去留。畫得太低得到幾千個基因做不完,畫得太高一個都沒有也沒意義。

適當的篩選水平可以參考前人文獻,對於較便宜的實驗也可以使用觀測型預實驗來抓合適的觀測水平[預實驗系列]—詳解研究中的觀測型預實驗

目標與非目標的辨識

我們前述談的都還是能透過篩選基準確實分辨的情況,篩選的一刀下去不會藕斷絲連,也沒有灰色地帶,是0就是0、1就是1,屬於全有全無率

然而事與願違,很多時候事情是有灰色地帶的,一個反應不會只有0或1,也可能有0.2、0.7的出現,在這個情況下篩選基準就不一定切的乾淨,或是切乾淨的訊號會很難辨識,那就麻煩了

用藍白篩做例子,我們用菌落顏色的 “藍” 、”白” 當作篩選基準,如果全藍、全白就能挑出我要的菌落

但是如果是灰藍呢? 內藍外白呢? 多藍算是藍? 多久變藍才是藍?

我用 “藍白” 當作篩選基準很明顯是無法切乾淨的,因為菌落的 “藍白” 並非全有全無,內藍外白就屬於0.7的例子

用數值來當基準會好一些,但在邊界上的數據會不好辨識。比如你的標準是2.5倍,那2.497倍要四捨五入還是直接刪掉?

除了灰色地帶的影響,檢測方法的LOD、LOQ也會大幅影響辨識效果,如果反應的水平在測不到、測不準附近的話,篩選出來的候選人錯誤率會大增

舉例而言,假設我想計算某張股票的總交易次數,但我只能監測到單筆交易>2張的交易次數 (LOD)。如果許多人們喜歡只交易1張股票 (反應水平),那我忽略這些人們就會嚴重低估總交易次數