各位可能都聽過教授這樣說過:
- 做實驗要能夠重複啊!
- 學長也做過的東西你們怎麼做不出來??
- 你這個結果能夠被重複嗎?
- 你這個有沒有做生物性重複或是技術性重複?
一大堆名詞有聽沒有懂,其實以上教授所提的,全部都是精密度的概念,這也是我們今天的主題
什麼是精密度precision?
根據食品化學檢驗方法之確效規範,裡面關於精密度的敘述是這樣的:
同一均質樣品,多重取樣,特定條件下所得系列檢值之接近程度
白話文來說,在同一個均勻樣品,用同一種取樣的方式取得很多個樣品,然後利用同樣的實驗方法(包括萃取、檢測、數據處理、判讀結果等),這樣子的方式所得出來的最後實驗數據他們的接近程度如何,稱做精密度
但是精密度其實包含不只一種概念,他還可以根據實驗批次的不同與執行的實驗室進一步區分為以下三種不同概念:
- 重複性 (repeatability):同一實驗室、同一批次的結果
- 中間精密度 (intermediate precision):同一實驗室、不同分析日期、人員、設備的結果 (只要不是同一批次做的,都屬於中間精密度)
- 再現性 (reproducibility):不同實驗室的結果
如何知道實驗數據的精密度如何?
標準的作法(國家法規規定的檢測標準),是利用你想要特定的物質的標準品,加入類似樣品基質的空白溶液來進行測試。
透過單一一次試驗同時比較這些標準品,在你的處理之下,你所得到的檢測值之間的差異程度,就稱為重複性。
其中標準品選定的測量濃度通常是在LOD或LOQ之2-10倍濃度範圍內,任選2個濃度、每個濃度做五是重複的測試。再透過前面所提到的重複性、中間精密度、再現性的定義,決定你所得到的是哪一種精密度的意義。
在食品化學檢驗方法之確效規範中,會根據所含目標物質的含量,決定符合精密度的再現性、中間精密度、再現性的變異係數 (CV,數據組的標準差/數據組的平均值)上限。一旦你的結果之間差值超過所規定數值,就可以看成是精密度出問題了
濃度範圍 (ppm) | 重複性 (CV%) | 中間精密度 (CV%) | 再現性 (CV%) |
>=1 | 10 | 14 | 16 |
0.1-1 | 15 | 18 | 23 |
0.01-0.1 | 20 | 22 | 32 |
0.01-0.001 | 30 | 32 | 45 |
<0.001 | 35 | 36 | 53 |
可以看得出來,不同樣品濃度與精密度的類別,都會影響到他容許的變異係數上限,容許的範圍,又以再現性》中間精密度〉重複性。然而即便是最小的重複性差值,也可以容許10 %的差距。
也就是說,你實驗數據的標準差/數據平均值,即便差到10 %都屬於正常範圍。在極低濃度的再現性的情況下,甚至可以容許到53%。
換言之,可容許的差距範圍取決於你實驗要探討的精密度類別,並非所有濃度、所有情況都有一個統一的標準
你可以透過表一與自己要確認的精密度類別,來判斷你或學長姐或教授對數據的差距要求是否合理,也可以在你除錯時拿來作為評估結果穩定性的基準 (可配合[實驗設計] — 學長,我的實驗有bug! 教你用5M1E框架在3分鐘內找到可能原因)
那大家常說的各種重複,到底是屬於哪一種觀念呢?
這裡我舉一個例子來解釋比較清楚
假設今天我想做一個生理實驗P,P實驗的設計如下:
- 有兩個因子要確認:a、b
- 兩因子各有兩個水準:i、j
- 每一種組合我都取n個樣本來做平均值
- 每個樣本做t次,來取這個樣本的平均值
所以你每做完一次P實驗,你會得到:
- i*j個水準組合,這我們會稱為 “水準組合數” 或是 “實驗組數”
- i*j*n 個生物性樣本的數據,如果有聽過 “生物性重複” 的說法就屬於這一類
- i*j*n*t 個計算出來的數值,所謂的 “技術性重複” 、”重複測定” 屬之。
那真正的精密度是什麼呢,其實根據以上的定義,是透過比較t之間的差異來決定的,也就是更接近於技術型重複的概念。
精密度的迷思
透過這樣的概念,我們可以澄清常見的兩個迷思:
1. P實驗這樣的實驗設計組合有幾個重複數?
很多人常把P實驗的n、或t、或是n*t當作P實驗組合的重複數,或是想把 i 或 j 水準多做幾次來當作P實驗的重複數
但正確答案是,不好意思,一個。對,只有一個P實驗組合的重複。
想要正確的提高整個P實驗的重複數字,應該是把i*n*j*t這個組合全部再做一次,做M次才稱為有M個P實驗的重複。
其中第一次做的P,是同一實驗室,不同批次做出來的,所以稱為P實驗的中間精密度。如果其他實驗室要重複你的實驗,則稱為P實驗的再現性
2.多個技術性重複合併解釋是否可行?
許多人在每個實驗都作了幾個技術性重複,想把這些技術性重複拼起來一起解釋,這樣是否可行?
以上述例子,P實驗的a因子假設要做6重複,但是我這次失敗了,只得到四個重複結果,我可不可以另外做兩個重複的數據,然後與這四個重複一起合併分析?
一般可能會認為,4+2=6,又都是做一樣的事情,應該是可以的吧?
其實是不合適的
透過上面精密度的概念,這兩個小實驗其實屬於不同批次的操作,得到的結果也是屬於中間精密度的概念。但是如果你全部一起做,是屬於重複性的概念,兩個在數據上的意義是不同的,並不能拿來直接比較
但是考量到碩士班學生的畢業進度比較吃緊,有時候真的沒辦法也是看到許多人會這樣做,但是在時間充裕的情況下並不建議
P.s. 我覺得生物性重複的說法相當不合適
- n既不能代表來自母體的重複(因為他不是來自於母體的「同一均值樣品」)
- n也不能代表我對於這個生物性樣本的重複(同一生物性樣本取樣多次,這個重複的概念比較像是技術性重複)
- 也就是說n並沒有 “重複” 的概念,直接稱n為「來自某族群的樣本」在概念與定義上會清晰的多
但是仍然有教授會這樣子說,那我還是介紹給大家聽,至少你要能明白教授想要講的是什麼
想做好重複很累吧?
但是這是能確保實驗結果能被再現的重要關鍵,忽略了這點,就容易造成常見的 “做不出學長姐的實驗結果”、”為甚麼做兩次實驗,同一個基因的表現量跟上次不一樣,上次有差這次沒差?” 等鬼打牆的事情,又或是被要求了嚴苛的數據精密度而不自知。
複習一下本文的重點
- 精密度的定義:同一均值樣品,多重取樣,特定條件下,所得系列檢值之接近程度
- 精密度的類別:重複性、中間精密度、再現性
- 精密度的做法:標準品加入空白樣品,2濃度5重複,查表
- 精密度的迷思:實驗組合的重複數、重複是否能合併解釋
1 Pingback