在許多醫學研究數據中,標準差(standard
deviation, SD)與標準偏差(the
estimated standard error of the mean, SEM),常常被使用以代表數據的特性與解釋統計分析結果。然而後者常常被誤用。
Source:
Lee et al., 2015, Standard deviation and standard error of the mean,
Korean J. of Anesthesiology, 68(3):220-223.
一堆數據如果其沿著一個特定值而均勻分佈,此稱為常態分佈。常態分佈是進行參數統計分析的基本條件。代表數據有向中央集中之趨勢。然而要代表這個分佈的形狀,只有一個"平均值"此數據還是不足。在醫學文獻,除了平均值(mean),還需要標準差與標準偏差值。
醫學研究中對一個族群(population)進行研究,然後自此族群(母群)取出樣本以進行假設試驗。只要取樣過程是不偏,而且有足夠的樣本數目,取樣樣本也是常態分佈。對所有常態分佈的數據,樣本分佈特性可由平均值與變異量代表。變異量之數值為標準差,代表觀察值與平均值之差異性。如果數據的散佈都是接近平均值,代表此變異量減少。但是變異數(Variance)其單位與平均值不同,因此以標準差與平均值比較是更有意義。
樣本:X1,X2,--Xn,根本數目n。
平均值=
/n
變異數(Variance)
= 2/n-1
SD =
因此常態分佈以平均值與標準差表示是更有意義。在常態分佈圖上,68.7%的觀察值是落在平均值±1個標準差值之範圍。95.4%數據位於平均值±兩個標準差之範圍。因此許多文獻都是報導平均值與標準差值。
在醫學研究文獻中,樣本代表一系列來自母群觀察的數值。因為試驗過程無法對母群進行全面試驗,因此自母群中取樣進行試驗十分重要。在研究進行之前,要針對研究計劃以估算所需樣本數目,所抽樣之樣本只是整體母群的一小部份,因此樣本平均值僅是母群平均值的一個評估值。
對母群內進行取樣研究,每次試驗此樣本群內的數據並不相同。例如第一組取樣30個,第二組也取樣30個,第三組取樣30個。自第一組至第三組,每組數據的平均值與標準差值都不相同。不同組的樣本數值,稱為樣本分佈,也是一個常態分佈。每一個樣本分佈其標準差可以加以計算,稱為標準偏差。標準偏差值由母群的變異量與取樣的樣本數目所決定。母群的變異量大,樣本分佈的變異量也大。但是只要樣本數目增加,樣本平均值更接近母群平均值,標準偏差值更小。標準偏差用來代表樣本平均值接近的程度。但是實際上,往往每一次只有自母群取樣一個樣本。因此標準偏差則由標準差與樣本數目加以估算。
標準偏差
=標準差/
一個母群平均值之評估方法往往使用信賴區間此概念。最常使用為95%的信賴區間。例如95%之信賴區間,為
EQ \x\to(X)
±1.96*標準偏差。用來代表母群平均值95%機率下會出現在那些範圍。換言之,平均值自100個樣本所計算之數值,有95個數據在此範圍,5個數據在範圍之外。以統計方法比較不同組的數據群,研究人員估計各樣本之母群,並且檢查是否相同。這個情況下,標準偏差用以代表樣本之變異,用以估計母群之平均值。藉由預先設定之顯著水準(Pre-set
significate level),評估樣本在誤差範圍內能否代表母群。
標準偏差值一定小於標準差值,標準偏差值來自標準差值除以開根號之數據數目。因此研究人員偏愛以標準偏差值描述其樣本。如果兩組數據之數目相同,以標準偏差或標準差之比較結果是相同。然而樣本數目十分重要。合理的樣本數目才能得到合理之統計推論。例如母群變異數如果極大,標準差值一定變大。如果樣本數目增大,標準偏差值變小,此情況下使用標準偏差進行統計推定(descriptive
statistics),容易造成推論錯誤。這在醫學研究上十分常見,因為醫學研究先天就存在內在與外在的個別差異。
本文作者檢查Korean
Journal of Anesthesiology 第6卷1-6期共有36篇實驗研究,發現許多不當使用標準差與標準偏差之個案。例如進行統計推論,只有一篇使用95%信賴區間,但未述明樣本數目。36篇論文,只有一篇研究曾進行常態分配檢定。所有36篇論文使用標準差值,樣本數目或百分比以描述統計結果。但是在圖形(figures)並未標誌平均值,標準差或四分區間(interquartile
range),16篇論文使用樣本數或百分比,但是未使用信賴區間。有兩篇論文使用信賴區間,有一篇論文是錯誤使用,作者建議在論文評審過程必需加留意,以免妨礙數據正確判讀。
《評論》
標準差反應了數據常態分配下之變異,標準偏差代表一個取樣樣本分配下樣本平均值之差異。使用標準差與常態分配測試與描述樣本特性有相關。但是使用標準偏差與信賴區間,只要樣本數目合理估計,更合理進行統計檢定。以標準偏差配合樣本數目,對於統計結果之報導更為有用。
|