此篇論文出自
Biochemia Media 2015; 25(1):5-11
篇名:The
misuse and abuse of statistics in biomedical research
作者:Matthew
S. Thiese, Eachary C. Arnold, Skyler D. Walker
生醫研究其產出論文係來自適當的實驗設計,高品質的量測,適當的選擇與應用統計方法,與正確的解釋分析結果。生物統計是件工具,用以評估生醫研究結果之間的關係。對於科學研究這是一種基本學識。然而統計的概念或應用有可能是適當的使用,誤用,或是濫用。自1980年代研究人員開始關心此問題,包括使用統計方法進行評估時缺乏完備的試驗計劃。除了不適當的實驗設計,更加上數據收集與分析的問題。以前在論文中很少有所描述。近年來生醫研究界對此提出許多建議。
-
1. Mother D, Schulz KF, Altman DG. The CONSORT
statement: revised recommendations for improving the quality of
re-ports of parallel group randomized trials. BMC Medical Research
Methodology 2001; 1:2.
http://dx.doi.org/10.1186/1471-2288-1-2
-
2. Bossuyt PM, Reitsma JB,Bruns DE, Gatsonis CA,
Glasziou PP, Irwig LM, et al. The STARED statement for reporting
studies of diagnostic accuracy; explanation and elabo-ration. Ann
Intern Med 2003;138:
W1-12.
http://dx.doi.org/10.7326/0003-4819-138-1-200301070-00010.
-
3. Von Elm E, Altman DG, Egger M, Pocock SJ, Gtzsche
PC, Vandenbroucke JP.
The Strengthening the Reporting of Observational
Studies in Epidemiology (STROBE) statement: guidelines for reporting
observational studies. Prev Med 2007; 45:247-51.
http:// dx.doi.org/10.1016/j.ypmed.2007.08.012.
電腦統計軟體其內容複雜性逐漸增加,有更多種數據可進行分析,因此生醫研究中統計技術之使用也為之增加。但是各種統計錯誤也因此逐漸增加,統計之誤用也是如此。生醫研究與生物統計學家之交互連結仍然不佳。統計學界本身在方法論也有不同的意見,例如
Frequentist 與
Bayesianist,或是不同統計學家
(Ficher, Neyman, Wald等)
各提出不同的方法。因此統計軟體則列舉所有的方法,必須由數據型態與每個統計方法的相對強度以選擇適用方法。絕大多數研究人員對於統計的誤用是來自對於需要的統計數據缺乏專業知識或是實驗方法不當。近年來,一項對
systematic review 與
Meta-analysis
之評論研究中發現有33.7%研究者承認犯錯,包括:修飾結果以改善產出之結論,對解釋引用的數據有疑問,故意扣除不適合方法論述或是分析結果,刪除一些不適用的數據,誤導報告之實驗資料及結果等。
針對流行病學研究中,經常誤用或是濫用的統計技術加以說明如下:
一、統計設計的錯誤,對數據的描述與呈現有錯。
為了得到有效的統計結果,每個統計試驗對其數據有其假設,例如類別,連續等。如果假設條件不合乎數據,其結果將產生錯誤,結果解釋也會誤解。此種因為數據型態假設錯誤,在研究過程每一階段都可能發生。甚至於一個單一的統計錯誤將造成研究結果完全無效。
統計在生醫的誤用主要原因是醫學學術界普遍對基本統計知識缺乏認知。
二、對離群數據之適當處理
離群(outliers)代表觀察值遠離預期值,可以以統計技巧檢查,例如平均值±三倍標準差之範圍,或是數據不合乎事實,例如BMI
> 65,或是在調查工作時呈現不合理。傳統上,離群數據必須刪除,因為對統計結果有嚴重影響,尤其樣本量愈小,影響性愈大。
然而研究人員在有意或是無意間,刪除有效的數據,那就犯了錯誤。因為數據的刪除可能只是微小的影響,也有可能導致無效的結果。有關離群數據的辨認或刪除至今仍有許多爭論。最佳的方式是對於產生此離群值之實驗條件再度進行試驗。然而在生醫研究中有許多因素限制,往往無法重複試驗。
三、針對常態分配檢定進行數據轉換
在生醫研究之試驗,數據可能是偏態(skewed)分配,需要使用不同的統計檢定。在生醫研究論文中,很少提供常態分配檢定之資訊。常態檢定可以以圖示或是統計技術進行。如果非常態分佈,可以採用非參數檢定或數據技術轉換。數據轉換之後統計技術容易進行,但是其結果難以解釋。
四、參數與非參數檢定
在牙醫研究期刊調查中,發現有50%統計結果為誤用。因為許多論文並未報導其量測數據,因此此誤用比例值應該更高。
許多檢定技術基於其假設條件。例如t檢定往往用來檢定二組連續性標本其平均值是否顯著差異。如果數據是成對呈現,則必需採用成對t檢定。如果非成對出現,使用之t檢定依據兩組樣本的差異數加以選擇。如果差異數相同,使用two-sample
t-test。如果變異數不同,使用modified
two-sample test。如果多於2組數據,則使用ANOVA。
五、先驗對後續之分析
透明(Transparency)-揭露(disclosure),
先驗事前(a-priori)對後續(post-hoc)分析決策。
研究的透明化在生醫研究逐漸重要。理想的研究方式是在完成所有的適驗或調查之後,再進行結論。而論文報導內容必須包含如何收集數據,統計分析之計劃,統計顯著性之值,還有相關進行之試驗。研究過程中往往出現一些問題,例如數據收集失敗,或是對數據有偏見的選用以得到預定之結果。這些數據選用的偏見,往往在期刊之內未見報導。
霍桑效應(Hawthorne
effects)在醫學研究經常出現。因為受測者知曉自己為樣本因此影響了調查結果。需要以預先規劃之方式以維持統計檢定之真實與強度。
有些誤用是為了滿足期刊之要求。因為有顯著差異之結果更容易被接受出版。因此使得研究者故意選擇一些特定統計方法以得到顯著的結果。數據的偽造,離群點的使用或刪除等,都將影響此結果。
一種exposure-outcome
的關係分析必須在數據收集前決定,此稱為先驗方法。數據收集過程可以更有效率。對假設檢定而言,先驗分析必須先決定。相對的,後續分析可用以檢查各變數關係是否存在與產生假設。但是後續分析往往未被包括於多變方分析用以觀察所有可能的因子關係。如果只有進行後續分析,而未表示是來自後續分析,統計就可能犯錯。顯著水準以,僅是代表統計顯著性之機率為5%。
六、流行病學與生物統計之建模
多變方迴歸經常用以控制各混淆因子與評估其影響性。在評估exposure與outcome的關係中,有許多混淆因子用以控制多變方模式。在多變方模式中要預先選擇變數,其藝術成分多於科學成分。純粹的建模統計技術,例如forward與
black ward
逐次建模法,都可能得到不同的結果。因此在建模之前,要依據專業知識訂定一些規則可以改善。
至今尚未有最佳之建模技術。但是事先良好的規劃,數據完善的收集,對於變數選擇十分有益。
七、有可能之混淆變數
1、在生物學理上似乎真實的因子,來自expose與outcome之因果路徑。
2、研究者自己懷疑有可能的因子。
八、數據收集前預先決定之決策標準
1、多變方模式之變數顯著水準(P-value)
2、進行共線性評估(collinearity)
3、得到最後結論之P值。
4、影響因子決策之P值。
九、結果之解釋
許多統計軟體提供大量的分析結果,但是必須藉由適切的解釋才能成為有用的論文。而且研究者必需瞭解隱藏著type
I 與type
II之錯誤。
P值必需預先設定,但是仍有許多因子影響P值。P=0.051與比較,不代表相互無關,可能是代表以此數據無法探查是否有顯著性。Type
II 之錯誤也來自偏差與缺少統計檢定能力。
十、如何對抗統計的誤用與濫用
近年來,流行病學之研究有許多改進。包括使用更可靠的統計方法,改善透明性,適當的解釋統計結果,及刪除的數據必須加以解釋。
近年來出版兩份指引,可用以參考:
1、Statistical
Analyses and Methods in the Published Literature “SAMPL Guidelines”
Sauerbrei W, Abrahamowicz M, Altman
DG, Cessie S, Car-Penter J. ST Rengthening Analytical Thinking for
Observational Studies: the STARTOS initiative. Statistics in medicine
2014.
http://dx.doi.org/10.1002/sim.6265.
2、Strengthening
Analytical Thinking for Observational Studies “STRATOR”
Lang TA, Altman DG. Basic
Statistical Reporting for Articles Published in Biomedical Journals: The
“Statistical Analyses and Methods in the Published Literature” or The
SAMPL Guidelines。”Science
Editors’ Handbook, European Association of Science Editors. 2013. |