此篇文章為生醫研究與統計方法之系列文章。文章篇名「Descriptive
and inferential statistical methods used in burns research」期刊資料:BURNS,2010,36:343-346。文章內容整理如下。
一、緒論
近年來,燒傷研究愈來愈加複雜。如果沒有統計的基本知識與實驗設計,對於燒傷之研究資料難以評估。
關於研究設計與生物統計完整的知識,已經成為一個醫學人員撰寫適當的醫學文獻不可缺少的知識。但是醫學研究者在大學與研究所階段,對於統計的應用訓練並不足夠,造成他們無法探查統計上的錯誤,在實驗設計也缺乏可信度。許多醫學研究者對於統計理論認為其概念難以學習,因此對於統計應用認為是一種艱難的挑戰。
為了有共同的標準,投稿於醫學研究之期刊,在其指引中也有如下引述:
「the
Uniform Requirements for Manuscripts Submitted to Biomedical Journal
(URMB),”Describer
statistical method with enough detail to enable a knowledgeable reader
with access to the original data to verify the reported results」。
此篇文章之目的在於針對2007年出版有關「Burns」之期刊,討論其敘述與推論方法,針對此研究領域成員提出建議。
二、方法
針對2007年於「Burns」期刊發表之論文,探討其研究目的與實驗設計,使用的統計軟體,使用的敘述統計與樣本數目,與其採用的統計方法型態。
三、結果
在2007年的「Burns」期刊,有51篇論文使用統計分析。22%為任意性控制試驗(randomized
controlled trials)35%為Cohort研究,22%為個案控制研究(Case
Control studies)22%為個案討論。
所有的論文都採用連續性數據與敘述統計。有96%採用推論性統計。59%以標準差代表數據的分散性。37%有註明平均值的標準差。65%有說明所使用的統計軟體。88%註明其使用信賴度,但是57%標示其信賴區間。最常使用的六個統計方法為:t檢定(53%),ANOVA或ANCOVA(35%),χ2試驗(27%),Wilcoxon
& Mana-Whitney test(22%),Fisher’s
exact test (12%)。
在2007年的Burns期刊,其49篇論文使用的統計方法,細分如下表
統計方法 |
|
採用之論文篇數 |
|
比例 |
Student’s t-test |
|
26 |
|
53 |
Contingency tables |
|
(19) |
|
|
χ2 |
|
13 |
|
27 |
Fisher’s exact test |
|
6 |
|
12 |
ANOVA/ANCOVA |
|
16 |
|
33 |
Nonparametric test |
|
(13) |
|
|
Mann-Whitney |
|
8 |
|
16 |
Wilcoxon |
|
3 |
|
0 |
Kruskal-Wallis |
|
2 |
|
4 |
Confidence intervals |
|
9 |
|
18 |
Multiple comparison |
|
(20) |
|
|
Bonferron: |
|
4 |
|
8 |
Turkey-Kramer |
|
2 |
|
4 |
Tamhane |
|
2 |
|
6 |
Dunnett |
|
2 |
|
6 |
Multiple Regression |
|
4 |
|
8 |
Pearson Product-moment
Correlations techniques |
|
2 |
|
4 |
四、討論
醫學研究愈來愈加複雜。研究人員對於統計如果只有知道百分比、平均值、標準差、眾數等敘述參數,對研究文獻內容的暸解將是有限。如果只暸解上述6個主要統計技術,也只能明暸70%的論文內容。
從事Burns研究者應該有統計之基礎。例如樣本的分散程度,通常以平均值和標準差表示,忽略了樣本本身的分散程度。分散程度應該是以平均值與標準偏差(Standard
error of mean)表示。在此調查中,只有37%的研究者使用標準偏差而不是標準差。
有49篇論文進行推論統計,只有37%有說明其信賴程度(Significance
levels)。其餘論文只是單純的列出P
< 0.05或P
> 0.05,或是只有說明不顯著「non-significant」。有關對P值之符號有4種,P、
p、
P、p平均值與標準差之間。有些使用「±」符號加以連結。有些則未連結。
最常使用的統計方法為t檢定。有53%的論文使用此技術。但是只有18%的論文有列出信賴區間。信賴區間的意義是表示任何真實影響的上下限。在「the
International Committee of Medical Journal Editors , ICMJE」有如下敘述:「When
possible, quantify findings and present them with appropriate indicators
of measurement error or uncertainty(such
as confidence intervals),and
“Avoid sole reliance on statistical hypothesis testing, such as the use
of P values, which fails to convey important quantitative information」
ICMJE推薦研究者要註明使用的軟體,此調查研究發現只有65%論文有標示。
由於Burns之研究也有使用非連續性,而是分類性數據,有27%的論文用非母數統計。有8%的論文採用多重迴歸以描述結果與多個原因的量化關係。
此篇評論研究的極限如下:1.只有探討2007年Burns期刊之文章2.不在「Burns」期刊發表的相關研究,並未加以探討3.列舉的統計技術,例如ANOVA其實包括更細分的統計應用技術。
由上述的調查結果,此篇評論論文對醫學研究者提出如下建議:
1.
醫學期刊論文的作者與讀者,都應該對統計方法有完整知識,以改善自身的能力進行實驗設計且可用以評估期刊文獻。
2.
醫學教育中應該提供完整的生物統計課程。以英國的「Inter-collegiate
Surgical Curriculum Pronged」為例,即要求Surgical
trainees對於生物統計要具有廣博且深入的知識,包括:暸解統計的顯著性與信賴區間,知曉如何應用參數、非參數、多變方與卡方分析。在美國、德國等國家,都提出大多數的residents在clinical研究領域,也都缺乏統計學理。
綜合其他評論文章,對於醫學人員所需要之統計學理。此篇文章作者提出醫學域統計課程之相關主題如下表
表2
醫學領域之相統計課程內容 |
1.
基本統計概念與研究設計
2.
敘述統計(Descriptive
statistics)
3.
推論統計(Inferential
statistics)參數與非參數
4.
t檢定,χ2(卡方)分析
5.
多變方,相關,迴歸
6.
特殊數據的適合性(Suitability)
7.
常見的差錯與錯誤(Pitfalls
and errors)
8.
統計之誤用(Misuse
of statistics)
9.
生物統計之應用練習(Exercises
in applied biostatistics) |
|