美國生理學會(American
Physiological Society, APS)其相關期刊有650種。在2004年,由Curran-Ever與Benos兩位教授,撰寫一篇如何在學術期刊上針對統計分析進行報導。這份報告引起許多評論,因此在2007年又有一篇綜合意見。兩篇文章出處如下:
1.
Guidelines for reporting statistics in journals published by the
American Physiological Society , Adv,. Psysio. Edu. 28:85-87., 2004.
2.
Last word on Perspectives” Guidelines for reporting statistics in
journals published by the American Physiological Society “, Adv Psysio.
Edu. 31:306-307, 2007
兩篇文章之內容綜合介紹如下:
指引1:試驗設計如果有問題,與統計專家討論
試驗設計,數據分析,結果討論此三份都是交互影響。在進行試驗設計十過程與統計學家可以協助定義實驗的問題。數據收集過程,統計學家可以評估統計之假設條件是否合乎要求。
指引2:依據研究目的,定義適當的顯著水準P。
對統計檢定而言,如果得到的顯著水準P值小於臨界值α,代表此試驗影響為顯著。
如果試驗目的是提出一個新發現,α=0.1比數適當。因為α=0.1,代表得新發現的機率增加。
如果α=0.01容易使得試驗結果合乎現有之定理。
指引3:確認統計方法,將引用的教科書或評論(reviews)於參考文獻中註明。
使用的統計軟體要加以列出。
指引4:對於多重比較要加以控制。
以ANOVA進行多因子之影響性檢定,如果某一影響因子為顯著。在此影響因子中各不同處理彼此是否顯著差異需要進行多重比較。多重比較的檢定方法需要控制。
指引5:使用標準偏差以數報導變異量。
一組觀察值的變異程度由其平均值與其標準差所表示。此標準差反映母群平均值的理論變異程度。
標準差量法適當的反應出觀察樣本的變異值。如果試驗數據為N個量很大的觀察值,其母群為常態分佈,標本的標準差即為母群的變異量。標準差在計算信賴區間時十分有用也十分重要。
母群與樣本的標準差表示符號不同,母群為SD(standard
deviation),樣本為SE(standard
error
)。如果對一常態分佈族群取樣點為無限,其變異量σ以SD表示。如果取樣數目數為n,樣本之標準差為SE=σ/√n。
醫學期刊要求以±標準差加以表示,例如血壓值為115mmHg(SD10)。
指引6:使用信賴區間表示不確定度
以信賴區間表示量測的不確定度。信賴區間之計算與可信賴水準(α)相關。α=0.01,信賴水準99%。信賴區間計算值為[-19,-3],代表此量測值有99%的機率,範圍界於-19
與
-3之間。
指引7:精確的數報導P值
精確的P值意義如下:P=0.057與P=0.57此種方式比P>0.05,
P=NS*”更有意義。精確的P值對統計結果之解釋更有意義。
表1.
P值之解釋 |
P值 |
解釋 |
P>0.1 |
試驗數據代表無影響 |
0.05~P~0.1 |
數據可能有真正的影響 |
0.01<P~0.05 |
數據代表有明顯意義,有真正的影響 |
P~0.01 |
數據有強烈的意義,真正有影響 |
如何解釋統計結果?
在一項試驗中,有三種治療心臟病的藥劑,每組試驗共有25個對象,信賴度為99%。以血壓的改變作為藥效依據。統計之結果如下:
藥劑 |
樣本標準平均值 |
樣本 |
P值 |
信賴區間 |
A |
-20 |
18 |
<0.001 |
-30 to -10 |
B |
-0.2 |
18 |
<0.001 |
-0.3 to -0.1 |
C |
-20 |
18 |
0.07 |
-50 to 10 |
對A藥劑,降低血壓20mmHg,P<0.001代表此改變為顯著。其信賴區間為10~30mmHg,代表此種血壓降低對治療具體有效。
B藥劑降低血壓0.2mmHg,在統計有顯著意義(P<0.001),信賴區間為0.1~0.3mmHg。對真正治療意義不大。
C藥劑減少血壓20mmHg,但是統計上不顯著(P=0.07)。信賴區間代表此藥劑血壓增加10mmHg至降低50mmHg。而且此信賴區間範圍大,代表統計量無意義。因此需要執行更多的試驗。
信賴區間的上下限與範圍其意義係應該由各領域專業進行判斷。
指引8:數據的位數與科學意義的相關性。
數據的位數往往來自儀器的解析度。但是這些解析度與科學意義如果不相關,則不需要有太多位數。
例如血壓計設值為115.73mmHg.
要如何報導此數據?例如115.73,
115.7或是116
mmHg? 解析度0.01或0.1mmHg有否實質意義?同樣地,pH值解析度0.001與0.01
pH有何差別?
指引9.
在摘要(Abstract)對每一個主要結果需報導信賴區間與P值。
(結論)此指引加以歸納如下:
1.
以適當的統計程序進行分析,並在論文內容說明此方法。
2.
以SD
(standard
deviation)以報導樣本差,不要使用SE(standard
error)。
對於統計結果,要刊出信賴區間與P值。 |