資料來源:
Journal of
Cancer Research and Clinical Oncology
https://doi.org/10.1007/s00432-022-03956-9
Michal Ordak
摘要
近年來,在全球範圍內都觀察到醫學統計分析的負面情況。很遺憾地事實證明,這也適用於
COVID-19。對讀者和會員最重要的指導方針是這份投稿給Journal of Cancer Research and Clinical
Oncology的文章的作者,即關於與癌症相關的眾多因素,給出了統計分析之建議。
近年來,統計分析品質不斷下降。在醫學上已經觀察到了(Diong et
al.,
2018)。例如,最新數據表明,2600篇與COVID-19的各個方面相關的已接受文章只有39%符合統計正確性的要求(Ordak,2022)。流行病研究應該增加生物統計學家,參與在開發新方法中的作用以及用於COVID-19的指標的建模和預防(O'Nell,
2021)。
根據 PLOS 公佈的 2020 年數據,34% (36/107)
的期刊編輯表示他們很少 或者永遠不使用專門的統計審查。這個百分比 自 1998 年以來一直沒有改變,用以關心研究的可信度(Hardwicke &
Goodman,
2020)。因此對於成員教育似乎是正確的。對於期刊編輯委員會關於最常見的作者在統計分析方面犯的錯誤,以可能的方法來減少這個問題。
建議投稿Journal of Cancer Research and
Clinical Oncology的文章作者考慮到幾個原則。首先,作者向期刊投稿之前,
他們的統計分析應由專家審查分析。其次,作者需要在他們的信函以及投稿的稿件中,註明此事實,以通過提供資料對該評審人員的參考。三、建議作者考慮一些相關的因素在他們的統計分析(表1)。
文章讀者和作者的統計指南是投稿給Journal of Cancer
Research and Clinical Oncology。
首先不建議作者僅用一句話描述了一些統計檢定。為了更好地向讀者說明其選擇的統計檢定正確性,作者應該更詳細地了解它們的應用意義例如在比較三組患者之間,抗
SARS-CoV-2 抗體水準和疾病嚴重程度的關係)。這同樣適用於更高級統計的描述擴展與其使用的分析。
二、當使用非參數或參數等的統計檢定中,作者應注意使用適當的描述性統計。還應該解釋為什麼在這些特定的情況下使用此分析。例如,使用了非參數統計檢定(變數類型、分佈常態性、組相等性等)。不幸的是,在許多
期刊,作者經常使用錯誤同行使用的統計檢定,這可能導致對所得結果的解釋的不正確,因此得出不正確結論。這種情況的最終結果,可能是所獲得的研究結果的模棱兩可。(
Nahm, 2016)。
第三,在事後測試的情況下,僅僅寫一個一般性的句子是不夠的。有許多不同的事後測試,每個測試都有優點和缺點。一些測試更加自由,而其他測試則更為保守。在同一研究中的不同統計檢定可以產生結果完全不同(Lee
and Lee,
2020)。為此原因,作者需要使用特定的事後測試,例如未能滿足原來的假設變異數,應該描述他們為什麼選擇這個測試而不是另一個。由於這種類型的擴展描述,所獲得的研究結果的可信度將可顯著增加。
四、增加獲得研究結果的顯著意義。建議計算檢定力效果,即表明特定強度的統計。例如數據差異現象。這裡的一個例子是 Cohen 's d
measure、Hedges g、eta-square、Fi Cramer、Glass 's rank two-series
correlation
coefficient等。與p相反,這些效果的強度可以評估統計結果的實際意義,以及比較許多巨量分析研究的結果(Sullivan & Feinn
2012; Ialongo,2016)。
倒數第二條建議與異常值有關。異常值的存在可能在結果中有重要作用。異常值的存在可能導致誇大或太低估的價值。為此建議使用測試來檢測這種類型的觀察,允許來回答這樣的問題:如果特定異常值沒有觀察?這裡有一個例子是使用Cook
distance 和Mahalanobis distance (Kwak & kim, 2017)。
最後一個建議是根據科學標準獲得的測試結果以統計的記錄有關。作者應在表中包括適當的符號及其描述。即表示使用特定的統計數據以測試單個變數。也建議根據接受的科學標準記錄統計檢定結果,而不僅僅是
p 值( Arifin等,2016)。這是增加發表的研究成果透明度和可信度的另一個因素。
提高統計分析的品質允許提高出版的透明度和可信度
研究結果,這可能反映在改進中 醫療患者的生活品質。
表 1 對投稿於 Journal of Cancer
Research and Clinical Oncology 文章的讀者和作者的統計指導
1.
應用統計檢定的描述
作者應該描述他們在哪些情況下使用了特定的測試,不僅只是一般描述如變數的類型、分佈的常態性等。
2.
使用的統計套件
應包括最重要的資訊類型,例如GraphPad
Software,Inc Sam Diego,CA。
3.
統計檢定結果
為了提高所得結果的可靠性,可以將它們寫成以符合科學標準,例如,在
Mann – Whitney U 檢定的情況下:U = 60.5; p = 0.03
4.
在其中使用的統計檢定表下指定符號
在表中的 p 值旁邊,可以有一個符號,例如“ * ” ,在
表格解釋應用統計檢定的含義。
5.
統計檢定的假設
作者應該根據他們使用的參數/非參數來準確描述其各種統計檢定。
6.
摘要中的結果
在摘要中,作者應包括 p 值以增加其獲得的結果明確性。
7.
樣本大小影響
為了增加工作的價值,建議研究影響效果的大小(Cohen '
sd、Eta-squared、Hedges ' g、Glass ' s delta 等)。
8.
調查資料的可靠性和有效性
建議測試這些新調查的完整性(Cronbach's alpha值)。
9.
使用適當的描述性統計
對於不同類型的統計檢定,作者應該在他們的文章中充分的描述性統計數據,例如中位數等。
10.
為讀者描述的高級參數/統計的清楚測定
可以簡單地向讀者解釋,即用簡單的話,是什麼高級參數/統計檢定是。這會讓很多不熟悉生物統計學的讀者來理解這類參數的含義。
11. 異常值的檢測
異常值案例對獲得結果的影響可以通過以下方式評估,例如,庫克距離、Leverage -LEV、馬氏距離、Adjusted Preicted
Values -ADJ。
12. 事後測試
作者應該在未來的論文中清楚地描述他們選擇了哪些事後測試以及為什麼選擇(變異數同質性、樣本量等)。 |