logo821.gif (10572 bytes) 首頁          新增資料與公告

   

最新消息  :

數字分析 - 中國於非洲農業報導之破解

索馬利亞的乾旱影響和解決方案建議

在非洲商業邊緣爭奪空間-本土企業與中資企業之間日益激烈的競爭

 

 

生醫研究之統計方法

首頁
上一層
BSE LAB 介紹
非洲產業研究中心
授課資料
人文關懷
無官御史台
武漢肺炎與產業
智能生物產業
活動公告區
數據分析與知識產業

 

 

學術研究的偏差

 

中興大學 生物系統工程研究室  陳加忠

 

 

此篇文章來自Biochemia Media 2013;23(1):12-15,篇名為「Bias in research」。

研究論文是用以呈現研究人員之研究成果。每個研究需要以透明,誠實與不偏離真理的方式進行設計,試驗與報導。與上述基本要求偏離的研究即是一種誤導。這種研究扭曲真相與創造出錯誤的結論,因此引起錯誤的醫學決策,傷害了病人,而且浪費研究經費。此篇論文用以介紹偏差的來源,也用以在研究過程中避免產生偏差。

一、偏差的定義

偏差代表在數據收集,數據分析,解釋與發表的過程中,偏離了真實因而引起錯誤的結論。偏差的產生有些是無意,有些是故意。在研究過程中有意的製造偏差是一種不道德的行為。但是在研究過程與發表過程中無意的偏差,也不可容許。

每一項研究都有可能有其混雜的變數與限制條件。混雜其他因子的偏差效應無法完全避免。每一個科學家因此要盡可能查覺所有偏差的可能來源而且盡力地消除偏差。如果偏差仍然存在,作者要在其論文中加以述明而且表明對其研究產生之限制。

期刊的編輯與評審者都要負責探查可能的偏差。如果偏差存在,編輯需要考慮這些偏差對研究之結論是否有重大的影響。如果研究的結論無法確認,這種論文不應該發表。

二、數據收集之偏差

族群代表所有有興趣進行研究的全部個體。然而由於時間與經費的限制,無法研究所有的個體,因此研究只能針對樣本進行測試。所選用的樣本要能夠代表族群。

對一項研究取樣是一個關鍵步驟。在取樣過程中有可能產生許多偏差。例如在進行醫學試驗時,有些病人比其他病人更容易被選入進入實驗。這些樣本無法代替所有樣本。這種結果稱為選擇性偏差(Selection bias)。為了確保樣本能夠代表母群,樣本必須任意取樣,代表每個樣本都有相同的機會被選為試驗對象。如果取樣數目太少,此種取樣偏差也容易發生。

有些試驗,例如Cross-sectionalCase control,僅選擇在醫院醫療的病人為樣本,這取樣偏差稱為admission bias

Cross-sectional研究中另一種取樣偏差為Survivor bias。有些病症需要多年研究數據,然而有些研究樣本在過程中不幸死亡,因此失去了有用的數據。

某種疾病缺乏嚴謹定義時,容易出現「Misclassification bias」。通常此型疾病缺乏標準定義或是病症不容易探查發現。因此在分類時不正確。

總而言之,研究人員必須注意取樣,而且盡一切努力使得樣本得以代表母群。

三、數據分析之偏差

研究人員對於數據分析產生偏差之主要原因在於對於研究假設預先有了定論。在數據分析中偏差發生的主因包括偽造(fabricating),濫用(abusing)與操控數據,一些例子:

1. 數據偽造:報導一些不存在的數據,事實上並未進行此試驗。

2. 消除刪棄與預先結論不相同的數據。

3. 以不當的統計方法處理數據。

4. 以成對比較以進行多重檢定。不管原先假定條件,以不同成對測試方式以求發現有顯著差異。

例如在一項研究中,目的在於找出一組病人之生物標記與另一組病人有之顯著不同,但是試驗結果並無顯著不同。有些研究人員則將數據設法分成數組分別比較,直到有兩組數據有顯著不同。這種方法稱為操控數據。

在實際研究中,每20次研究數據,至少有一次產生第一型錯誤(Type I error,α)。因此數據之分析十分重要。

數據操控的實例舉例如下:

1. 一個樣本群,都是女性,年齡37歲以下。膽固醇高於6.2mnol/L。研究報告顯示其CRP值與其他樣本顯著不同。

2. 一個樣本群,男性,BMI為整體族群百分之25%以下,total leukocyte count低於4.0 X 109/L。研究結果其Lactate濃度與albumin濃度為負相關。

除了上述之操控數據,無效或不合邏輯之結論也都是無用的研究。

四、數據解釋之偏差

為了正確的解釋研究結果,研究人員必須確定使用的統計方法都是正確的。而且有顯著差異之存在。

然而許多研究者對於研究結果先有定論,難以接受不一致之研究結果,例如:

1. 儘管統計為不顯著,而在結果討論中強調差異性存在。

2. 討論統計上具有顯著性,而忽略其結果在醫學上無意義。

3. 儘管未進行試驗設計,以因果關係得到結論。

4. 得到之結論不在研究數據之範圍,此種偏差又稱外插偏差。

5. 將特定數據之結果解釋為所有通則。

6. 忽略第一型與第二型錯誤。

五、出版偏差

許多科學期刊容易接受正面的結果,對於負面之研究結果採取「不接受刊登」。這種偏差長期以來造成研究文獻的不對等。假如負面的結論無法刊登,其他科學家可能浪費時間與研究經費重覆相同的試驗 然後又得到負面的結果。

期刊的編輯要為此負責,一篇論文無論其結果是正面與負面,都應該有相同的機會接受審查與出版。論文之要求是合理的設計,有效的科學性假設,良好的執行試驗,適當的數據分析,合理的表達及正確之結論。為了協助負面的研究得以出版,近年來已有一些期刊開始發行,例如Journal of Pharmaceutical Negative Results, Journal of Negative Results in Biomedicine, Journal of Interesting Negative Results等。這些期刊是用以出版負面結果。

另一種偏見是來自經費(funding bias)。有許多研究來自相同公司的經費贊助,面對相同的問題。因此研究過程與研究結果之發表都無法避免經費支助公司的影響。

六、結論

研究過程有許多可能發生的偏差。這些偏差引起了錯誤的試驗結果與結論。造成研究過程成本浪費,產生錯誤的醫療技術,甚至造成病人的傷害。因此研究期刊之出版一定要考慮是否為有效且無偏差之研究成果。