生醫研究之統計方法

首頁新增資料與公告

最新消息 :

數字分析 - 中國於非洲農業報導之破解

索馬利亞的乾旱影響和解決方案建議

在非洲商業邊緣爭奪空間-本土企業與中資企業之間日益激烈的競爭

生醫研究之統計方法

迴歸—蘋果不會離樹太遠

中興大學生物系統工程研究室陳加忠

Vetter, Thomas R. MD, MPH*; Schober, Patrick MD, PhD, MMedStat†

Anesthesia & Analgesia: July 2018 - Volume 127 - Issue 1 - p 277-283

doi: 10.1213/ANE.0000000000003424

摘要

研究人員和臨床醫生經常對以下任一方面感興趣：(1) 評估兩個或多個變數之間是否存在關係或關聯並量化這種關聯；或 (2) 確定一個或多個自變數是否可以預測另一個他變數。這種關聯性的強度主要由相關性來描述。然而迴歸分析和迴歸模型不僅可用於識別變數之間是否存在顯著關係或關聯，還可用於產生對於變數之間，這種預測關係的估計。在這篇統計教程文章討論了與最常見的迴歸分析和建模類型相關的基本概念和技術，包括簡單線性迴歸、多元迴歸、邏輯迴歸、有序迴歸和卜瓦松迴歸，以及常見但經常被忽視的迴歸平均值。各種類型的迴歸分析都是強大的統計技術，如果應用得當，可以有效解釋複雜的多因素數據。迴歸分析和模型可以評估兩個或多個觀察變數之間，是否存在關係或關聯，並估計這種關聯的強度，以及確定一個或多個變數是否可以預測另一個變數。因此迴歸更常用於麻醉、手術期、重症監護和疼痛研究。然而重要的是要注意迴歸可以識別合理的風險因素。它不能證明因果關係或確定因果關係。相反，迴歸分析的結果識別與結果變數相關的獨立（預測）變數。與其他統計方法一樣，應用迴歸需要滿足某些假設，這些假設可以通過特定的診斷進行測試。

研究人員經常評估兩個變數之間是否存在關係或關聯，並估計這種關聯的強度。相關性和一致性是在醫學文獻和臨床實踐中應用，兩個被廣泛使用的概念，以評估和描述感興趣的變數之間的關聯。相關性統計通常用於描述兩個變數之間的關聯，這些變數是量測相同的實體、屬性或結果。相比之下，一致性（concordance）統計目的在描述變數在同一尺度上衡量相同實體、屬性或結果的程度。

基本術語和定義

研究人員和臨床醫生經常對以下任一方面感興趣：(1) 評估兩個或多個變數之間是否存在關係或關聯並量化這種關聯；或 (2) 確定一個或多個變數是否可以預測另一個變數。這種關聯的強度主要由相關性來描述。然而迴歸分析和迴歸模型不僅可用於確定變數之間是否存在顯著關係或關聯，還可用於估計變數之間的這種預測關係。

這個基本的統計教程討論了與最常見的迴歸分析，和建模類型相關的以下基本概念和技術：

研究變數的類型

決定係數

簡單線性迴歸

多重迴歸

邏輯迴歸

有序迴歸

卜瓦松迴歸

迴歸假設和診斷

迴歸平均值

研究變數的類型

在進行研究時，在研究和數據分析開始時需要考慮和定義四種基本類型的變數：

1.自變數：被認為與某些觀察到的檢定力或關聯，直接相關的變數，以及在研究或實驗過程中由研究人員直接操縱或觀察的變數。

2.應變數：被認為直接受自變數變化影響的變數，研究人員在研究或實驗過程中直接量測的變數。

3.預測變數：被認為可以預測另一個變數的變數，以及在研究或實驗期間由研究人員識別、確定和/或控制的變數，基本上與自變數同義。

4.結果變數：一種被認為會因預測變數變化而發生變化的變數，研究人員在研究或實驗期間直接量測的變數，基本上與應變數同義。

決定係數

在評估兩個變數（X和Y）是否彼此相關時，人們同樣有興趣回答這個更複雜的問題：一個變數 (Y) 數值的變化是否與第二個變數 (X) 的數值？

進一步和更精確地解釋觀察到的相關係數（例如，皮爾遜積矩相關性，the Pearson product-moment correlation r）的一種方法是計算決定係數。決定係數是通過簡單地對相關係數 (r²) 求平方來計算的。決定係數是一個變數 (Y) 的變異量佔另一個變數 (X) 變異量的比例或百分比。直觀地說，相關性越強，可以解釋或歸因於X值的Y變異量越大。

簡單的線性迴歸

簡單線性迴歸建立在相關性（兩個變數的相關程度）和決定係數（相關性解釋的變異百分比）的基礎上，通過建立一個模型來量化關聯或預測個變數的值。另一個變數的值。當應變數或結果變數是連續的時，通常使用線性迴歸。迴歸分析的結果確定與應變數相關的自變數。然而，重要的是要注意，雖然迴歸可以識別合理的風險因素，但它並不能證明因果關係或是說明有明確的因果關係。

簡單線性迴歸的目標之一是為繪製在兩個軸（x 和 y）上的觀察數據點的散點圖或圖形生成一條直線“最佳配適線”。這也稱為 y 在 x 上的迴歸線（圖 1）。直線“最佳配適線”（以紅色顯示的線），也稱為 y 在 x 上的迴歸線，用於繪製在兩個軸（x 和 y）上的觀察數據點的散點圖或圖形。在這個關於胎齡 (X) 和嬰兒出生體重 (Y) 的簡單線性（雙變數）迴歸模型中，Y = 6.66 + 0.36(X)。因此，在 33 至 45 週之間，胎齡每增加一周，出生體重就會增加 0.36 磅（95% CI，0.24-0.47；P < .001）。觀察到的 Pearson 相關係數 (r) = 0.71（95% CI，0.52–0.81；P < .001）。相應的決定係數 (r ²) = 0.49，表明嬰兒出生體重的 49% 變化可歸因於胎齡。CI 表示置信區間。

儘管這些基本的統計教程，有意避免了晦澀難懂的數學符號和符號，但我們在高中代數中都學過的簡單線性方程（y= mx + b）實際上也描述了簡單的線性迴歸方程式。

在這個簡單的線性迴歸中，X是單個自變數（預測變數），Y是單個應變數（結果變數）的預測或期望值。類似於直線的代數斜率，β為迴歸線的斜率，正式稱為β迴歸係數。所述ÿ截距（β₀）表示其中最佳配適的迴歸直線相交應變數的y軸的值的點時，自變數（X）的值是0.6。值得注意的是，傳統的代數y截距通常與科學無關，因為x變數的合理或量測值的範圍通常不包括 0.15。

顧名思義，簡單的線性迴歸假設兩個變數（X和Y）之間存在線性關係。因此，對於自變數 (X) 的給定變化 (delta, Δ)，應變數或結果變數 (Y) 也有相應的變化 (Δ)。所以就像上面的代數斜率 (Δy/Δx)在簡單的線性方程中，迴歸 β 係數描述了自變數量測值發生一個單位變化時，應變數（以量測單位為單位）的預期變化幅度。結合截距係數 (β₀)，斜率係數(β₁)允許針對給定的獨立（預測）變數 (X) 的值預測因（結果）變數 (Y) 的值。

在簡單迴歸分析中，只有一個自變數和一個應變數。因此，簡單線性迴歸也稱為雙變數迴歸。值得注意的是，在簡單的雙變數相關分析中也只有兩個變數。然而，Pearson 相關係數和簡單線性迴歸之間的一個關鍵區別是，雖然相關性不區分自變數和應變數。但迴歸總是有一個指定的自變數 (X) 和一個指定的應變數 (Y) 。

多重迴歸

在簡單線性迴歸中，有一個自變數和一個應變數。然而，大多數現實生活中的現象（例如出生體重）比單個自變數（例如胎齡）所能解釋的要複雜得多。多元迴歸擴展了簡單的線性迴歸，允許考慮和包含多個自變數。

在多元迴歸中，仍然只有一個應變數，但有多個自變數。因此具有三個自變數和三個對應的 β 迴歸係數的多元迴歸模型將被記為：

使用多元迴歸，研究人員可以確定單個應變數 (Y) 中的變異有多少可以由每個包含的自變數（X₁、X₂、X₃……）來解釋，同時控制所有其他的自變數都包括在內。在研究中，通常有一個感興趣的主要自變數，它對應於主要研究假設。

多元迴歸可以支持單個應變數，與一個或多個自變數之間的顯著關聯。它還通常可以解釋應變數中的大部分變異量。因此多元迴歸是一種非常強大的統計技術，可以提供大量有用的資訊和見解。然而多元迴歸的結果並不能證明任何自變數導致了結果。

Gerbershagen 等人將多元線性迴歸分析應用於與嚴重術後疼痛相關的因素的研究。他們對 30 項合併外科手術的分析表明，在 11 點數字評分量表 (0-10) 中，年齡每增加 10 年，術後疼痛降低 0.28 分（95% 置信區間 [CI]，0.26-0.31），術後疼痛降低術前慢性疼痛量表得分每升高 0.14 分（95% CI，0.13-0.15）。與手術的類型和範圍無關，術前年齡較小和慢性疼痛與術後疼痛較高有關。

作為線性迴歸特例的共變異量的T檢驗和分析

獨立兩樣本t檢驗或單向變異量分析 (ANOVA) 經常用於比較來自兩個或更多不相關組的連續變數的平均值的T檢驗，變異量分析和線性迴歸經常提出並被作為不同的統計方法。然而，t檢驗和變異量分析實際上是線性迴歸模型的特例。其中個（t檢驗等價）或更多（ANOVA 等價）獨立的二元“虛擬”變數代表所謂的因子水準（組）將各組與參考組進行比較，迴歸模型的截距代表參考組中結果值的平均值。

與 1-way ANOVA 一樣，2-way（和更高階）ANOVA 模型也可以用多元線性迴歸表示，方法是在模型中包含額外的二元共變數以及共變數之間的相互作用。共變異量分析是 ANOVA 的擴展，允許在線性迴歸模型的背景下使用連續共變數。這種方法通常用於針對基線值的不平衡調整組比較，或在隨機試驗中獲得更精確的估計通過調整結果變數的基線值來確定治療效果。

邏輯迴歸

一些人口統計學和臨床特徵可以使用單獨的、離散的類別進行解析和描述。此類分類數據可以是名義數據或二分數據。名義數據（來自拉丁詞 nomen，代表“名稱”）代表著類別沒有排序，而只是名稱。二分數據只有兩類別，因此被認為是二元的（是或否；陽性或陰性）。許多手術期和手術中臨床結果（例如，術後噁心/嘔吐、心肌梗死、中風、敗血症、急性腎損傷和死亡率) 可以作為二分數據進行記錄和報告。

邏輯迴歸的目標是建立一個方程式，該方程式可用於估計個人將經歷單個二分因（結果）變數作為獨立（預測）變數的函數的概率。大多數現實生活中的現象及其相應的單一二分依賴（結果）變數（例如，術後心肌梗死的發生）比單個自變數可以有效解釋的要復雜得多。因此當有兩個或更多已識別和包含的自變數時，則改為應用多元邏輯迴歸。

在隊列研究或隨機對照試驗中，可以有效計算風險比或優勢比 (OR) 並將其報告為關聯的度量。相比之下在病例對照研究中，只有 OR 可以有效地計算並報告為關聯的量測。

具體而言，在病例對照研究中，人們只能比較病例中與對照中可能或假定的因果因素的接觸頻率。這種比較產生的是 OR，一種風險度量，在概念上類似於但在數學上不同於相對風險（圖 2）。

從傳統的 2 × 2 列聯表計算相對風險和粗略（未調整）優勢比。OR 可以簡單地計算為傳統 2 × 2 列聯表中數據的叉積比（圖 2）。OR 也可以計算為取冪的 beta (β) 係數對應的二元邏輯迴歸模型：

這個 OR 直接計算為 2 × 2 列聯表（圖 2）中的交叉產品比率，或指數二元邏輯迴歸係數，稱為原始或未調整的 OR。統計考慮並因此調整對於任何外來變數（共變數）的影響，生成調整後的 OR (aOR)。這種調整通常通過二分類或二元結果的多元邏輯迴歸來完成。

因為 aOR 考慮了無關的和潛在的共同變數（共變數）的貢獻，它天生是對暴露與不良健康結果（疾病）之間關係（關聯）的更有效估計，因此通常是最好報告的度量。

Abbott 等應用多元邏輯迴歸分析來研究術中心率 (HR)、收縮壓 (SBP) 和非心臟手術後心肌損傷 (MINS) 之間的個體和相互依賴關係。他們的主要二分類（二進制）結果是 MINS，定義為術後 30 天內血清肌鈣蛋白 T ≥ 0.03 ng/mL。每個多變數模型都針對 14 個已知與 MINS、心血管並發症或先前圍手術期研究中的死亡率相關的潛在混雜因素進行了調整。最大手術中 HR > 100 bpm 與 MINS 相關（aOR，1.27 [95% CI，1.07–1.50]）。最小 SBP <100 mmHg 與 MINS 相關（aOR，1.21 [95% CI，1.05–1.39]）。最小 SBP <100 mm Hg 和最大 HR >100 bpm 與 MINS 的相關性更強（aOR，1.42 [95% CI，1.15–1.76]）。

有序迴歸

與名義或分類數據不同，有序數據遵循邏輯順序。有序數據是按等級排序的，通常基於由一小組離散類或整數組成的數字尺度。一個關鍵特徵是反應類別具有等級順序，但值之間的間隔不能是數字。李克特量表(Likert scale)（1 = 非常不同意，5 = 非常同意），通常用於量測受訪者的態度，生成有序數據。有序數據的另一個例子是美國麻醉醫師協會身體狀況評分（1、2、3、4、5 或 6）。

有序邏輯迴歸是邏輯迴歸的擴展，通常用於對有序結果數據進行建模。這些模型允許估計屬於特定類別的概率（例如，在Liker上面給出的比例示例）。給定共變數值。有多種可能性可以對結果變數中的序數進行建模。最有可能使用比例優勢模型，它將相同或更小的反應的概率與更大反應的概率進行比較。結果 OR 估計獨立變數中一個單位的變化屬於更高或更低類別的機率。變數取決於特定統計軟體的參數化。

Varughese 等研究了兒童在麻醉誘導期間的行為依從性，並將依從性分為“完美”、“中等”和“差”。比例優勢模型用於評估多個共變數與行為依從性之間的關聯，作者確定了幾個與行為依從性顯著相關的因素。

卜瓦松迴歸

研究人員有時想分析自變數與計數數據之間的關係，例如術後心臟事件或呼吸暫停發作的次數，或者對於期刊編輯來說，某個時間段內一篇手稿的引用次數。此類計數數據與其他連續結果數據有很大不同，因為它們始終是非負整數（整數）並且經常是正偏斜的，大多數值較低，很少有較高的值。值得注意的是零值的數量可能相當大（例如，許多患者可能絕對沒有術後心臟事件）。因此，此類數據的分佈通常不對稱，更不用說常態分佈，因此違反了線性迴歸的幾個假設。

卜瓦松迴歸通常用於對計數結果數據進行建模。對於不能用卜瓦松分佈充分描述的計數數據，可以使用諸如過度分散卜瓦松模型、零膨脹卜瓦松模型和負二項式迴歸之類的修改。請注意計數也可以根據比率來定義，這是每個時間或每個空間的事件數量（計數）。事件發生的速率通常稱為發生率，卜瓦松迴歸中的指數迴歸係數可以解釋為發生率比。

Schuster 等人使用卜瓦松迴歸模型研究了醫院規模和手術服務對擇期手術病例取消率的影響。作者觀察到，大學醫院的取消率比中小型社區醫院高 2.2（95% CI，1.5-3.3）倍，普通外科服務的取消率高 1.8（95% CI，1.3-2.5）倍取消率高於婦科服務。

樣本數量

一個非常重要的問題是“需要多少研究對象才能進行有效的多元迴歸分析？”雖然肯定存在有更複雜的方法來回答這個關鍵問題，一個常見的基本經驗法則是研究的數量受試者 (n) 應至少為 10，最好是 20，理想情況下是包含的自變數數量的 40 倍。否則，可能會發生所謂的迴歸模型過度配適。

迴歸假設和診斷

合理的自變數

為迴歸模型適當選擇自變數是一個備受爭議的話題。已經描述了各種變數選擇和模型建立策略。該策略還將取決於模型的目的是否主要是： (1) 評估自變數與應變數之間的關係；或 (2) 確定預測能力。

應注意，不要包含過多的自變數。例如，簡單地評估眾多變數與結果之間的關聯以查看哪些變數（如果有）是顯著的，很少是合適的。Ockham’s razor指出“在其他條件相同的情況下，簡單的解釋通常比更複雜的解釋更好。” 添加對模型沒有重要貢獻的變數會增加“噪聲”，而不會添加太多“信號”，這可能會導致過度配適。

缺乏多重共線性

在建立具有多個預測變數的多元迴歸模型的背景下，潛在的預測變數可以相互關聯。例如在使用兒童的年齡、體重和身高來估計某個結果的迴歸模型中，這些自變數很可能（高度）相關。雖然當主要目的是預測結果時，這不太受關注，但如果研究的目的是估計關聯，則很難區分每個共變數的單獨影響。特別是，估計往往非常不穩定，因此數據的微小變化可能會顯著改變估計的迴歸 (β) 係數。此外標準誤差往往很大，導致 CI 較寬，檢測有意義的檢定力的功效較低。

獨立觀察

與大多數常見的統計方法一樣，這裡描述的迴歸技術要求對結果變數的觀察是在不同的主題中進行的，彼此獨立。

關於結果變數的分佈和變異量的假設

不同的迴歸技術對結果變數的分佈和變異量做出不同的假設。例如，在線性迴歸中，應變數被假定為常態分佈，結果的變異量在自變數範圍內被假定為常數。請注意常態分佈的這種假設在樣本量相當大時不是最重要。應變數和自變數的極端或異常值都可能對迴歸參數產生不當影響。

自變數和應變數之間的線性關係

正如在簡單線性迴歸的情況下所指出的，假設自變數和應變數之間存在線性關係。考慮也適用於其他迴歸模型。例如邏輯迴歸假設自變數和對數機率之間存在線性關係。但是請注意，多元線性迴歸可以包括自變數和結果之間的非線性關係，例如通過將應變數的平方值包含在模型中。

診斷

迴歸診斷是指一組可用於評估迴歸模型是否符合其假設的工具。我們在上面非正式地描述的許多假設實際上是指觀測值與預測值的偏差（所謂的殘差）。例如，針對自變數或預測值繪製殘差在線性迴歸中非常有用，可用於檢測非線性關係和非常量變異量，以及總異常值。本系列前面回顧的分佈圖，可用於評估殘差的分佈。其他診斷可用於評估模型是否合理配適數據、是否存在多重共線性以及少量異常觀察值，是否過度影響迴歸參數的估計。

迴歸平均值

從本質上講，迴歸平均值 (RTM) 認為，如果分數或觀察值在次顯著偏離平均值，則後續量測將更接近平均值或平均值。 RTM 的淨檢定力是移動所選組（研究樣本）的平均值（或更高或更低）且更接近整個基礎母群的平均值。

在處理無處不在的 RTM 時，需要牢記三個關鍵點：(1) 使用可用的最可靠的規模；(2) 如果選擇患者是因為他們超過了某個臨界點，因此屬於極端組，在接受他們進入研究之前至少對他們進行兩次，最好是三次評估。如果有任何值低於臨界點，請執行不登記該患者；(3) 使用對照組，因為 RTM 對其成員的影響與治療組一樣多。

讀者可以參考 Campbell 和 Kenny關於 RTM的權威性工作，包括關於如何優先避免它的進一步指導；他們的“Galton squeeze diagram”來形象化它是否已經發生，然後怎麼處理。

結論

各種類型的迴歸分析都是強大的統計技術，如果應用得當，可以有效解釋複雜的多因素數據。迴歸分析和模型可以評估兩個觀察變數之間是否存在關係或關聯，並估計這種關聯的強度，以及確定一個或多個變數對另一個變數的預測能力。因此，迴歸更常用於麻醉、手術期、重症監護和疼痛研究。然而，重要的是要注意，雖然迴歸可以識別合理的風險因素，但它並不能證明因果關係（明確的因果關係）。相反迴歸分析的結果識別與因（結果）變數相關的獨立（預測）變數。與其他統計方法一樣，應用迴歸需要滿足某些假設，這些假設可以通過特定的診斷進行測試