logo821.gif (10572 bytes) 首頁          新增資料與公告

   

最新消息  :

數字分析 - 中國於非洲農業報導之破解

索馬利亞的乾旱影響和解決方案建議

在非洲商業邊緣爭奪空間-本土企業與中資企業之間日益激烈的競爭

 

 

生醫研究之統計方法

首頁
上一層
BSE LAB 介紹
非洲產業研究中心
授課資料
人文關懷
無官御史台
武漢肺炎與產業
智能生物產業
活動公告區
數據分析與知識產業

 

 
統計數據表示
 

中興大學 生物系統工程研究室 陳加忠

 
 

Junyong In1 and Sangseok Lee2

1.Department of Anesthesiology and Pain Medicine, 1Dongguk University Ilsan Hospital, Goyang, 2Sanggye Paik

2.Hospital, Inje University College of Medicine, Seoul, Korea

數據通常以原始格式收集,因此內在的資訊難以理解。因此,原始數據需要進行匯總,處理和分析。但是,無論數據分析處理得如何好,從原始數據中獲得的資訊都應該以有效的格式顯示,否則對作者和讀者而言都是巨大的損失。本文介紹了以文件,表格和圖形形式表示的數據和資訊的方法。文本內容解釋了發現,概述趨勢和提供上下文資訊的主要方法。

表格最適合表示單個資訊,並且可以表示定量和定性資訊。圖形是一種非常有效的視覺工具,它可以一目了然地顯示數據,便於進行比較,並且可以顯示數據之間的趨勢和關係,例如隨時間的變化,頻率分佈以及整體的相關性或相對比例。用於數據和資訊表示的文字,表格和圖形是非常強大的通信工具。它們可以使文章易於理解,吸引並維持讀者的興趣,並且有效地呈現大量複雜的資訊。此外,由於期刊編輯和審稿人在閱讀整篇文章之前都先瀏覽了這些演示文稿,因此它們的重要性不容忽視。

 介紹

 數據是一組事實,提供了部分真實情況。無論是出於特定目的收集數據,還是正在使用收集的數據,都必須牢記有關數據正在傳達哪些資訊?如何使用數據?以及必須做什麼以包含更多有用資訊?

由於大多數數據以原始格式提供給研究人員,因此必須對其進行匯總,組織和分析,以從中有用地獲取資訊。此外,每組數據都需要根據其用途以某種方式呈現。在適當處理原始數據之前,必須計劃如何呈現數據。

首先,必須明確定義需要答案的問題。問題越加詳細,結果越加詳細和清晰。一個廣泛的問題將導致模糊的答案和難以解釋的結果。換言之,定義明確的問題是十分重要,使得數據以後被很好地理解。準備好詳細的問題後,原始數據必須再處理。如今經常使用統計軟體或圖形軟體對於數據進行匯總,組織和分析。數據必須以所使用的程式能夠正確識別的方式進行準備。此研究未討論此數據準備過程,該過程涉及創立數據框架,創立/更改行和列,更改因子級別,分類變數,編碼,虛擬變數,變數轉換,數據轉換,遺失值,離群值處理和去除噪音。

此篇文章描述了文字,表格和圖形(圖形,圖解或圖表)的作用和適當使用法。所有這些方法常用於報表,文章,海報和演示文稿中。此外討論了呈現各種資訊時必須解決的問題,以及呈現數據的有效方法,這些方法是研究和強調特定資訊的最終產品。

資料呈現

數據可以以下三種方式之一顯示:

作為文字;

以表格形式;要么

圖形形式。

根據數據格式,要使用的分析方法和要強調的資訊來選用數據表示方法。不當呈現的數據無法將資訊清楚地傳達給讀者和審閱者。即使在傳達相同的資訊時,也必須根據要強調的特定資訊採用不同的表示方法。在仔細權衡不同表示方法的優缺點之後,必須選擇一種表示方法。

為了容易比較不同的表示方法,讓我們看一下提供相同資訊的表(表1)和折線圖(圖1[1]

 

如果希望在某個時間點比較或介紹兩個數值,則可以使用文字或書面語言。但是,當所有資訊都需要同等被關注時,表格是最合適的,它使讀者可以有選擇地查看自己感興趣的資訊。圖形使讀者可以了解數據的總體趨勢,並直觀地了解兩組之間的比較結果。

無論使用哪種方法,始終要牢記的一件事是演示的簡便性。

 文字介紹

文字是傳達資訊的主要方法,因為它用於解釋結果和趨勢,並提供上下文資訊。數據從段落或句子表示。

文字可用於提供解釋或強調某些數據。如果要傳達的定量資訊是由一個或兩個數字組成,則使用書面語言比使用表格或圖表更合適。例如,有關資訊在2016~2017年麻醉失敗的發病率幾個數字可呈現使用了幾個數字:發生麻醉失誤率2016年為11%。和在2017年為15%。 兩年之間失誤率沒有發現顯著差異。如果這個資訊將以圖形或表格呈現,它會在書面上佔用不必要的大空間。而不會提高讀者理解數據。如果要顯示更多數據,或者要傳達其他資訊(例如與數據趨勢有關的資訊),則表格或圖表會更合適。從本質上講,當以文字形式呈現並且主體文字包含一長串資訊時,數據需要更長的閱讀時間,讀者和審閱者可能難以理解資訊。

表格展示

表格已將資訊轉換成行或列的單詞或數字,已經使用了將近2000年。具有足夠水準的識字能力的任何人都可以輕鬆理解表格中顯示的資訊。表格最適合呈現個別資訊,並且可以呈現定量和定性資訊。定性資訊的例子有鎮靜水準[2],統計方法/功能[3,4]和插管條件[5]

 表格的優勢在於它們可以準確地呈現圖表無法呈現的資訊。一些諸如“ 132.145852 ”數據可以在表格上被精確地表達。另一個優點是可以將具有不同單位的資訊一起顯示。例如,血壓,心率,所用藥物的數量和麻醉時間可以在一張表中一起顯示。最後,表格對於總結和比較不同的定量資訊的變數十分有用。  

但是,表格中的資訊解釋要比圖形中的資訊解釋花費更長的時間,並且表不適合研究數據趨勢。此外,由於所有數據在表中具有同等重要性,因此識別和選擇所需資訊並不容易。

有關建立表格的一般指南,請參閱期刊投稿要求1)。Heat maps比表格更好地可視覺化資訊。Heat maps可通過將顏色應用於單元格背景,來幫助進一步視覺化表格中顯示的資訊。

通過調整顏色或顏色飽和度,資訊以更可見的方式傳達,並且讀者可以快速識別感興趣的資訊(表2)。Excel之類的軟體(在Microsoft OfficeMicrosoftWAUSA)具有通過條件格式選單上可用的選項,而易於創建Heat maps的功能。

圖形展示

表格可用於顯示所有資訊,而圖形則通過使用圖像並強調數據模式或趨勢來簡化複雜的資訊,並且對於匯總,解釋或探索定量數據很有用。雖然圖形可以有效地顯示大量數據,但它們也可以代替表格來顯示少量數據。必須選擇最能顯示資訊的圖形格式,以便讀者和審稿者可以輕鬆理解資訊。在下文中,我們將通過例子描述常用的圖形格式,以及每種格式適當顯示的數據類型。

散點圖

散點圖在x軸和y軸上顯示數據,並用於調查兩個變數之間的關聯。一個點代表每個個體或對象,可以通過分析多個點上的模式來研究兩個變數之間的關聯。將回歸線添加到圖形中,以確定是否可以解釋兩個變數之間的關聯。圖2顯示了當前使用的疼痛評分系統(PSQ,疼痛敏感性;PASS,疼痛焦慮症狀; PCS,疼痛災難性)與Geop-Pain問卷(GPQ)之間的相關性,相關係數,R2和迴歸直線圖顯示在[6]。如果像在本例中,在同一位置存在多個點(圖2),則其相關性可能不清楚。在這種情況下,可以添加相關係數或迴歸線以進一步闡明相關性。

 條形圖和直方圖

條形圖用於指示和比較一種離散類別或組中的值以及頻率或其他測量參數(例如平均值)。根據類別的數量以及每個類別的大小或複雜程度,可以垂直或水平創建條形圖。條形的高度(或長度)表示類別中的資訊數量。條形圖是靈活的,在每個類別中有兩個或更多數據集的情況下,可以以分組或細分成條形格式。圖3是垂直條形圖的代表性示例,其中x軸代表恢復室停留時間和藥物治療組的長度,y軸代表視覺模擬量(VAS)評分。VAS分數的平均值和標準偏差用條形圖上的鬍鬚表示(圖3[7]

通過比較直方圖的端點,可以識別最大和最小的類別,並了解每個類別之間的逐漸差異。建議自0開始x軸和y軸如果Xy軸坐標軸不從0開始,可以欺騙讀者的眼睛和導致結果的比例過高。

垂直條形圖的一種形式是堆疊的垂直條形圖。堆疊的垂直條形圖用於比較每個類別的總和,並分析類別的各個部分。儘管堆疊的垂直條形圖在可視化方面非常出色,但它們沒有參考基準線,因此對於比較各個部份的具有挑戰性(圖4[8]

 餅形圖

餅圖可用來表示名義數據(換句話說,分類為不同類別的數據)的餅圖直觀地表示類別的分佈。通常,它是表示少量類別的資訊的最合適的格式。它也用於沒有其他方式可以表示的數據(例如頻率表)。圖5顯示了來自手術室的常規廢物的重量[8]。餅形圖通常還用於說明每個候選人在選舉中贏得的選票數。

 

 

線圖具有鬚

折線圖可用於表示時間序列數據,例如月降水量和年失業率。換句話說,它是用來觀察那些在所觀察時間內的變數。折線圖對於研究包括氣候影響,較大的變化或有轉折點在內數據的模式和趨勢特別有用。並且不僅適合表示時間序列數據,而且還適合表示在連續變數(例如距離)的過程中測得的數據。如可見圖1,收縮期血壓的平均值和標準偏差在每個時間點都被表示。這使讀者容易理解隨收縮壓時間[1]變化。如果數據定期收集,則可以估算兩次測量之間的值。在折線圖中,x軸表示連續變數,而y軸表示比例和測量值。在單個折線圖中表示多個數據集用以比較和分析不同數據集的模式也很有用。

 盒鬚圖

盒鬚圖不對數據的統計分佈進行任何假設,而是表示總體樣本中的變化。因此,它適合表示非參數數據。盒鬚圖包括表示四分位數間距(一到三),中值和平均值的數據的,並且盒鬚呈現為框外線。盒鬚可用於表示一組數據或僅有一部分數據(即所有數據的95%)中的最大值和最小值。從集中數據排除的數據顯示為單個點,稱為離群值。方框兩端的間距表示數據分散。方框內顯示的中位數的相對位置表示偏斜(圖6)。

7作為示例,提供的盒鬚圖表示在觀察期間內消耗的麻醉藥desflurane的計算量(圖7[9]

 三維效果

最近引入的大多數統計軟體和圖形軟體都具有三維(3D)效果功能。3D效果可以為圖形添加深度和透視圖。但是它們可能會使讀取和解釋數據變得更加困難,因此只有在仔細考慮後才能使用它們。所述的3D效果的餅圖上的應用使得每個切片區分大小變成困難。即使切片的大小相似,距離餅形圖最前面的切片也可能看起來比靠近前面的切片小(圖8)。

 

 繪製圖形:示例

最後,我們以折線圖為例說明如何建立圖形(圖9)。在圖9中,隨機產生動脈壓的平均值,並假設已經每小時測量一次。在許多圖中,x軸和y軸在零點處會合(圖9A)。在這種情況下,由在t = 0的數據,因為與y軸重疊,因此無法傳達對應的平均動脈壓量測值的平均值和標準偏差相關資訊。通過分隔零點可以清楚地暴露數據(圖9B)。在圖9B中,不同組的平均值和標準偏差相互重疊因此不能清楚地區分彼此。將數據集分離並在單個方向上顯示標準偏差可防止重疊,因此減少了視覺上的不便。這樣做還減少有了y軸上過多的刻度,從而增加了圖表的可讀性(圖9C)。在最後一個圖中,連接不同時間點的線,使用了不同的形狀,以進一步區分數據。並且縮短了y軸上,用以消除先前圖中存在的不必要的空白(圖9D) 。

通過將每個組分配給不同的顏色,更改點的形狀或包括不同格式的圖形,可以使圖形更易於解釋[10]。在圖表中使用比例尺的隨機設置可能會導致不恰當的呈現數據,從而欺騙讀者的眼睛(圖10)。

由於篇幅所限,我們無法討論所有類型的圖,而是專注於描述學術文章中經常使用的圖。我們根據數據分析方法總結了常用的圖形類型

3.有關圖形設計的一般準則,請參閱期刊投稿要求2)。

結論

文字,表格和圖形是有效的通信媒介,可呈現和傳達數據和資訊。它們幫助讀者理解研究的內容,保持自己的興趣,並有效地呈現大量複雜的資訊。由於期刊編輯和審稿人在閱讀全文之前會仔細閱讀這些演示文件,因此不能忽略其重要性。因此,作者在收集高品質的數據並進行分析時,必須密切注意選擇適當的數據表示方法。  

此外,認識和解釋表圖的能力,能夠完善的理解數據演示和適當使用不同的方法,以這樣的方式避免不當呈現出現數據或以數據欺騙了讀者'眼睛[11]