資料來源:
https://iase-web.org/documents/papers/isi52/rams0070.pdf
International Statistical
Institute, 52nd Session 1999: James B. Ramsey
James B. Ramsey
New York University, Dept.
of Economics
269 Mercer St.
New York, NY 10003, U.S.
James.Ramsey@Econ.nyu.edu
1
簡介
統計學家向非統計學家介紹自己時,通常會遇到這種情況。“我做過一次統計並且討厭它,因為所有這些公式都要記住。”問題是我們為什麼會得到這種反應,以及我們能做些什麼。在我下面的回答中,我假設非統計學家應該對統計和概率有相當複雜的理解,這對整個社會有用,更不用說專業本身。此外,令人沮喪的事實是,公司、政府機構和其他組織的工作人員包括個人,甚至是那些擁有碩士學位的人,他們不了解自己在做什麼以及為什麼這樣做。我們應該再次詢問為什麼所描述的對學習統計狀態是普遍正確的。
答案在於該學科非常特殊的性質,與教師不願意認識到這一事實對統計學教學的影響。統計學不能像數學或物理那樣教。要記住的兩個關鍵概念是統計的主題本身是因果關係,而分佈是理解統計概念的關鍵。我要說的大部分內容對我的同事來說都是顯而易見的。但是我們忘記了這些事情對學生來說並不明顯。事實上專業統計學家的直覺,與外行的心態之間的巨大鴻溝,是溝通困難的主要來源。
因為學生發現典型的統計說明如此令人困惑,學生的辯護是完全依賴於公式的記憶。然後將記住的公式插入到“問題”中,而這些問題已經制定了經驗法則。通常在教師的幫助下,用以了解將哪個公式插入到哪個問題中。這是在課程中獲得好成績的策略。然而,一旦採用了背誦策略,學生的學習就完全失去了意義。
本文的其餘部分,致力於說明統計學主題,與其他看似相關的學科之間的關鍵區別知識。在這些見解的基礎上,我試圖推斷出對統計學教學的影響以及對統計教學其實施的實際建議。
2
統計學的獨特特徵
學生和普通大眾熟悉簡單的因果關係概念。的確他們可以說是在以因果關係的基礎上來安排自己的生活,用以“解釋”每一個事件,尤其是具有負面後果的重要事件。特別是對於顯然沒有物理解釋的事件。他們尋找代理人的作為因果因素。普遍的想法是,有人應該受到指責或感謝。但是無論如何都要歸功於觀察到的結果。
統計學和概率論本質上是一個因果關係。這個簡單的事實是外行人理解隨機現象的第一個主要障礙。從具有無處不在的因果解釋學科,轉變為具有內在原因的學科,這代表了重大根本性的觀點轉變。並且不能僅僅將其視為另一種“解釋”。與接受事件是隨機的概念相比較,學生更容易接受來自不同學科對某些事件序列的解釋。儘管每個人都接觸到統計學家所宣稱是隨機性的壓倒性證據。但這種觀點代表了學生的深刻洞察,而實際上很難理解此機率性的證據。這就是為什麼教統計學不像教數學,也不像教物理的原因。
起源於這種洞察力的概念是分佈,及其與物理實驗的聯繫對於理解統計推理至關重要。分佈的概念對學生來說是神秘的。個體現象可以獨立分佈,但這些隨機事件的大量集合的“分佈”可以在數學上非常規律地描述。充其量對學生只是一個包裹在謎團中的謎團。獨立是典型的例子。許多心理學實驗表明,人們期望樣本即使是小樣本,也具有代表性。因此協調獨立性與給定理解分佈性狀的能力是一項挑戰。一個常見的誤解是:“如果連續拋出十個正面,那麼接下來的幾次拋擲必須是反面,結果才能代表分佈。”
第二個困難來源是由於統計推理非常抽象。儘管我們試圖將我們的概率理論與觀察到的事件聯繫起來。但對於普通學生來說,這個練習是非常陌生的。理論與觀察之間的聯繫並不容易。無論我們作為統計學家承認多少次。事件發生了,學生既不知道如何發生,也不知道為什麼發生。具體觀察和一般推理之間的聯繫,對學生來說是不透明的。抽象思維訓練的減少,並沒有幫助我們的講課,這是傳統教育的標誌。
考慮一對簡單的例子。在解釋胡克定律時,學生很容易想像拉伸彈簧和量測所需力的過程。或者,想像一下對擲骰子結果的簡單統計解釋。對於學生,根本沒有任何解釋。實驗結果在統計學家的“解釋”之後和之前一樣神秘。學生尋找的解釋依賴於拋硬幣者無法準確控制他的拋擲,或者拋硬幣者在開始拋硬幣時故意交替設置正面和反面等等。
最後,最困難的方面是將統計推理與物理、化學、生物學和經濟學等與物理同源的學科聯繫起來。因為統計學並非是全然因果關係(acausal),而同源學科本質上是因果關係(causal),所以學生很難理解兩者之間的聯繫。在相關學科理論的表述本身必須根據分佈來表述的情況下,難度更大。統計力學、生物學或經濟學都是如此。
3
對統計學教學的啟示
以上評論表明了統計學教學的廣泛策略。
第一項任務是必須立即、直接和廣泛地處理隨機性的概念。學生必須認識到,他被要求考慮與他認為他理解的那些非常不同的現象。通過各種物理機制說明隨機結果是最好的。學生需要能夠直接觀察產生隨機數的機制,如果他能自己操縱系統的參數那就更好了。要吸取的主要教訓是,雖然個人結果是不可預測的,但群根本的集合表現需要解釋的規律。最好讓學生自己發現隨機數據的這些看似不可調和的雙重特徵。此外學生認識到重複相同的實驗會產生相同的分佈,但在統計上,不同的實驗會產生不同的分佈,這一點十分重要。重複的物理例子,包括在學生控制下的電腦生成的實驗,似乎是達到預期結果的最佳方式。講課幫助不大。用以說明的實驗種類,越多越好。
支持學生理解統計分析過程的下一個基本要素是,計算公式背後的理論對於所做出的解釋來說,絕對是必不可少的。與任何其他學科相比,如果沒有支持理論,我們幾乎無法談論任何觀察到的情況本身,更不用說對未觀察到的事件進行推斷嘗試。我們假設從相對較少的觀察中推斷出廣泛的事件類別、相關分佈或隨機過程、與其參數值。並假設“最佳”決策程序。對於學生和外行來說,這幾乎是魔術,或者說最糟糕的學術狂妄自大。
成功的統計學課程的關鍵前提是學生的數學訓練。這對於所謂的“非數學”課程甚至更重要。要解決的問題是這個。太多學生的數學訓練使他們沒有準備好處理一般的抽象,特別是代數。對於又學過一兩門微積分課程的學生來說更是如此。他們記住了一串公式,但對基本原理知之甚少。我總是以實驗室課程開始我的課程,以確保學生接受代數使用方面的訓練並且熟悉sigma符號。我發現這樣做的方法是從具體開始,然後展示抽象的分析優勢;關鍵是從實際數字開始,然後展示代數的作用。與學生一起回顧微積分的基礎原理也是有用的。在統計學入門課程中,基本概念是最重要,而不是通常教授微積分的形式主義。另一個必然的方法是引入任何至少在當時不能給出直觀解釋的概念、函數或公式。例如,在我解釋了期望和偏差之前,我不會介紹與常規相反的統計量
s^2。同學們就可以自己去發現s^2的道理。
雖然學生只能通過練習來學習是不用再說明。在設計練習以滿足特定目標方面沒有花太多心思。我注意到練習有三個基本功能。試圖將它們組合成相同的練習題,既沒有效率也沒有效果。
第一個是最簡單的,讓學生有機會獲得處理數據和計算的技能。學生需要練習實際計算平均值、變異量、相關係數、Student's
t 和 F
比率以及所有其他公式。第二個任務是幫助學生探索他們正在使用的統計數據的屬性和特徵;我稱之為“探索工具”。這個想法是讓學生檢查統計原理在各種特殊情況下的行為,發現它們的局限性,並了解計算值提供了什麼。例如,學生應該能夠“估計”增加了更大、更小、相同大小或零的觀察值對變異量的影響。同樣,要求學生確定在先前計算中,添加和減去不同相對大小的數據對相關係數的影響。能夠通過觀察散點圖來猜測相關性的數量級和符號。過檢查直方圖來猜測較分佈的符號和大小等等。
第三個任務只有在其他任務成功完成後才能處理,稱為“應用程序”。但即使是在這裡,也需要對所做的事情進行更多的思考。
我相信,沒有什麼比反覆要求計算平均值和變異量並寫下 5%
信賴區間對學生的興趣更具破壞性的了,即使對假設上下文的描述有所不同。應用問題應該假定答案的計算部分已經成功完成。問題的重點應該是統計數據計算的最重要的解釋和可能的用途。關鍵問題是:“我們從生成數據的過程中學到了什麼?” 計算統計數據是達到目的的手段,而不是目的本身。 |