多媒體網頁設計

2009年6月2日

「標準差」為什麼要除以「n1」   葉連昌

「標準差」為什麼要除以「n-1」   葉連昌

印象中,在我的求學過程裡並未接觸到「標準差」的概念,師大畢業後在國中任教了十三年,也只有在「資料整理」中教學生畫畫統計圖表而已;後來轉進高中教學,才開始研討「離差」及「相關係數」等教材(說白一點,第一次教高二數學時,我跟學生一樣是個「初學者」)。一晃又是十三年多,對統編本「」的公式,無論正的、倒的、橫的、豎的都可以跟學生解釋得頭頭是道之時,ㄧ綱多本的數學教材中突然冒出了「」這樣一個「莫名其妙」的公式(即「樣本標準差」)。好長ㄧ段時間,心裡既自責又徬徨更氣憤,自責的是這十三年來被我教到的學生全被我「誤」了;徬徨的是我該如何去解釋這「n-1」?要學生死背嗎?(這那是我的教學態度?)還是另編一套理論來「誤人子弟」,硬是將公式說得清清楚楚?(那又該怎麼說才好呢?)氣憤的是為什麼不繼續沿用「」呢?(新教材簡直就是在整人嗎?)……這個問題在很多的研討會中被提出來討論(原來我並不孤獨,與我一樣心路歷程的人還真不少),勉強接受了「不偏估計」的說法,但會後討論、抱怨聲仍不斷,多數人還是希望統一使用」這個公式,不要再分什麼「母群體標準差」或「樣本標準差」,徒增「教」、「學」之困擾。(說的也對,您怎麼分辨是「母群體」還是「樣本」?題目是「求標準差」時,到底要算哪一個?總不會兩個都要算吧?)

抱怨歸抱怨,心想新書既敢出版,表示「」這樣的定義應該是無庸置疑的,不妨先弄清楚它的理論根據再說吧。沒想到經過一段時間的摸索、學習之後,不但接受了這個說法,更認為「」應該是「高中數學」中「標準差」的唯一定義,略舉數項個人論點如下:(僅提供參考,非論教材之是非)

一、        高中數學的「統計」教材,開宗明義就是「統計抽樣」,其目的是想藉由抽取之「樣本」所提供的資訊來推估、瞭解「母群體」的狀況。重點既然在於「由小看大」、「以少推多」,因此一概看成「樣本資料」而直接採用的定義似較合理,「母群體標準差」應該是可以不必討論的

二、        「樣本標準差」一詞很容易被解釋成「被抽取之樣本資料的標準差」,其實不然,它應該還是「母群體」的標準差,因它是藉由樣本」來推估全體的標準差,才稱之為「樣本標準差」的。

三、        「班上40位同學之數學成績的標準差為多少?」看到這個題目,不免要問:要除以39還是要除以40?除數為39很難算耶?只要出題者多用心,將數據湊得好,欲求近似值之小數位數給的巧,讓兩種算法之答案一樣,爭議其實不大。但如果將題目設計如「某校高一學生數百人,利用系統抽樣得40位同學之成績如下,試估算該校高一學生成績之標準差」多點情境,或標準差的定義只有一個,疑問、爭議都沒了。

四、        Microsoft Excel」試算軟體中,標準差函數「STDEV」所傳回之值就是「樣本標準差」(不信,您可試試;人家老外早就這樣算),難怪以前在教統編本時,用電腦算的都非標準答案,今天才恍然大悟。

五、        若取母群體的算術平均數E(X)(即整群資料的中央趨勢)來算離均差,因為,為了使的值與更接近,就必須將的值適度放大,通常採用作為樣本標準差的定義,至於為什麼要取「n-1」,請參考大同資訊教師手冊中詳細的說明(如附錄)。

【附錄】所述,老師們看看可以,要跟學生討論,那就難了! 很好解釋(「平均」除以n」是天經地義的事),那除以「n-1」該怎麼講呢?我是這樣「騙」學生的,也提供您當參考。

【例】某家庭10個成員的年紀為:  33, 47, 51, 57, 61, 65, 75, 80, 87, 94(歲)
當家的是65歲的老楊,請問這個家中平均一個人差老楊幾歲?

【解】|33-65|=32|47-65|=18|51-65|=14
|57-65|=8
|61-65|=4|75-65|=10
|80-65|=15
|87-65|=22|94-65|=29
32+18+14+8+4+10+15+22+29=152
(是除以9喔,居然少了ㄧ頭「楊」!)
平均一個人差老楊16.89歲。

【註】這個例題是在未教「離差」之前即讓學生練習,結果95%的學生是這樣解的(除以9),另外5%的學生也不是除以10,他們是不屑算(我沒有強迫他們非算不可)。

【註】65歲恰為歲數平均數,16.89歲應可稱為平均絕對離差。


【附錄】(摘錄自大同資訊第四冊教師手冊第274頁至第277頁)

設全體資料數值有N個,它們分別為X1, X2, X3,,Xn,如果以簡單隨機抽樣法,從全體中抽出n個數值,它們分別為x1, x2, x3,,xn,則全體的平均數全體的變異數。而抽到的n個數值的樣本x1, x2, x3,,xn的平均數為,且在N個數值中取n個的方法數為。因此,就有個樣本的平均數,這些平均數的平均數以表示時,的值為何呢?下面就來推算它,並討論樣本的標準差的處理原則。

(1)(此處為全體的平均數)

證明:令

(因為每個數值被抽到的機率為),

因此

而變異數

其中

即可得

因此

(2)的變異數

證明:對兩個變數而言,之積也是一變數,

稱為的互變異數,

因此,

  

因此,

亦即,通常稱為有限全體的修正係數。

因此,當樣本抽出率很小,或N無窮大時,

(3)如何選擇樣本標準差的求法

(A),其中

因此,可知

亦即

所以要以來評估全體的標準偏差時,必須將根式中的n

稍微縮小些,較能代表全體的標準差。

(B)(A)的結果與(2)的推論,可得

亦可表成,此處用來估計之值。

所以,求n個數值樣本的標準差以求之,

適合。

 

 

http://w3.cmgsh.tp.edu.tw/~math/05.doc

尚無評論

尚無評論。

RSS feed 此篇文章的評論。

抱歉,此時評論的功能已被關閉。

Powered by WordPress