不敗的數據學 ~Statistics Done Wrong~

我最近花了很長的時間讀一本科普書,書名是《不敗的數據學》。這本書的主題是統計學中的錯誤觀念,講述了p-value、假設檢定、信賴區間等甚至數學系大學生都不一定理解的名詞,但這不能怪學生不用功,作者舉出了許多實例,連聞名的《Nature》雜誌或醫學論文中,也有許多科學家發表了基於對統計觀念的錯誤認知導致的錯誤研究。究其原因:統計太複雜,我們不知道數字代表的是真相或是我們想看到的假象?

 

 

舉個簡單的例子,為了獲得統計數據,我把任教班級的學生分成喜歡吃蕃茄肉醬義大利麵和喜歡吃奶油培根義大利麵的兩派,然後開始調查他們各科的成績好壞,統計出以下表格,接下來從這些數字中故意推論出一些違背常理的結果。

義大利麵統計表

 

推論1:吃義大利麵導致運動能力降低。
新聞標題1:「驚!常吃義大利麵恐導致這種後果!」

從體育項目來看,兩種麵類的調查結果都是待加強的人較多。事實上這個班級剛好是女生較多的文組班,對運動項目普遍不拿手,所以是很正常的統計結果,與義大利麵毫無瓜葛。這個錯誤成因是因為調查的群體並不是隨機的,於是產生偏頗的結論。

 

推論2:吃奶油培根義大利麵的人比較沒有公民素養。
新聞標題2:「這些人沒有公民道德,竟然是因為吃了這個!」

從公民項目來看,蕃茄派的人良好比例超過六成,奶油派的人公民良好比例則低於待加強,因此下了這個標題。這個錯誤成因可以說是把運氣造成的結果視為科學證據,調查中我們每個科目都問一問,其中某科目良好比例偏低一點都不奇怪,只是因為符合我們想要的結論就被放大檢視。

 

 

書中還列舉了更多更深的謬誤,以及因為錯誤的統計觀念引發出的嚴重後果。連專業的統計分析人員都會落入統計的陷阱,那我們一般人該怎麼辦?在書的末段,作者提出了一種從教育研究中發展出來的學習策略,那就是老師必須在課堂上要求學生回答問題,藉由師生及同儕間不斷的對話、討論,讓學生正視自己的錯誤、釐清觀念。哎?等等,聽起來是我們每個老師一直都想做的事情啊?

 

 

本書的書名叫做《不敗的數據學》(原文標題是Statics Done Wrong,我也不知道怎麼翻譯的),沒有接觸過統計的人閱讀會很吃力,因為在機率統計的領域中著實存在很多違背常識的常識,經過翻譯後的文字也必須再三咀嚼才能理解。作者在每章的末段都有重點整理,就像是一堂課最後五分鐘的重點回顧,值得一看,推薦給所有為教育奔走的老師們。

發表迴響