教學分享:進階數據分析篇

我這兩年除了教物理之外,還有一門SPSS數據分析的課,差不多每個學期都要教兩三回。教物理學與教數據分析有很大的分別。那些來學物理的通常是新生,我主要給他們講一些基本的概念,補個底,間中講一些讀書技巧。最重要的戰略目標是引起他們對這門學科的興趣,學術上不用講得太過深入。

學數據分析的就不同了。他們通常是三年班和四年班的學生,來上課是為了準備畢業論文,因此我的教學方法也有很大不同。通常是三個小時一節課,我先給他們講統計學,要講得深入實在,不能只講概念,更不能流於表面。講完之後,我讓他們在Kahoot!答一些問題,測試他們對基本概念的掌握。

之後便是在電腦上操作。我任教的院校要學生用SPSS來做數據分析,但是學生對這個軟件也多半不認識。所以在課堂的第二部分,我要為他們示範怎樣用SPSS來做相關的數據分析。通常是我做一步,他們跟著做一步,確保他們能夠知道這些功能放在哪裡、怎樣用。

但是只跟著我做的話,學生不可能學得好。因為做統計分析,除了要有概念和知道操作的方法,更重要的是有實作經驗。在數據分析的世界裡,很多事情一定要親身經歷,撞幾次板才能學會。沒有實戰,沒有撞過板,無論看書看多少遍,都不可能學到這些經驗。因此在課堂的第三部分,我會讓他們做一些實作練習。我給他們一組數據,要他們把我之前示範過的分析自己再做一遍。當中我也加入了一些陷阱,讓他們碰到困難的時候想辦法解決。

我設計的這個統計學課程共有三節課。第一節講的是怎樣準備數據(data preparation),第二節講描述性統計(descriptive
statistics),第三節講推論性統計(inferential
statistics)。三節課裡面,我覺得最重要的是第一節。因為現實世界的數據都是不完美的,裡面肯定有很多錯漏。比如說,一般人可能不會留意到數據中的”male”與”M”對電腦來說不是同一個意思,甚至”male
“與”male”也是不同的。因此我每次總是對學生反復強調,做任何統計分析之前,第一步就是要淨化数据(clean the
data),排除那些會影響分析結果的因素。

附圖是我用來讓學生找錯處的數據。這一組數據至少有六種錯誤,會影響到分析的準確性。在上課的時候,我要學生找出這六種錯誤,然後在SPSS上淨化之。之後我給他們做練習的其它數據,都隱含各式各樣的錯誤,我總是要他們先把這些錯誤處理好,才能開始數據分析。

你能找到數據中的錯誤嗎?

對於這兩種不同的科目,我是各有各的喜歡。講物理學入門,範圍廣闊,不用講得深入,有很多吹水的空間,我講得高興,學生也聽得高興。專業的統計學和數據分析技巧則比較沉悶,學習的樂趣藏在較深層次,一般學生未必能感受到,所以我只能用一些很功利的原因來觸發他們的外在動機。但是數據分析也是我的興趣,如果碰到肯用心學習的學生,滿足感會比流於表面的入門課大得多。

本網相關文章:

教書,不只是演講而已!


About the Author

發表回覆

你的電郵地址並不會被公開。 必要欄位標記為 *