有同學問我如何看全民退保學者方案的計算,特別最近引起一番爭議的變數問題。我想從社會科學就統計運用出發,解釋一下問題所在。
在社會科學研究中,統計學的主要應用在於估算某因素對另一因素的影響:例如吸煙對存活率的影響,又或加價對需求的影響等。這樣的估算用的總是已有數據,分別只是數據有多新而已。因為已發生的事實只可能有一個,學者的責任就是盡力準確估算這個未知的事實。
因應上述的要求,傳統的社會科學統計訓練非常重視估算的無偏性(unbiasedness)。無偏性的意思是估算平均來說是準確的,而最具代表性的例子莫過於常見的線性回歸分析(Ordinary Least Square)。讀過計量經濟學的同學或許會記得(惡夢!)OLS的特點「BLUE」—Best Linear Unbiased Estimator。意思就是在無偏性的要求下,沒有其他線性模型比OLS更佳。
問題是,準確估算過往效果和就未來作出推算是兩會事。事實上,無偏性和估算的誤差範圍是有著取捨關係,統計學就此亦有相當的理論和驗證。在較進階的計量經濟學課程中—即係每年只有幾個本科同學會選修嗰啲—會教授一些相關的知識,但在整個經濟學課程中並非太受重視,因為如前所述,學者最需要的技巧是準確分析已發生的數據。因為經濟學以外之社會科學要求的統計學訓練更少,問題相信只會比經濟學更嚴重。
可能有同學會問,像全民退保這樣重要的社會議題,怎麼沒有統計學者去做嚴謹的推算?答案很簡單,因為對仕途有害無益。我過去已經解釋過,香港由教資會以降均看重學者著作的國際影響力,而像全民退保這樣的本土議題是上不了好的國際期刊,搞不好還要被人批評一番。吃力不討好,又何必自討苦吃?
《全民退保學者方案》:
http://www.legco.gov.hk/yr15-16/chinese/panels/ws/ws_rp/papers/ws_rp20151207cb2-398-1-c.pdf