尋日友站《港人講地》話特首民望調查俾好多零分嘅極端受訪者拉低哂,仲話呢D 數據「藏在民意網站的暗處」,於是我就去咗香港大學民意網站睇吓:
咦?咁容易就俾我download 原始數據?
Download咗個file,發現係俾SPSS用嘅.sav格式,唔怪得友站話「要以特定軟件才能打開」啦。不過我用免費嘅「R」都開到。1
今次用嘅數據於2014年3月14日從港大民調中心下載;至於R codes,我放咗響Pastebin。
友站話除咗平均分,評分分佈都好重要,咁就畫個直方圖(histogram) 睇吓啦。
係喎,個評分中位數50分,而有唔少人俾0分,拉低個平均分去到47.4...2咪住先,友站同港大民調都話平均分係47.5。友站一定唔會咁唔認真,唔睇清楚數據就亂噏嘅,一定係我計錯數。
原來我唔記得加權。
港大民調網站話,佢哋每一次都會將原始評分,「根據香港人口的年齡性別分佈加權調整」。例如如果今次電話訪問,有41.5%嘅受訪者係男性,但係原來香港人口有45.4%嘅人係男性,比受訪者入面嘅男性多,咁我哋就要將男性原始分數嘅比重加多D,平衡返,等數據可以代表香港市民。
好喇,等我加權之後再畫個直方圖出嚟。
今次個平均分,四捨五入之後係47.5,似乎我今次計啱數。咦,但係平均分大過中位數,而大部份數據都響圖嘅左邊,似乎俾梁特首高分嘅受訪者先係極端人士,而
即係話,友站一係就無睇清楚數據,一係就計過數之後選擇性公佈結果,再指港大民調「藏頭露尾…實在無法不令人懷疑民調背後的用意,即使不是存心誤導,但這又是否一個公正持平的民調機構所應採用的發布方式呢?」實在乃零步笑百步之見。