大數據分析看施政報告 土地政策誰最關注?
近期香港愈來愈多人關注大數據分析(Big Data Analytics),希望以此觀察民意,了解網民對時事議題的想法。我們會以施政報告作輿論分析(Public Opinion Analysis)例子,看看如何以大數據分析及社交媒體聆聽(Social Listening)找出網民的意見,尤其針對施政報告幾個政策範疇,觀察其熱議程度,並解釋如何以源大獨有機制,深化分析。
這篇文章採用的方法與一般常見分析不同。我們會以決策者及政策研究(Policy Analysis)的角度出發,深入分析網民在土地住屋、民生派糖、青年政策等方面的討論。市面上不少大數據和社群聆聽工具都以技術主導,追求機器自動找出答案,因此他們的分析結果會集中描述數量,例如趨勢圖找輿論高峰,或是詞雲圖等等。然而這些對決策的幫助又是否足夠?
1) 政策範疇分析
按一般的做法,簡單的棒型圖可以展現不同媒體的分佈,圖表中Facebook的聲量大幅高於論壇和新聞,但我們卻無從得知各個社交媒體平台的討論重點差別。
源大強調分析員可掌控分析角度,教導機器學懂施政報告中常出現的不同政策範疇,強化數據挖掘(Data Mining)的深度。
進階版的圖表顯示「土地住屋」為各個社交媒體平台討論比例最高,新聞網站對各個議題都有涉及,Facebook相對較關注「民生派糖」,而論壇討論的範疇最窄,當中「安老政策」的討論比例為各平台最高。
這有助政策研究或輿情分析的研究人員知道網民較關心哪種議題,或應在什麼社交媒體平台加強宣傳政策。

2) 政治陣營分析
要即時了解社交媒體不同時間的討論熱度,技術主導的方法能自動製作出一個基本的社交媒體聲量趨勢圖,如圖中施政報告聲量趨勢中,清楚展示10月8日是輿論的高峰。惟在這一個簡單的圖表中,我們未能得知提供聲量的是什麼人,代表何種價值。
源大數據透過人工編碼,教導機器學會分辨不同政治陣營,圖表顯示聲量多數來自非建制/民主派陣營,反映該陣營相對建制派而言,對施政報告有更大回響和意見。同一個趨勢圖因而更富輿情分析價值,亦方便我們理解大數據背後的意義。
源大數據相信大數據蘊藏更高價值,縱使運用AI人工智能,機器依然有各種不足,我們相信以人工介入可以令輿情分析和社交媒體監測(Social Media Monitoring)更上一層樓,而我們自家設計的xMiner平台獨有靈活機制,能方便做到人機結合,在文字分析(Text Analysis)上能針對文本內容挖掘深層意義和洞察,達到真正「快、廣、深」,為市場獨有。
源大主張以機器輔助內容分析法(Content Analysis),機器令數據採集、存儲、處理、分析變得更輕鬆,同時,以人工深入分析數據的意義,將結果從表層的數據升級至深層研究,亦能因研究方向的不同,令數據延展出無限可能。
——————
想了解如何輕鬆監測網絡輿情、執行研究?可瀏覽以下網頁,或電郵至info@umaxdata.com.了解更多: