大數據分析看施政報告 土地政策誰最關注?

近期香港愈來愈多人關注大數據分析(Big Data Analytics),希望以此觀察民意,了解網民對時事議題的想法。我們會以施政報告作輿論分析(Public Opinion Analysis)例子,看看如何以大數據分析及社交媒體聆聽(Social Listening)找出網民的意見,尤其針對施政報告幾個政策範疇,觀察其熱議程度,並解釋如何以源大獨有機制,深化分析。


這篇文章採用的方法與一般常見分析不同。我們會以決策者及政策研究(Policy Analysis)的角度出發,深入分析網民在土地住屋、民生派糖、青年政策等方面的討論市面上不少大數據和社群聆聽工具都以技術主導,追求機器自動找出答案,因此他們的分析結果會集中描述數量,例如趨勢圖找輿論高峰,或是詞雲圖等等。然而這些對決策的幫助又是否足夠?


▶ 政府紓困措施為例  教你三步完成大數據輿情分析 ◀

▶ 張Sir講數:利用AI輔助挖掘網絡意見的價值 ◀


1) 政策範疇分析

按一般的做法,簡單的棒型圖可以展現不同媒體的分佈,圖表中Facebook的聲量大幅高於論壇和新聞,但我們卻無從得知各個社交媒體平台的討論重點差別。


源大強調分析員可掌控分析角度,教導機器學懂施政報告中常出現的不同政策範疇,強化數據挖掘(Data Mining)的深度。
進階版的圖表顯示「土地住屋」為各個社交媒體平台討論比例最高,新聞網站對各個議題都有涉及,Facebook相對較關注「民生派糖」,而論壇討論的範疇最窄,當中「安老政策」的討論比例為各平台最高。


這有助政策研究或輿情分析的研究人員知道網民較關心哪種議題,或應在什麼社交媒體平台加強宣傳政策。

 

▶ 張Sir講數:挖掘社交大數據中的關係價值 ◀ 

2) 政治陣營分析

要即時了解社交媒體不同時間的討論熱度,技術主導的方法能自動製作出一個基本的社交媒體聲量趨勢圖,如圖中施政報告聲量趨勢中,清楚展示10月8日是輿論的高峰。惟在這一個簡單的圖表中,我們未能得知提供聲量的是什麼人,代表何種價值。


源大數據透過人工編碼,教導機器學會分辨不同政治陣營,圖表顯示聲量多數來自非建制/民主派陣營,反映該陣營相對建制派而言,對施政報告有更大回響和意見。同一個趨勢圖因而更富輿情分析價值,亦方便我們理解大數據背後的意義。


源大數據相信大數據蘊藏更高價值,縱使運用AI人工智能,機器依然有各種不足,我們相信以人工介入可以令輿情分析和社交媒體監測(Social Media Monitoring)更上一層樓,而我們自家設計的xMiner平台獨有靈活機制,能方便做到人機結合,在文字分析(Text Analysis)上能針對文本內容挖掘深層意義和洞察,達到真正「快、廣、深」,為市場獨有。


源大主張以機器輔助內容分析法(Content Analysis),機器令數據採集、存儲、處理、分析變得更輕鬆,同時,以人工深入分析數據的意義,將結果從表層的數據升級至深層研究,亦能因研究方向的不同,令數據延展出無限可能。


——————
想了解如何輕鬆監測網絡輿情、執行研究?可瀏覽以下網頁,或電郵至info@umaxdata.com.了解更多:


▶ xMiner:文科生亦能玩大數據  專為時事分析而設 ◀



輿情重點一眼知-製詞雲圖 輕鬆上手

【詞雲圖一鍵製作】

無論是學生做project、記者寫報道、研究者做報告,經常都會用到詞雲圖,勝在可以用一目了然的方式呈現最常出現的字詞。但詞雲圖有時效果一般,字詞劃分亦不理想,到底如何做出好看易明的詞雲圖?

詞雲圖利用不同的字體大小和文字顏色,呈現出議題中的詞頻,用戶一眼就可從雜亂的數據中發現有意義的資訊。源大數據人工智能大數據分析平台xMiner(前稱uMiner)內置詞雲圖功能,幾個步驟就可簡單製作詞雲圖。

*簡單設定 圖表一秒成型*

圖中的詞雲圖以新的iPhone手機為主題,監測各大的社交媒體的回帖,期望知道網民的關注點。
我們於上個帖文有介紹過關鍵詞設定的方法,設定好系統就會幫你撈取相關數據,即可在平台上製作圖表。然後基於希望監測的內容,可對圖表進行基本設定,比如特定的媒體、指定日期、主帖或回帖等。

舉例小編希望了解社交媒體中網民在一周內對新iPhone的反應,便設定條件為9月6日至12日中Facebook、論壇和Instagram中的回帖。

*兩招加工 圖表更清晰*

xMiner(前稱uMiner)平台預設的顯示詞為100個,最多可達1000個。

第一招 – 停用:
詞雲圖一開始未必盡如人意,因為會有不少價值較低的常用詞,如「可以」、「已經」等,詞頻很高但對分析的意義較低,我們可以直接在平台中通過「停用」,自行刪去這些詞語。
同時,小編亦停用了「手機」、「電話」等字眼,因為在討論iPhone時這些字眼會和主題高度重疊,導致未能有助理解輿情,停用令圖表更簡潔易明。

第二招 – 組合:
另外,有部分字眼意義相近,例如「中國」和「大陸」所指的內容大致相同,我們會以「組合」的方法,將意思相通的字眼合併,以準確地呈現相關概念的關注度。

*地區化詞庫 分詞更精準*

詞雲圖背後不單有大量數據支援,中文內容更要求精準的界詞技術和自然的語言處理。
源大數據背後累積十年的中文詞庫,亦一直與時並進,不斷新增新詞、方言,如這次顯示的詞雲圖,就能分辨出廣東話獨有的「核突」。

——————
想了解如何輕鬆監測網絡輿情?不妨inbox我們或到源大網頁:www.umaxdata.com,索取相關個案及洞察報告。
#SocialListening #社交媒體聆聽 #社媒聆聽 #大數據 #網絡挖掘 #社交媒體研究

 


監測大數據輿情-新手上路 只需三步

【文科生都識玩大數據】

源大數據常用大數據分析,一有社會事件發生幾小時內就可完成多個清晰而有意義的圖表,但其實背後製作並不複雜,毋須「IT底」,只需一個人、一個平台、三個步驟就做到。

Step 1—篩選數據

一開始我們的分析師會利用關鍵字,在人工智能大數據分析平台xMiner(前稱uMiner)輸入,平台就會即時在各大新聞網站、Facebook、Telegram、論壇等來源中篩撈出相關數據,幾秒內你已經可以檢閱基本數據如聲量、趨勢、熱帖、意見領袖等。

以財爺推出的紓困措施為例,我們先為事件選定一連串關鍵詞,除了「撐企業」、「保就業」等官方字眼外,亦要加入關鍵人物「陳茂波」的名字。設定關鍵詞時也要考慮網民的常用字眼,加入「財爺」、「波叔」、「派糖」,可以令採集到的數據更貼近網民的真實反應。

Step 2—設定研究問卷

分析社會事件輿情,我們必須要再深入分析如討論焦點、關鍵人物等,才能得到真正有意義的洞察。

透過閱讀官方資料,並從熱帖、網民討論和留言觀察網上輿論,我們先整理政府推出的措施,理順網民關注點,從而定出研究方向。

這次我們要研究的方向是,希望了解具體紓困措施所得回響及反應。就此議題,我們要先為訂製一張「問卷」,將雜亂的數據內容以概念整理分類。

是次政府共推出了六個「紓民困」措施,其中包括電費補貼、代繳公屋租金、綜援及長生津出雙糧、學生津貼、稅務寬免及低收入家庭津貼。

我們透過設定「問卷」,教電腦對資訊進行分類,例如「學生津貼」,很多人會直接表述為「派錢」予學生,或用「2500元」的金額代替官方用字,為了更清楚界定相應概念,我們會在設定時需要加入網民常用字眼。完成問卷後,機器會自動作編碼和處理,得出結果。

Step 3—製作圖表

此時你已經可以直接在平台上製作圖表,過程只需一拖一點,將所需的數據項目組合,再從10個不同的圖表中選擇,即時生成包括圓形圖、折線圖、桑基圖等。

例如範例所用圖表以圓形圖展現,可以清楚看到不同紓困策略之間的比例,知道網民的關注焦點;
折線圖則可以清楚表現不同時期輿論焦點的變化趨勢;而不同項目和人物之間的關係,則可以桑基圖呈現。

從設立話題到完成製圖,只需三個步驟,日後更可隨時在第三步更改圖表的內容、模式,隨意製作其他圖表,易學易用,文科生、社科生都可以無障礙用大數據~
#喜歡的請follow我們給點鼓勵

——————
想了解如何輕鬆監測網輿情?不妨inbox我們或到源大網頁:www.umaxdata.com,索取相關個案及洞察報告。
#紓困措施 #共渡時艱 #SocialListening #社交媒體聆聽 #社媒聆聽 #大數據 #網絡挖掘 #社交媒體研究

 


財爺推六大紓困措施 網民最嬲電費補貼

【紓民困,能否減民憤?】

財政司司長陳茂波昨日提出六大措施,希望應對經濟挑戰,與市民共渡時艱,其中包括電費補貼、代繳公屋租金、綜援及長生津出雙糧、學生津貼、稅務寬免及低收入家庭津貼。

源大數據以人工智能大數據平台xMiner(前稱uMiner)即時採集16號至17號正午的輿論數據,整合新聞、Facebook、論壇的帖文內容,分析網民及不同群組就新措施的看法。

數據顯示不同措施的熱度值與嬲嬲數成正比,即討論熱度愈高就愈多人「嬲嬲」。「電費補貼」的討論最多同時亦惹最多不滿,後台數據指有人認為出租屋及劏房戶未能享受補助,措施變相益大業主。

對「代繳公屋租金」及「津貼雙糧」的熱度及嬲嬲數則分別排行第二及三,大多數人討論相關措施是否向基層及新移民傾斜。「學生津貼」的關注度則排第四,較多人討論時掛勾近日的社會事件。而「稅務寬免」及「低收入家庭生活津貼」討論度較低,排行第五及六。

不同政治陣營的關注點亦有所不同,泛民主派明顯較關注「學生津貼」,對此的討論較建制多近10個百分點,「稅務寬免」的討論亦稍多。

而建制派在「代繳公屋租金」、「津貼雙糧」及「低收入家庭津貼」的討論百分比較高,顯示較關心對基層的補助。

——————
想了解如何以社交媒體分析社會時事輿論走向?不妨inbox我們或到源大網頁:www.umaxdata.com,索取相關個案及洞察報告。
#紓困措施 #共渡時艱 #SocialListening #社交媒體聆聽 #社媒聆聽 #大數據 #網絡挖掘 #社交媒體研究 #輿情分析

 


PR Crisis Prevented with Social Listening: uMax Data interviewed by SingTao

Sing Tao Daily interviewed uMax Data on the topic of Public Relations Crisis (PR Crisis) and the Use of Big Data and Social Listening. We are pleased to share with you our views and experience in it.

A good public relations strategy could help a corporate to manage its public image, and thus save the company from PR crisis. uMax Data's social listening service gives you all-rounded support from monitoring, early alert, to in-depth understanding of the netizens' discussions for response drafting.


Prevention is the best cure. We believe that a long-term monitoring of the online world, can prevent the company from taking actions far from netizens' expectation, and thus avoid any unexpected backfire.


We provide social listening & monitoring platform with all essential functions at one stop. Users can track their brand image, campaigns, management news, and their online sentiment with ease. We have been rooted in HK & Macau for over a decade, accumulated rich Chinese & Cantonese text mining and analysis experience, which makes us stand out from the crowd.

Contact us now at info@umaxdata.com for our solutions!


大數據處理公關危機 星島日報採訪源大數據

感謝星島日報訪問源大數據,我們樂於與大家分享如何利用大數據應對公關危機。

連結: AI收風大數據分析 成新世代公關術

於網絡世代要處理公關危機,機構往往需要長期觀察、快速應對。源大數據的人工智能輿情分析平合xMiner(前稱uMiner)強調深度分析,找出爭議焦點及網民反應,使公關人員更準確判斷形勢,有效平息事件。另外我們亦實時監測網絡輿情,助你迅速發現突發事態,盡早部署應對。
除了突發事件的處理,要及時作適切應對,長期觀察亦必不可少。xMiner(前稱uMiner)為品牌或單一議題提供長期監察,減輕繁複的資料整合工作,幫助客戶輕鬆追蹤活動成效、受眾情感等指標。
源大數據團隊於港澳地區扎根十年,累積龐大的中文詞庫,系統能夠準確分辨港澳常用字詞,亦能界定出當地政策所使用的獨有詞彙,令分析內容更貼近本地實際情況。
——————
想了解如何利用大數據應對突發狀況?立即電郵至info@umaxdata.com 聯絡我們!

 


沙中綫局部通車 命名「屯馬綫」網民無咁嬲

【要改運先改名?】

日前港鐵公布沙中綫項目評估報告及補救措施,指紅磡車站結構安全,惟須再進行加固工程。運輸及房屋局局長陳帆亦宣布先局部啟用烏溪沙站至啟德站,並稱為「屯馬綫一期」。


源大數據以人工智能大數據平台xMiner(前稱uMiner)分析網上輿論走向,整合新聞、Facebook、論壇的帖文內容,發現新聞及Facebook上提及「沙中綫」及「屯馬綫」的數量相約,惟論壇提及「屯馬綫」的數量稍多,可見論壇用戶「改口」較快。

數據又顯示網民對新名稱「屯馬綫」的負面情緒明顯緩和。雖然在Facebook上提及兩個名稱的數量相若,但針對「屯馬綫」的嬲嬲數不及「沙中綫」一半。

註:港鐵於2018年公布,沙中綫「東西走廊」將命名為「屯馬綫」,惟外界一直多以「沙中綫」稱呼整個興建項目。

——————
想了解如何以社交媒體分析社會時事輿論走向?不妨inbox我們或到源大網頁:www.umaxdata.com,索取相關個案及洞察報告。
MTR #沙中綫 #屯馬綫 #改名改運 #SocialListening #社交媒體聆聽 #社媒聆聽 #大數據 #網絡挖掘 #社交媒體研究


2019書展開鑼 「寫真」勝年度主題成焦點

#書展輿情分析

書展至今已經連續舉辦30屆,本屆由7月17日開鑼,本屆年度主題為「科幻及推理文學」。

源大數據以人工智能大數據平台xMiner(前稱uMiner)分析7月17日至18日的數據,發現綜合而言,網上討論以寫真為主,超越了年度主題「科幻推理」。

社交媒體的討論量比新聞高,instagram的討論量罕有地超越新聞及論壇,成為討論度第二高的平台,主要討論內容為「寫真」,其次為「文具」。

Facebook為討論最多的平台,最多提及「寫真」,其次為「科幻推理」,提及「文具」的討論亦不少。

論壇的討論度排第三,仍然大部分討論「寫真」,而提及「補充練習」的比例為全部平台中最高。新聞為聲量最小的平台,「寫真」及「科幻推理」的聲量最高,亦是提及年度主題「科幻推理」最多的平台。

聚焦Facebook內容,我們統計了這時段中最多reactions的帖文,發現不少受關注帖文都與近日社會議題相關,而且網民較多關心書展的參展商、作者。新聞媒體僅香港01榜上有名。

——————
想了解如何以社交媒體分析社會時事輿論走向?不妨inbox我們或到源大網頁:www.umaxdata.com,索取相關個案及洞察報告。

#香港書展 #大數據 #socialmedialistening  #社交媒體研究 #社交媒體聆聽 #社媒聆聽 #HKTDC
HKTDC 香港貿發局

 


社交媒體聆聽案例:用iPhone嘟八達通 網民撐方便 惟恐私隱外洩

【八達通無卡化,網民受落嗎?】


八達通昨日(7月11日)宣佈今年內支援iPhone及Apple watch,以後蘋果用戶可以直接透過裝置內的Apple pay使用八達通。但網民對此意見如何?源大數據以此作為個案,示範如何以社交媒體聆聽(Social Listening)發現潛在公關危機,盡早發現輿論風險所在,避免發酵成公關災難。


1) 情感分析 (Sentiment Analysis) 辨認友善與負面媒體

源大數據使用自家研發搭建的人工智能社群聆聽平台HK Pulse,分析7月11日網上輿論走向,觀察新聞、Facebook、論壇三種媒體,並運用人工智能情感分析技術(Sentiment Analysis)分析,發現Facebook上討論度較高,而且反應亦較正面。論壇討論度排第二,惟負面比例佔整體回應過半,顯示論壇網民對新措施有不滿。

 

▶ 張Sir講數:利用大數據分析工具做商業決策


2) 情感分析 x詞雲圖(Word Cloud)看留言

分析員再深入剖析網民在社交媒體的留言,以詞雲圖(Word Cloud)顯示社交媒體中網民的討論焦點,發現正面回應多認為無卡化更便利生活,最多網民提及「方便」、「開放」、「直接」等字眼,亦有不少人討論「時間」。


另外亦有人指其他地區的蘋果裝置早配合推行無卡化,提到地方如「日本」、「大陸」、「歐美」。不少留言提出近年已有很多流動支付方式,贊成八達通無卡化,直指是次決定是「機會」,更指該公司「生性」。

 

▶ 張Sir講數:單靠算法的情感分析真的有價值嗎?

 

負面回應方面,多數人擔心連結八達通和手機會引致資料外洩問題,最多人討論「個人」、「資料」等字眼。

 
更有人認為無卡化會令個人行蹤被紀錄,提出「陰謀」、「監控」、「紀錄」等懷疑。
亦有人不認同無卡化,提及「實體」的字眼。


 ——————

源大數據已累積十年的中文詞庫和自然語言處理(Natural Language Processing)的應用經驗,對港澳粵語及本地用語分析尤有經濟,加上人工智能技術(Artificial Intelligence),分析更準確!


想了解如何以社交媒體監測品牌形象(Brand Monitoring)和避免公關危機?可瀏覽以下網頁,亦可電郵至info@umaxdata.com 聯絡我們。


▶ HK Pulse:品牌公關監測網上形象  預警潛在風險◀

▶ 企業公關專用  品牌形象管理、定期報告方案◀