兩社運案16人改判囚 兩大陣營在說什麼?

#輿情分析】政府覆核社運案刑期得直,多名社運人士改判囚。


源大數據分析Fb上兩大政治陣營的發帖及留言,整合出各自最常談及的言辭,發現泛民陣營多談及「政治」、「司法獨立」等字眼,而建制陣營以「哈哈」大幅佔多,其次則是「政府」、「港人」等。


#大數據 #socialmediaanalysis #socialmedialistening #東北案 #公民廣場 #雙學 #覆核刑期

Click入源大Facebook,追蹤城中熱話。


反東北案政府覆核判刑 誰是Fb KOL?

#輿情分析】政府覆核反東北案刑期,今日法庭宣判13名被告入獄8至13個月。

源大數據分析宣判後的Fb反應,發現總讚好數高企,其中幫港出聲取得最多like,佔整體讚好數16.41%,與佔比排名第二至第四的HKG報(10.44%)、時聞香港(9.09%)、「保普選反佔中」簽左名揮手區(8.32%),以及第六位的港人講地(5.92%),合佔整體讚好數一半。蘋果日報得到的讚好數亦不低,佔整體6.06%,排名第五位,同時亦在嬲嬲數中奪得榜首。

就此話題而言,整體嬲嬲總數約佔整體讚好數不足三分一。

在宣判後,立場新聞以其發帖量及熱度值,成為Facebook 最熱專頁首位,而最熱帖文則由HKG報奪得。


Click入源大Facebook,追蹤城中熱話。


棕櫚硬脂襲港 網民最嬲什麼?

#輿情分析】近日香港海面飄來大量 #棕櫚硬脂,令十多個海灘需要封閉。

源大數據分析發現,在8月6日時聲量開始上升,到了8月7日,公眾的熱度焦點集中於可能造成的生態災難,及至今日,網民則轉為熱議健康疑慮。

同時,統計Facebook數據可得,健康疑慮所得的嬲嬲多於讚好,可見網民態度負面。而在多個議題中,網民最「嬲」的則是兩地通報機制,令其嬲數一枝獨秀。

#大數據 #socialmediaanalysis #socialmedialistening

Click入源大Facebook,追蹤時事熱話。


一地兩檢風頭火勢 蔡若蓮難爬頭

#輿情分析】前日政府公布副局及政助名單,公眾爭論已久的蔡若蓮亦一如傳聞出現於名單之上。公布當日,蔡若蓮的熱議程度一度飊升超越一地兩檢,然而只屬曇花一現。

一地兩檢的話題未見有降溫跡象,公眾和媒體不斷有新切入點討論。自7月25日的高峰過後,至29日跌勢已止住,這數日以來聲量一直維持穩定,情況與本月其他議題相當不同。


#一地兩檢 #蔡若蓮 #大數據 #socialmediaanalysis#socialmedialistening

關注源大Facebook,追蹤最新熱話。


借助社交大數據 酒店業可提高聲譽及收益【張Sir講數之八】

互聯網時代,眾所周知,資訊的海量化、複雜化及即時化現象,最能體現在社交媒體上。上期筆者提及來自點評類(reviews)社交媒體上的數據,其中最為人熟悉的是酒店預訂網站—在線旅遊代理(OTAs,Online Travel Agencies)上顧客對酒店的評分和評價,當中人氣最盛的是TripAdvisor、攜程、Agoda及Booking.com等。

自從互聯網誕生後,酒店房間的銷售便逐步與OTAs形成一個相互依存的共生體。根據康奈爾大學(Cornell University)研究顯示,酒店的在線直接訂房率逐年下降,而來自OTAs的份額則持續上升。越來越多的事實及研究顯示,除了價格決定了銷售成績(銷售高不代表收益好)為主要因素外,線上顧客的評論對酒店的聲譽及顧客的預訂決策具有顯著的影響。

根據市場研究公司益普索(IPSOS)發佈的全球最大的住宿與旅客調查報告–《TripBarometer全球旅遊經濟報告》的結果顯示,有93%的旅客,其酒店預訂決策會受到網上評論影響,同時有96%的受訪酒店表示,網上評論對於顧客的網上預訂行為是重要的,當酒店在OTA網站擁有更高的評分,能夠讓酒店保持入住率不變的情況下,單房價格可額外提升高達11.2%。另外,根據康乃爾大學研究團隊於2012年所發佈的《顧客評論對消費決策的影響》研究報告,具體指出了酒店品牌線上口碑評分如何影響消費者的選擇,其中提到三項指標:

  1. 評分排名:當排名降低1個等級,被顧客選中的機率就降低11.5%;

  2. 評價分數:當顧客評分增加1分,被顧客選中的機率就增加14.2%; 

  3. 評論數量:當酒店每增加1條顧客評論,被顧客選中的機率就增加0.2%。

策略調整分秒必爭

近年,消費者對網上信息的真偽判斷變得日益聰明,單靠一個評價分數並不足以構成最終決策的依據,往往通過閱覽眾多的評論文字,並且同時比較不同OTAs上的評論文字才做出最後的選擇。對於酒店來講,行業競爭越趨激烈,來自消費者評價的資訊量暴增,以往以月、季來做營運及市場決策的時代已經一去不復返,而以週、天,甚至每分每秒做出策略調整,以及對住客意見做出即時反饋的需求變得愈來愈大。然而,光靠人工來搜集及掌握眾多OTAs的數據是不切實際的。據統計,絕大部分的評論數據來自約20個OTAs,其他數以百計OTAs的評論並不活躍或多數引用前述OTAs的數據。於是,社交大數據挖掘工具(Social Big Data Analytics)提供了實時收集、分析及提出洞察的可能。

首先,大數據Analytics可以實時收集不同OTAs上的評分和評論文字,通過算法及權重,即時計算出具有指標意義的酒店聲譽價值(hotel reputation value),並且得到酒店在不同時間點於當地行業及同級酒店中的排名(ranking)。酒店利用這些指標,可隨時檢視自身的市場位置、顧客對酒店的觀感及其變化,甚至可追蹤形成這些聲譽價值的原始分數及原因。

追蹤用家喜好 捕捉酒店不足之處

其次,大數據Analytics能快速捕捉到顧客對酒店服務或設施的評價,通過實時的可視化分析,酒店馬上可以辨別出哪些地方做得不足,並需要即時修正或精益求精,哪些做得好但顧客不太在意,哪些是少數顧客提及但卻是酒店平時比較忽略的關鍵地方。

此外,酒店可根據大數據Analytics提煉數據後所呈現的自身及競爭品牌的顧客評論聲量、分類、喜好和批評,及時調整市場策略、改善方案,以及在不同OTAs上作出有效的資源分配,從而提高酒店在顧客心目中的聲譽及預訂收益。
大數據時代,善用大數據工具,將讓企業變得更有競爭力。

張榮顯 博士
亞太區互聯網研究聯盟主席、香港源大數據首席顧問

(原文載於經濟日報,獲准轉載)


當書展遇上一地兩檢 七月熱話埋單計數

#輿情分析】今個七月發生了不少事件,由新特首上任,到公布一地兩檢方案,都是城中熱話。


源大數據選取了五個本地時事熱話,交叉比較各議題的熱議度,發現一地兩檢「遲來先上岸」,成為月內聲浪最高的議題,然而書展的討論同樣熱烈,亦持續數日之久。


相較之下,特首立會答問與DQ案宣判的熱潮都僅持續一天,來得快亦去得快,而DQ案的聲浪最高峰時刻,亦僅與一地兩檢的低位相若。蔡若蓮或任教局副局長的傳聞,則一直在低位載浮載沉。


一地兩檢方案 第四日討論未式微

#輿情分析】政府周二公布一地兩檢方案,即日引爆大量討論。源大數據觀察數日以來趨勢,發現討論熱度未有如DQ案般迅速滑落,而是每日以類似模式漸漸下滑,然而直至今日,討論雖較前幾天少,但依然遠高於方案公布前七月的數字。


除了公布即日外,我們可見每日中午前就會錄得聲浪高位,而到晚上十一時後,討論會突然大跌,直至翌日早上再度回升。


源大數據分析語言中的情感,發現中立情感數量最多,但負面情感亦一直多於正面情感。幫港出聲、港人講地及立場新聞發帖量多,且累積大量回響,成為這數日來Facebook上的KOL。


#一地兩檢 #高鐵 #大數據 #SocialMediaAnalysis #SocialMediaListening

相關連結: Facebook帖文


註: 本文涉及情感分析僅以系統計算所得,並不反映支持度。


挖掘社交大數據中的關係價值【張Sir講數之七】

報章剪報歷來是企業或政府機構對一個品牌宣傳、活動成效或政策推行情況掌握的一個重要手段,主要通過人工剪報或傳統電子資料庫的方式進行收集。

社交媒體成民情主要陣地

大約十多年前,隨著搜索引擎的功能優化及社交媒體的出現,讓很多從事市場、公關及媒體關係的從業者開始利用常用的搜索引擎或垂直化的社交聆聽工具(或稱social listening analytics)來豐富及補充剪報的範圍和訊息的多樣性,但其應用程度尚未如剪報般流行。如今,社交媒體已經廣泛普及化,成為網民訊息獲取及民意表達的主要渠道。若果再不重視社交媒體的聆聽(listening)、監測(monitoring)、分析(analysis)及挖掘(mining),在大勢所趨的情況下,決策者將會失去掌握最新情報、洞察用戶、未雨綢繆及有效決策的機會。

所謂社交媒體,其定義可以很寬,凡是在網絡上供網民公開發表及交流內容的平台皆可稱之, 譬如有社交網絡的(social networks),代表者有Facebook 、LinkedIn和Twitter;有內容分享的(media sharing),常見的有YouTube和Instagram;有社交新聞的(social news),例如Reddit;有眾創知識的wiki類,著名的有Wikipedia和知乎;還有點評類的(reviews)TripAdvisor和大眾點評等。近年,也出現眾多的新聞加評論的渠道,例如Huffington Post和今日頭條等。

以上列舉的社交媒體類型,構成了海量的社交大數據來源,要把這些訊息做系統化的收集,單靠以往如剪報的方式,已經遠遠不足以應付,即使是利用電腦及傳統的數據庫技術,也不一定能達到即時收集和歸類的效果,更何況要對它們進行分析和挖掘有價值的部分。由於這些社交大數據並非如新聞報章的內容一樣,具有明顯的語言規範、內容結構、式樣及呈現的規律,因此,需要利用全新的大數據技術和算法所搭建的社交大數據挖掘工具(Social Big Data Analytics)以及具有專門領域知識的團隊才足以應付。

剪報=監測?需要深入挖掘

傳統的訊息收集、剪報或社交聆聽分析工具,產出的是資訊層面的東西,它只能做到計算數量及大致分類的結果,沒辦法如社交大數據挖掘工具般,做到具有聆聽、監測、分析及挖掘的作用,可實時對網民在社交媒體發表的內容及網民之間的關係進行深入的剖析,即所謂的內容挖掘(content-based mining)及結構挖掘(structure-based mining)兩種技術。

上期筆者介紹過文本挖掘(text mining)技術,其進一步的理解就是這裡所指的內容挖掘,是從網民所發表的內容的語義層面進行解讀,如對某個品牌或服務的喜好、對某項政策的支持與反對、導致消費者滿意度高低的原因等等;至於結構挖掘技術,也叫社交網絡分析(social network analytics)則是指挖掘社交媒體中的實體或指涉物(例如網民、機構、產品、事件等)之間的關係和互動情況,例如在Facebook上的專頁(pages)與其粉絲之間的關係,Twitter上發主帖人與跟帖人之間的互動、在眾多的發帖內容中包含的關鍵詞(可以是人名、機構名或產品名)之間的關係等等。

通常這些挖掘結果是通過可視化的網狀圖表(visualized network graph)來表達,當中有所謂的節點(nodes),代表連結的實體或指涉物,以及邊線(edges),代表它們之間的關係。在市場或政策規劃及決策中,如果能夠通過圖表展示實體之間的連結,以及發掘他們之間的關係大小,那麼,諸如關鍵意見領袖(key opinion leader, KOL)、粉絲社群的網絡大小及延伸(community network)、可預測性的連結關係(predictive links)等等關係價值便可以挖掘出來,有助於資源的合理分配和投放,以形成及優化商品及服務的推薦渠道、提升品牌認知度及有利政策的推廣和實施。

張榮顯 博士
亞太區互聯網研究聯盟主席、香港源大數據首席顧問

(原文載於經濟日報,獲准轉載)


書展收爐總結 誰是人氣王?

#輿情分析】書展昨日完結,不少書商及顧客都作最後衝刺,一方減價促銷,一方拖喼血拼,令「減價促銷」話題的風頭一時無兩,遠遠拋離其他話題。

源大數據整合7日展期的數據,找出今次書展facebook專頁中的人氣王,發現 林日曦在多個範疇都有帖文奪冠,順利成為今次書展人氣最高的KOL。

在書展首日得到大量關注的 U Magazine 文具情報,最後亦得到最多評論及分享數,成為熱帖之冠。

#香港書展 #大數據 #SocialMediaAnalysis #SocialMediaListening

相關連結:Facebook帖文


一地兩檢方案 一出爐Fb嬲嬲暴增

#輿情分析】政府於今日下午三時半公布高鐵一地兩檢方案,源大數據分析發現,Facebook上相關帖文的「嬲嬲」數目即時飊升,超越讚好數。


整體而言,今日截至下午五時,嬲嬲數約佔整體表情總數三成,約為讚好數的一半。


除去讚好和嬲嬲,其他表情反應都數目偏少,唯獨「哈哈」在上午10時短暫活躍,當時熱帖為田二少評一地兩檢時,引述普羅大眾指「閉上眼當入咗深圳」。


#一地兩檢 #高鐵 #大數據 #SocialMediaAnalysis #SocialMediaListening


相關文章:Facebook帖文


註: 本文涉及情感分析僅以系統計算所得,並不反映支持度。