報章剪報歷來是企業或政府機構對一個品牌宣傳、活動成效或政策推行情況掌握的一個重要手段,主要通過人工剪報或傳統電子資料庫的方式進行收集。

社交媒體成民情主要陣地

大約十多年前,隨著搜索引擎的功能優化及社交媒體的出現,讓很多從事市場、公關及媒體關係的從業者開始利用常用的搜索引擎或垂直化的社交聆聽工具(或稱social listening analytics)來豐富及補充剪報的範圍和訊息的多樣性,但其應用程度尚未如剪報般流行。如今,社交媒體已經廣泛普及化,成為網民訊息獲取及民意表達的主要渠道。若果再不重視社交媒體的聆聽(listening)、監測(monitoring)、分析(analysis)及挖掘(mining),在大勢所趨的情況下,決策者將會失去掌握最新情報、洞察用戶、未雨綢繆及有效決策的機會。

所謂社交媒體,其定義可以很寬,凡是在網絡上供網民公開發表及交流內容的平台皆可稱之, 譬如有社交網絡的(social networks),代表者有Facebook 、LinkedIn和Twitter;有內容分享的(media sharing),常見的有YouTube和Instagram;有社交新聞的(social news),例如Reddit;有眾創知識的wiki類,著名的有Wikipedia和知乎;還有點評類的(reviews)TripAdvisor和大眾點評等。近年,也出現眾多的新聞加評論的渠道,例如Huffington Post和今日頭條等。

以上列舉的社交媒體類型,構成了海量的社交大數據來源,要把這些訊息做系統化的收集,單靠以往如剪報的方式,已經遠遠不足以應付,即使是利用電腦及傳統的數據庫技術,也不一定能達到即時收集和歸類的效果,更何況要對它們進行分析和挖掘有價值的部分。由於這些社交大數據並非如新聞報章的內容一樣,具有明顯的語言規範、內容結構、式樣及呈現的規律,因此,需要利用全新的大數據技術和算法所搭建的社交大數據挖掘工具(Social Big Data Analytics)以及具有專門領域知識的團隊才足以應付。

剪報=監測?需要深入挖掘

傳統的訊息收集、剪報或社交聆聽分析工具,產出的是資訊層面的東西,它只能做到計算數量及大致分類的結果,沒辦法如社交大數據挖掘工具般,做到具有聆聽、監測、分析及挖掘的作用,可實時對網民在社交媒體發表的內容及網民之間的關係進行深入的剖析,即所謂的內容挖掘(content-based mining)及結構挖掘(structure-based mining)兩種技術。

上期筆者介紹過文本挖掘(text mining)技術,其進一步的理解就是這裡所指的內容挖掘,是從網民所發表的內容的語義層面進行解讀,如對某個品牌或服務的喜好、對某項政策的支持與反對、導致消費者滿意度高低的原因等等;至於結構挖掘技術,也叫社交網絡分析(social network analytics)則是指挖掘社交媒體中的實體或指涉物(例如網民、機構、產品、事件等)之間的關係和互動情況,例如在Facebook上的專頁(pages)與其粉絲之間的關係,Twitter上發主帖人與跟帖人之間的互動、在眾多的發帖內容中包含的關鍵詞(可以是人名、機構名或產品名)之間的關係等等。

通常這些挖掘結果是通過可視化的網狀圖表(visualized network graph)來表達,當中有所謂的節點(nodes),代表連結的實體或指涉物,以及邊線(edges),代表它們之間的關係。在市場或政策規劃及決策中,如果能夠通過圖表展示實體之間的連結,以及發掘他們之間的關係大小,那麼,諸如關鍵意見領袖(key opinion leader, KOL)、粉絲社群的網絡大小及延伸(community network)、可預測性的連結關係(predictive links)等等關係價值便可以挖掘出來,有助於資源的合理分配和投放,以形成及優化商品及服務的推薦渠道、提升品牌認知度及有利政策的推廣和實施。

張榮顯 博士
亞太區互聯網研究聯盟主席、香港源大數據首席顧問

(原文載於經濟日報,獲准轉載)