【詞雲圖一鍵製作】

無論是學生做project、記者寫報道、研究者做報告,經常都會用到詞雲圖,勝在可以用一目了然的方式呈現最常出現的字詞。但詞雲圖有時效果一般,字詞劃分亦不理想,到底如何做出好看易明的詞雲圖?

詞雲圖利用不同的字體大小和文字顏色,呈現出議題中的詞頻,用戶一眼就可從雜亂的數據中發現有意義的資訊。源大數據人工智能大數據分析平台xMiner(前稱uMiner)內置詞雲圖功能,幾個步驟就可簡單製作詞雲圖。

*簡單設定 圖表一秒成型*

圖中的詞雲圖以新的iPhone手機為主題,監測各大的社交媒體的回帖,期望知道網民的關注點。
我們於上個帖文有介紹過關鍵詞設定的方法,設定好系統就會幫你撈取相關數據,即可在平台上製作圖表。然後基於希望監測的內容,可對圖表進行基本設定,比如特定的媒體、指定日期、主帖或回帖等。

舉例小編希望了解社交媒體中網民在一周內對新iPhone的反應,便設定條件為9月6日至12日中Facebook、論壇和Instagram中的回帖。

*兩招加工 圖表更清晰*

xMiner(前稱uMiner)平台預設的顯示詞為100個,最多可達1000個。

第一招 – 停用:
詞雲圖一開始未必盡如人意,因為會有不少價值較低的常用詞,如「可以」、「已經」等,詞頻很高但對分析的意義較低,我們可以直接在平台中通過「停用」,自行刪去這些詞語。
同時,小編亦停用了「手機」、「電話」等字眼,因為在討論iPhone時這些字眼會和主題高度重疊,導致未能有助理解輿情,停用令圖表更簡潔易明。

第二招 – 組合:
另外,有部分字眼意義相近,例如「中國」和「大陸」所指的內容大致相同,我們會以「組合」的方法,將意思相通的字眼合併,以準確地呈現相關概念的關注度。

*地區化詞庫 分詞更精準*

詞雲圖背後不單有大量數據支援,中文內容更要求精準的界詞技術和自然的語言處理。
源大數據背後累積十年的中文詞庫,亦一直與時並進,不斷新增新詞、方言,如這次顯示的詞雲圖,就能分辨出廣東話獨有的「核突」。

——————
想了解如何輕鬆監測網絡輿情?不妨inbox我們或到源大網頁:www.umaxdata.com,索取相關個案及洞察報告。
#SocialListening #社交媒體聆聽 #社媒聆聽 #大數據 #網絡挖掘 #社交媒體研究