結合真實消費者數據
文/黃翊書【Etu(知意圖)產品經理】
網路輿情分析,是透過分析網路上消費者發表的意見,瞭解目標客戶對於品牌、產品或是服務的想法。目前的網路輿情分析流程可以大致上分為4個部分:
收集網路資料
針對欲分析的品牌或是服務內容找出相關的網路資料來源,來源可以是網路論壇、部落格、新聞、社群網站或是 BBS 站台。
篩選分析資料
透過設定關聯字的方式來進行所收集到資料的篩選和分類。舉例來說,如果今天要分析汽車品牌 Toyota 的網路輿情。就會設定關聯字為「Toyota」、「Camry」...等關聯字,讓系統將收集的文章中有提到這個些關聯字的文章或是段落篩選出來。
資料分析
篩選出來的文章基本上會進行3種面向的分析:聲量分析、情感分析、趨勢分析。聲量分析,著重在不同的品牌與商品在網路上討論的熱度、討論涵蓋的廣度以及消費者在意的討論議題等。情感分析,主要是透過自然語言處理的技術,判斷消費者在討論品牌與商品時的情緒與喜好。而趨勢分析則是找出目前網路上最熱門、最新的討論內容與趨勢。
呈現分析結果
自動化程度較高的公司會在網路平台或是系統上直接操作觀看分析結果,比較多的服務廠商則是透過報告或是定期報表的方式,將人工處理的分析結果以報告或是投影片的方式發送給相關人員。
從上述的網路輿情分析流程中,可以發現目前面臨主要三點挑戰:
一、網路資料含金量低且雜訊多
網路上各式的論壇、網站、新聞、部落格,在資料格式、互動方式各不相同。有些特別的網站,如台灣最大的 BBS 站台 PTT,有其特殊的使用方式與文化,透過自然語言處理的技術分析這樣異質、大量、雜訊多的網路資訊,非常不容易而且容易失準。
二、資料收集越來越困難
資料收集難度越來越高。許多大型網站因為資料的珍貴性以及確保網站服務的效能,開始透過各式方式去阻擋外部資料收集的行為,最具代表性的就是Facebook。
三、網路輿論分析的結果無法落地
目前的網路輿論分析都不分產業,使用統一的方法進行分析,頂多設定產業相關的關鍵字,造成結果和實際的商務數據沒有非常強的關聯性。例如網友評價的分數很高就代表商品的銷售量很高嗎?或是網友的討論熱度是否就代表之前的行銷活動成果??
在大數據盛行的年代,許多網站都會收集大量的使用者數據 (web/app log),來作為網站操作或是商務轉化的優化基準。這樣的數據除了作為網站本身的優化依據外,也是一個分析消費者偏好與趨勢很好的資料來源。舉例來說,有許多的汽車討論網站有提供消費者一個車款比較的功能,讓消費者可以輸入多台喜愛的車款,網站就會自動列出這些車款在規格、性能、價格上的所有資訊,方便消費者進行比較。這樣的比較記錄,在大型的網站上可能一天會有上萬次的比較次數。
?在這個例子中我們發現,消費者準備要買新車的前兩個月,會開始大量的瀏覽網路上車款相關的介紹,並且到這些網站進行車款比較。所以如果有一車款的比較數量開始大增,我們就可以預測兩個月後這款車的銷售量也會有爆量的表現。
結論
網路輿論分析在目前由於資料收集越來越難、自然語言處理技術的限制下。網路輿論分析的結果距離落地都還有一段距離。因此藉由和大型網站或是 APP 業者合作,引