「公共政策與輿情分析」怎麼吵架了?

2023-12-05

巨量資料、大數據等詞彙受到大眾注意已經超過十年,已有越來越多將網路輿情運用在公共政策上的嘗試。商業平台瞄準的受眾,除了有行銷需求的企業和有選舉分析需求的政客以外,服務的對象也漸漸拓展到了學術界和新聞媒體。這篇文章將帶你了解,那些公共政策輿情分析中的得失利弊,以及商業輿情平台不會在與你合作之前透露的事情。

輿情分析的優勢

首先,輿情分析的確可以做到許多民調做不到的事情:

  • 輿情分析搜集的是網友「主動分享」的意見,而不是他們撰寫問卷時勉強填寫的答案;
  • 輿情分析可以看到連續的時間段內,意見和討論熱度如何變化,而實現類似效果的 panel survey 非常昂貴、耗時和費力;
  • 輿情分析都是開放式的問題,可以針對文字內容做更進一步地深入探索分析,回答一些民調很難或很少回答的問題。

以創新民主中心所做的核廢料相關研究為例,有許多有趣的發現都來自輿情分析。比如, 2019 年蘭嶼貯存場的核廢料鋼桶破損,這個事件引起了環保團體和在地居民的擔憂。研究人員發現,5 月出現事故的時候,網路輿情並沒有大量討論;然而一直等到 11 月調查結果出爐,政府決定補償蘭嶼 25.5 億元,才引發大量討論。研究人員認為,容易引起輿情討論的議題,通常與人們的自身利益相關,比如在這個例子中,裁定的補償金來自稅金,才會引起廣泛討論。

又比如,6 月底台電重啟「中火」(台中火力發電廠),台中市政府陷入一系列爭議;10 月日本欲排放核廢水,在野黨開始主打食安問題。這兩個議題因為被納入了選舉攻防而引發大量討論。政府在 7 月底分別於金門縣與新北市萬里區舉辦公聽會,想在科學議題上與公眾溝通,雖然相關討論反饋的情緒是正面的,但總討論量遠遠不及「中火」議題,這可以看出:

  • 被納入選舉攻防的議題會蓋過其它重要的、需要溝通的科學議題(比如同時期發生的公聽會、有關核廢料選址的不實資訊相比之下不受關注);
  • 與第一點相結合,比起嚴肅的科學議題,人們更願意在乎與切身金錢利益或生活需求有關的議題,這些議題也更容易被拿來進行選舉攻防。

網路輿情還能做到一些橫跨時間向度的嘗試:研究人員發現,通過檢查過去「中火」議題在網路輿情中的表現,我們能夠判斷它過去是否被關注討論過。結果發現,這是一個全新的擁核論述,這似乎能幫助政策制定者和環運人士理解,我們需要追溯到首次出現的時空背景,才能加以擬定策略來應對。

商業輿情平台沒有告訴你的事

創新民主中心的研究團隊做出了這些有趣的成果,然而輿情分析研究並非沒有限制。以往認為社群媒體輿情可以直接解讀樣本而無需統計抽樣的假設,近年研究卻顯示輿情分析一樣要面對代表性的挑戰,而且資料偏差通常比民調嚴重很多。此外,學術研究團隊遇到的最大挑戰,往往在於合作的商業輿情平台。

  • 商業輿情平台,所能提供的數據其實一點都不大?

大部分商業輿情平台的官方網站上,都可以看到他們標榜自己抓取的資料量有多大、更新頻率高。然而,如果要將其資料下載下來,通常單次能夠下載的量僅為數千筆左右,每次下載都需要少許等待時間。如果要下載的資料量超過單次限制,則要手動調整日期、多次下載後再將其手動合併。一旦觀測的議題稍微寬泛,分析原始資料就成了不可能的任務,研究者往往會增加關鍵字篩選程度,來減少分析的資料量,這又會遇到「既然網路相關討論這麼少,特別分析如此小範圍的討論又有何代表性?」這一類的問題。

雖然商業輿情平台宣傳「每日更新千萬筆資料」、「總共收錄數億筆資料」,但實際在文字探勘的過程中,以學術研究為目的的實際使用體驗上,還是有很大的落差。

  • 商業輿情平台附有的許多功能,在實際使用上缺乏彈性

商業輿情平台通常也能生成一些簡單的圖表,比如描述性的折線圖,幫助我們了解資料(討論度)隨時間的趨勢。以下圖為例,會發現平台自動生成的折線圖中,如果兩個主題的則數差距太大會影響視覺化的效果;其中原住民議題討論高低差異則完全看不清楚;兩個議題的每日則數也有許多地方交叉在一起。除此之外,平台默認的折線顏色過於相近,這點也是依賴平台製圖功能無法調整的。如果只想呈現單獨的天數,應該從平台上每日資料下載下來,另外依照需求將資料重新視覺化。

來源:核廢料與原住民議題,《110年度核廢社會溝通規劃案》

結論

總的來說,商業輿情平台所提供的功能,在商業環境下或許尚能使用,但在學術環境就有許多不足。這些功能的調整空間太少,如果我們想為語料庫中的資料加上停用詞(stop-words)、建立自定義字典(user dictionary)、又或者將資料以不同n-gram的形式作排序,觀察談到特定詞彙時的前後文,這些在平台上則不太可能做到,更別說學術發表需要的資料驗證(validation)程序了。

今天的輿情分析仍需面臨許多挑戰,以往很多人指出了代表性上的限制,本文則認為商業平台上的限制也非常多,目前尚難適應學術需求。社會科學學者應該將目光轉向跨學科合作,在輿情分析上建立起一套嚴謹的方法論規範和標準,培養橫跨資料科學和社會科學的專家和研究者。另外,在輿情分析尚未建立完整的方法論以前,我們仍需結合傳統實證研究來加強研究結果的穩健性。

相關文章

日本篇(1)福島核災後,日本核電政策走向
日本篇(1)福島核災後,日本核電政策走向

2011年311福島核災後,日本的核電政策做了哪些調整?長年累積的核廢料又該如何處置?讓我們一起來參考及研析。

2022-06-22
各國知識
加拿大篇(1)高放射性廢棄物如何處置?政策過程與公民參與機制
加拿大篇(1)高放射性廢棄物如何處置?政策過程與公民參與機制

加拿大正處於高放射性廢棄物的選址階段,跟我們一同來了解加拿大會如何選出適合的場址,以及如何增進民眾對於選址的了解與溝通。

2023-12-08
各國知識
什麼是「高放射性廢棄物」?
什麼是「高放射性廢棄物」?

高階放射性廢棄物簡稱高放,指用過核子燃料或經再處理後所產生之殘餘廢棄物,也就是那些具放射性物質含量非常高且半衰期長的核廢料。一起來了解在我國的高放是什麼,他們又將會經歷什麼處理程序呢!

2023-06-12
核廢知識