資訊新聞 採訪數據找真相
資訊新聞 採訪數據找真相
記者 劉敏慈 文 2016/03/27
資訊新聞是個新興名詞,令人不經想是什麼「資訊」?又能帶來什麼「新聞」?現代記者要在數據與新聞間扮演什麼角色?全世界新聞媒體業開始對記者的角色賦予更多不同的期許,更編寫了一本數據新聞手冊,給全世界的記者朋友參考,北卡羅來納大學名譽教授菲利普・梅耶(Philip Meyer)在手冊裡說到:「如今信息日益豐富,信息處理變得更加重要。我們處理數據時,分兩個層面進行:分析數據、展現數據。」而其中他指出分析數據是要在大量的數據流中建構意義與結構,而展現數據,是讓消費者能理解並記住哪些重要且息息相關的信息。同科學研究一樣,數據新聞所告知的研究方法與展示結果應當能被重複檢驗。
因此在爬梳資料的過程,電腦的能力顯得非常重要,記者們所要處理的資料並不是十幾個資訊,而是累積二三十年,達到數以千或萬計的資料,像是近二十年土地徵收的區域,歷年不動產交易實際成交價,若只用手動輸入,需要非常長的時間,又可能人工失誤,而紀錄完資料後,還必須與其他資料核對,找出其相關性,若是能將資料的運算將給電腦,又可利用軟體統計及分析,記者便有更多時間在挖掘資料背後的故事,做出數據新聞。
數據如何取得
官方資料要透過政府才能取得,在台灣,二〇〇五年十二月六日公布政府資訊公開法,讓民眾可以了解政府的預算和研究,但格式多為PDF及加密檔案,後來民眾要求政府應該全面開放,像是CSV格式及無加密文件,使民眾可以資料再利用。在二〇一一年地方政府開始建立資料開放平台,像是台北市政府、新北市及台中市等,接續建立,中央部會在二〇一二年也陸續開放,包含文化部文化資料開放服務網、內政部不動產實價登錄查詢及行政會農委會資料開放平台等。
政府資訊開放平台,提供公民上網下載統計資訊。(圖片來源/網路截圖)
首先,當記者拿到資料後,會先整理格式,數位看台灣共同串辦人黃啟軒說:「流程可分為前端跟後端,前端是資料呈現,後端是資料整理,我會先從政府下載公開資料,然後再整理成可用的格式,接著網頁呈現用HTML編寫,那視覺化的部分用D3.js呈現。」(D3.js為資料視覺化的函式庫) 而在重要的地方就是當拿到資料後,這些人如何解讀資料。在《新聞資訊手冊》裡,提到,拿到數據時,也不能盡信數據,舉例來說,法國的犯罪率每年都在增加,但這可能與警察的業績有關,因為警察舉報越多案子,就可獲得越多獎勵,如此一來,警察更傾向於只需舉報而不需長期調查的犯罪活動,像是毒品相關的犯罪行為,十五年來毒品相關的犯罪,像是吸毒、運毒及販毒等事件成長了四倍,然而在國內的毒品消耗量是一樣的,這就是記者在數據整理後的解讀,也是如何從數據裏面找到新聞。
國外發展 如火如荼
早在二〇〇一年,當時國立台灣大學新聞研究所教授林照真,因為關注調查報導,曾到《紐約時報》、《紐約郵報》、《華盛頓郵報》和《洛杉磯時報》等平面考察時,注意到記者會用各種軟體進行搜尋與整理,這些記者主要使用Spreadsheet進行資料分析。而在歐美國家很早就做到開放資料,美國政府在二〇〇九年五月,英國在同年九月啟用,澳大利亞及加拿大政府則在二〇一一年三月開放。
Spreadsheet為Google開發的統計軟體,類似Excel的功能。(圖片來源/網路截圖)
全球發展則以國際性媒體《衛報》及《紐約時報》為資訊新聞開路,衛報在二〇〇九年三月開始應經營資料部落格(Datablog),分析資料後做詮釋,而衛報也在二〇一二年七月「維基解密」釋出九萬一千筆有關阿富汗戰爭中的美國政府文件,並整理出戰爭時受傷的人數及地點,發現多數的傷者都是平民。另外,衛報也與倫敦政經學院研院員合作,調查倫敦夏季騷亂事件的期間,英國首相卡麥隆說:「此次暴動與貧窮無關,若是暴動與貧窮相關,則會污辱了幾百萬人。」(二〇一一年八月十五日) 保守黨則宣稱,這與社群媒體有關。《衛報》開始調查這件事情,他們釐清騷動發生的時間地點,分析騷動原因,還有他們參與的動機等,最後指出,參與者多居住在貧窮地區,並指出政府失職及失業等問題。
國內發展 產學並進
近年國內傳統媒體聯合報也追求轉型,在二〇一四年成立新媒體創新處,在聯合報在二〇一五年招募了兩位數據工程師,製作大數據分析的新聞,較為知名的有〈10年來誤放多少颱風假?數據找答案〉,資料來源有颱風資料庫、中央氣象局和行政院人事行政總處,聯合報副總編輯官振萱表示:「若要把這則新聞講清楚,用文字很難表達,然而這些資料視覺化後,看了就明瞭。」另外一則是〈致命撞擊,被低估的死亡車禍數據〉,專案花費一個月完成,最長的時間花費在收集資料,包含要跟各個警察局收集各種路段死亡車禍的數據,而在製作過程中也有許多困難,台灣的官方交通事故統計資料並不精確,像是搜集肇事路段時,並不是用經緯度紀錄,有些會出現「〇〇幼兒園附近」,若是這幼兒園已結束營業,那必會造成後人追溯的困難,也降低數據的精確性。
〈10年來誤放多少颱風假?數據找答案〉將大量數據整理後,用視覺化及互動的方式呈現。
(圖片來源/網路截圖)
國內除了業界外,學界也開始培養能夠處理資訊新聞的新聞工作者。教授林照真在《課堂中的資料新聞學:台大新聞所的實踐經驗》提到,必須要讓學生明白數位新聞多元的新聞創作模式,才能真正達到實踐的目的,讓學生在就學階段,就能培養數位說故事(digital storytelling)的能力,更有系統化地去匯整資料。
國內大學也開設相關課程,以台大新聞所為例,包含資料處理及視覺化的訓練,在課堂中同學們會學習Google Spreadsheets分析資料,還有QGIS製作地圖視覺圖表,之後再用Google Refine處理質化資料,這些是針對「處理資料」能力的培養;而「視覺化」的部分,同學們會學Illustrator與HTML,讓資訊能以圖表及網頁的方式呈現。另外,也在二〇一三年邀請到紐約時報資深圖表編輯Archie Tse教課,在紐約與同學們線上討論作品,並帶來最新的視覺圖表資訊。林照真對於資訊新聞未來的發展,持樂觀的態度並表示:「雖然國內資訊新聞發展較慢,但是現在業界及學界都在努力嘗試,相信很快就能跟上國際的腳步。」
![]() |
記者 劉敏慈
以一米六的高度去觀察四周。 |
