AI和媒體人工智能AI怎麼做新聞

2018年9月26日

從人工智能進駐新聞機構，寫稿機器人交出球賽、股市新聞稿，到機器人搶獨家新聞，前後不過三、四年時間。

剛開始記者們半開玩笑地表示擔心機器人會搶走自己的飯碗，後來大家熱議機器人寫的足球賽新聞比人寫的差距多大，再後來，到了現在，關於AI的關注又變了。

人工智能將如何拓展、重塑新聞採編製作流程中的哪些環節？以前有哪些難以想象或不可能的設想借助AI的威力而成為可能？又有哪些環節確實可以而且正在取代人工？

AI在新聞編輯室可以發揮什麼作用，這是個自由放飛想象力的話題。

搶獨家

人工智能跟人類爭普利策獎？其實1988年就發生了。《大西洋月刊》記者比爾·戴德曼（Bill Dedman）在電腦幫助下檢索梳理了海量的住房按揭數據，寫出系列報道揭露這一行的隱形種族歧視，作品獲當年普利策獎。當然，這可以算作機器奪獎。

機器跟人搶獨家新聞？這事4年前有人預言過：會編程的記者將能搶先報出獨家新聞，搶頭條。

機器人工程師約翰·基弗（John Keefe）今年1月在哈佛大學尼曼新聞實驗室（Nieman Lab）2018行業預測中斷言，這件事今年就會發生。他說，記者將運用AI搶得獨家新聞。

這跟機器人寫足球、財經消息不同。那更多是數據分析整理，然後用自然語言程序組合成文。搶獨家消息是通過機器學習技術識別、發掘出人類單憑自己的大腦難以捕捉到的重要事實和真相。

至於未來的媒體編輯室是否由AI主宰，或者人類和機器聯合執掌，現在難有定論。

可以肯定的是，適用於工農業生產的邏輯在相當程度上同樣適用於媒體內容生成：搜集資料、整理數據、核查事實、版面校對等，這些工序能夠也肯定會大部分交給AI，編輯記者可以更集中心智用於創意、創新。

特朗普推特頁 — 圖像加註文字，特朗普總統的推特帳號上不全是他親自發的，人工智能可以識別。

人算不如機器算

人機合作已有先行者探路。美國《大西洋月刊》記者麥吉爾（Andrew McGill）把一項枯燥而至關重要的任務交給了機器人助手，@TrumpOrNot，讓它分辨美國總統特朗普的推特帳號下哪些是他本人髮的，哪些是手下人代勞的。

這個助手利用機器學習和自然語言處理技術，把特朗普新發的推特文字跟數據庫中的文檔資料對比，然後做出比較肯定的判斷。

麥吉爾在2017年3月發表了自己的實驗結果時寫道：

「機器算法找到的那些最有助於分辨一則推特訊息出自特朗普之手還是工作人員之手的線索，真的很有意思。大部分不是文字，而是特別的拼寫和標點符號。」

比如，特朗普發的推特更頻繁出現自己的推特名「@realDonaldTrump」，更喜歡用「媒體」這個詞，但顯然不愛用「#」，而手下代發的推特訊息裏這個符號更多。

麥吉爾承認自己這個助手的知識庫需要不斷更新，尤其是作為識辨指標的關鍵詞、習慣和特點。

紐約時報大樓 — 圖像加註文字，《紐約時報》大樓裏確實正在發生機器搶人飯碗的事。

AI進駐媒體

專注於人工智能領域發展的科技網站TechEmergence對人工智能在幾家主要西方媒體的應用做了梳理，勾畫機器人進駐編輯室趨勢的一個截面。

BBC新聞實驗室：語義辨識

BBC的人工智能機器人叫Juicer （"榨汁機"）。它的任務是把海量的數據，包括每天的新聞、專題報道、視頻、其他媒體的消息、政府部門和互聯網信息，等等，用一種聰明智慧的方式聯結起來，既方便調用，又有內在智慧邏輯。

"榨汁機"2012年上崗，每天吸進來自850個新聞機構的RSS信息推送，整合處理數據，把BBC和其他媒體的新聞報道分揀出來，然後貼上相應的語義標注，分成４類歸檔：組織機構、地點、人物、事物。

這樣，記者要查找有關特朗普總統的最新消息，或者AI領域動態的信息，"榨汁機"就會迅速上網搜索，然後給出一個相關內容的清單。

這還比較枯燥。不久的將來，"榨汁機"的功能提高後，還會更貼心，讀者鼠標在某個字詞上停留兜圈片刻，它就能生成一個彈出窗口，提供相應的信息。作為電視廣播媒體，BBC還在訓練它在視頻環境下彈出相關的信息。

《紐約時報》：語義辨識和評論區管理

2015年，《紐約時報》大樓內來了個名叫「編輯」（Editor）的AI。它的任務是簡化記者編輯的工作流程。記者寫稿時可以用標籤來標明關鍵詞、標題或主題。隨著時間推移，數據積累到一定程度後，機器編輯就能自動識別這些標籤的語義，找到一段文字中最關鍵的部分。這樣，記者查資料或核對事實就很便捷，人物、地點、事件、時間，分門別類，井然有序。

人工智能在那兒的另一項任務是管理讀者評論區。它將來可能要承擔的是目前共有14個人負責的工作，主要是每天分揀查閲11,000條讀者評論。該報開設評論區功能的文章只佔10％，如果用AI機器管理，則可以有更多文章開放評論區，強化互動，並節省開支。這個軟件叫Perspective API，可以迅速分揀整理讀者評論，使讀者更容易檢索到自己感興趣的評論並展開討論，或者避開無聊的撒潑耍渾式留言。

這是機器搶人飯碗的一個例子。

《華盛頓郵報》：自動化新聞寫作

「自動化新聞」（Automated Journalism）也稱「機器人新聞寫作」，使用的寫稿軟件是Heliograf。2016年里約奧運會上初次上場。它對源源不斷的數據分析整理後，把信息跟事先定制的新聞模板裏的對應詞句配對，然後組成新聞稿，發表在不同的平台。要是發現數據裏有異常，它還會提醒記者注意。也就是說，整個里約奧運會期間，寫稿機器人承擔了大量有關比分和獎牌數的實時報道，記者則可以更多採寫其他內容。

新聞自動化有兩層含義，一是數量，二是目標定制。

比如關於英國脫歐，機器人寫手可以生成面向英國讀者、中國讀者或其他國際讀者群的不同版本；關於股市動態的報道，可能會有一段專門為你訂製：大盤總體向上，但你上周要是沒有賣那些IBM股票，那你的投資組合資產今天會有這麼多。

換句話說，機器人可以在萬里之外寫出比本地記者更接地氣的新聞報道，或者把一條枯燥乏味的消息變成熱搜榜上人人關注的新聞。

路透社：數據視覺化

路透社2016年跟語義辨識技術公司Graphiq合作，研發智能型的新聞發表軟件，自帶自由互動數據視覺化功能，涵蓋範圍寬泛多樣，包括娛樂、體育和新聞等。這個發表軟件可以在路透社開放媒體快捷平台調取數據。這些數據嵌入發表器網站後，數據世界化程序會實時更新。

美聯社：語義辨識、人工智能分析、自動化新聞

"自動化洞見"的另一個客戶是美聯社。早在2013年，美聯社就開始運用人工智能來處理體育和財經數據，生成新聞稿。現在美聯社的機器人叫NewsWhip，負責追蹤、預測社交媒體平台上的趨勢。除了跟蹤新聞報道，它還可以向記者提供實時或歷史時段的分析結果。有了這個助手，新聞稿的數據凖確性提高，錯誤減少，記者編輯對新聞時事的把脈更精凖。

美聯社沒有用人工智能來撰寫長篇政治評論文章，但在用一款名叫Wordsmith的機器人來把盈利數據轉換成財經新聞。