AI和媒體 人工智能AI怎麼做新聞
從人工智能進駐新聞機構,寫稿機器人交出球賽、股市新聞稿,到機器人搶獨家新聞,前後不過三、四年時間。
剛開始記者們半開玩笑地表示擔心機器人會搶走自己的飯碗,後來大家熱議機器人寫的足球賽新聞比人寫的差距多大,再後來,到了現在,關於AI的關注又變了。
人工智能將如何拓展、重塑新聞採編製作流程中的哪些環節?以前有哪些難以想象或不可能的設想借助AI的威力而成為可能?又有哪些環節確實可以而且正在取代人工?
AI在新聞編輯室可以發揮什麼作用,這是個自由放飛想象力的話題。
搶獨家
人工智能跟人類爭普利策獎?其實1988年就發生了。《大西洋月刊》記者比爾·戴德曼(Bill Dedman)在電腦幫助下檢索梳理了海量的住房按揭數據,寫出系列報道揭露這一行的隱形種族歧視,作品獲當年普利策獎。當然,這可以算作機器奪獎。
機器跟人搶獨家新聞?這事4年前有人預言過:會編程的記者將能搶先報出獨家新聞,搶頭條。
機器人工程師約翰·基弗(John Keefe)今年1月在哈佛大學尼曼新聞實驗室(Nieman Lab)2018行業預測中斷言,這件事今年就會發生。他說,記者將運用AI搶得獨家新聞。
這跟機器人寫足球、財經消息不同。那更多是數據分析整理,然後用自然語言程序組合成文。搶獨家消息是通過機器學習技術識別、發掘出人類單憑自己的大腦難以捕捉到的重要事實和真相。
至於未來的媒體編輯室是否由AI主宰,或者人類和機器聯合執掌,現在難有定論。
可以肯定的是,適用於工農業生產的邏輯在相當程度上同樣適用於媒體內容生成:搜集資料、整理數據、核查事實、版面校對等,這些工序能夠也肯定會大部分交給AI,編輯記者可以更集中心智用於創意、創新。
人算不如機器算
人機合作已有先行者探路。美國《大西洋月刊》記者麥吉爾(Andrew McGill)把一項枯燥而至關重要的任務交給了機器人助手,@TrumpOrNot,讓它分辨美國總統特朗普的推特帳號下哪些是他本人髮的,哪些是手下人代勞的。
這個助手利用機器學習和自然語言處理技術,把特朗普新發的推特文字跟數據庫中的文檔資料對比,然後做出比較肯定的判斷。
麥吉爾在2017年3月發表了自己的實驗結果時寫道:
「機器算法找到的那些最有助於分辨一則推特訊息出自特朗普之手還是工作人員之手的線索,真的很有意思。大部分不是文字,而是特別的拼寫和標點符號。」
比如,特朗普發的推特更頻繁出現自己的推特名「@realDonaldTrump」,更喜歡用「媒體」這個詞,但顯然不愛用「#」,而手下代發的推特訊息裏這個符號更多。
麥吉爾承認自己這個助手的知識庫需要不斷更新,尤其是作為識辨指標的關鍵詞、習慣和特點。
AI進駐媒體
專注於人工智能領域發展的科技網站TechEmergence對人工智能在幾家主要西方媒體的應用做了梳理,勾畫機器人進駐編輯室趨勢的一個截面。
- BBC新聞實驗室:語義辨識
BBC的人工智能機器人叫Juicer ("榨汁機")。它的任務是把海量的數據,包括每天的新聞、專題報道、視頻、其他媒體的消息、政府部門和互聯網信息, 等等,用一種聰明智慧的方式聯結起來,既方便調用,又有內在智慧邏輯。
"榨汁機"2012年上崗,每天吸進來自850個新聞機構的RSS信息推送,整合處理數據,把BBC和其他媒體的新聞報道分揀出來,然後貼上相應的語義標注,分成4類歸檔:組織機構、地點、人物、事物。
這樣,記者要查找有關特朗普總統的最新消息,或者AI領域動態的信息,"榨汁機"就會迅速上網搜索,然後給出一個相關內容的清單。
這還比較枯燥。不久的將來,"榨汁機"的功能提高後,還會更貼心,讀者鼠標在某個字詞上停留兜圈片刻,它就能生成一個彈出窗口,提供相應的信息。作為電視廣播媒體,BBC還在訓練它在視頻環境下彈出相關的信息。
- 《紐約時報》:語義辨識和評論區管理
2015年,《紐約時報》大樓內來了個名叫「編輯」(Editor)的AI。它的任務是簡化記者編輯的工作流程。記者寫稿時可以用標籤來標明關鍵詞、標題或主題。隨著時間推移,數據積累到一定程度後,機器編輯就能自動識別這些標籤的語義,找到一段文字中最關鍵的部分。這樣,記者查資料或核對事實就很便捷,人物、地點、事件、時間,分門別類,井然有序。
人工智能在那兒的另一項任務是管理讀者評論區。它將來可能要承擔的是目前共有14個人負責的工作,主要是每天分揀查閲11,000條讀者評論。該報開設評論區功能的文章只佔10%,如果用AI機器管理,則可以有更多文章開放評論區,強化互動,並節省開支。這個軟件叫Perspective API,可以迅速分揀整理讀者評論,使讀者更容易檢索到自己感興趣的評論並展開討論,或者避開無聊的撒潑耍渾式留言。
這是機器搶人飯碗的一個例子。
- 《華盛頓郵報》:自動化新聞寫作
「自動化新聞」(Automated Journalism)也稱「機器人新聞寫作」,使用的寫稿軟件是Heliograf。2016年里約奧運會上初次上場。它對源源不斷的數據分析整理後,把信息跟事先定制的新聞模板裏的對應詞句配對,然後組成新聞稿,發表在不同的平台。要是發現數據裏有異常,它還會提醒記者注意。也就是說,整個里約奧運會期間,寫稿機器人承擔了大量有關比分和獎牌數的實時報道,記者則可以更多採寫其他內容。
新聞自動化有兩層含義,一是數量,二是目標定制。
比如關於英國脫歐,機器人寫手可以生成面向英國讀者、中國讀者或其他國際讀者群的不同版本;關於股市動態的報道,可能會有一段專門為你訂製:大盤總體向上,但你上周要是沒有賣那些IBM股票,那你的投資組合資產今天會有這麼多。
換句話說,機器人可以在萬里之外寫出比本地記者更接地氣的新聞報道,或者把一條枯燥乏味的消息變成熱搜榜上人人關注的新聞。
- 路透社:數據視覺化
路透社2016年跟語義辨識技術公司Graphiq合作,研發智能型的新聞發表軟件,自帶自由互動數據視覺化功能,涵蓋範圍寬泛多樣,包括娛樂、體育和新聞等。這個發表軟件可以在路透社開放媒體快捷平台調取數據。這些數據嵌入發表器網站後,數據世界化程序會實時更新。
- 美聯社:語義辨識、人工智能分析、自動化新聞
"自動化洞見"的另一個客戶是美聯社。早在2013年,美聯社就開始運用人工智能來處理體育和財經數據,生成新聞稿。現在美聯社的機器人叫NewsWhip,負責追蹤、預測社交媒體平台上的趨勢。除了跟蹤新聞報道,它還可以向記者提供實時或歷史時段的分析結果。有了這個助手,新聞稿的數據凖確性提高,錯誤減少,記者編輯對新聞時事的把脈更精凖。
美聯社沒有用人工智能來撰寫長篇政治評論文章,但在用一款名叫Wordsmith的機器人來把盈利數據轉換成財經新聞。
- Quartz數碼新聞:聊天機器人媒體界面
關鍵詞:聊天、自然語言處理、新聞、話題。Quartz2016年獲得一筆資金設立機器人實驗室,為記者們開發各種自動化工具。這是對新聞媒體行業大趨勢的一種反應:新聞不但從紙面轉到桌面電腦、手提電腦、手機,不久的將來還將通過物聯網進入家庭和私人座駕。
簡而言之,就是通過聊天、語音和其他新穎渠道來實現人機互動。這個嘗試還在嬰兒階段,但已經可以看出端倪。用戶輸入問題和要求,比如新聞事件、人物或地點,聊天機器人根據自己的理解提供相關的內容。
Quartz的目標是開發出能夠跟所有媒體平台流暢互動的機器人和人工智能。目前還沒有最後確定下一步怎麼走,但正在考慮的一些設想裏包括一款編輯室機器人,幫助記者為新媒體空間編寫新聞、生成數據。
英國《衛報》也引入聊天機器人,2016年在臉書帳戶上亮相,主要工作是幫助讀者選擇閲讀的版本、新聞推送時間,並負責推送;這職責明細看來跟客服比較相似。
在中國寫稿
自2015年騰訊財經頻道開中國機器人寫稿先河以來,不少媒體人髮現多了個機器人「同事」。
2015年 -
- 騰訊財經:9月10日發表了Dreamwriter新聞寫作機器人編寫的經濟消息(《8月CPI漲2%,創12個月新高》)。
- 新華社:「快筆小新」11月開始為體育部、經濟信息部和《中國證券報》寫體育賽事及財經消息稿件。
2016年 -
- 網媒今日頭條:「小明」(xiaomingbot)在2016年里約奧運會期間每天寫30多篇賽事簡訊和賽場報道;
- 《錢江晚報》:微軟旗下人工智能機器人「微軟小冰」上崗,在「浙江24小時」APP中開設「小冰機器人」專欄;
2017年 -
- 《南方都市報》和凱迪網:與北京大學計算機科學技術研究所聯合成立智媒體實驗室,推出寫稿機器人「小南」;
- 《華西都市報》:機器人「小冰」開設專欄「小冰的詩」,獨家發佈新作《全世界就在那裏》(外二首);
- 《廣州日報》:中國全國人大和政協兩會期間,寫稿機器人「阿同」、「阿樂」寫出了政府工作報告熱詞分析、外交部部長記者會熱點問題分析等多篇報道,還回復了公眾關於兩會知識的提問;
- 《人民日報》:人工智能、語音機器人「小融」在春節期間上崗,在人民網和其他社交媒體平台與網友互動;
除了這些隱形的AI寫稿程序之外,也有更全能、具備機器人形狀的AI記者,如新華社的「i思」、《深圳特區報》的「讀特」、浙江衛視的「小聰」和香港大公文匯傳媒集團的「小寶」,可以出去採訪和錄製廣播電視節目。
取長補短
也許,未來比較合乎邏輯的延伸方向是人和機器各自揚長避短。機器人不以優美的文筆跟人競爭,而是在人的腦力無法企及的地方取勝,比如把一條重大訊息寫成幾篇視角獨到、見解深刻、分析精闢的報道,而且能夠迅速把這幾篇文稿個性化,生成數十萬個針對不同受眾的版本。
AI在各地的編輯室裏的職務明細正在不斷變化,從數據收集、整理和分析、交叉查證核實,到寫稿、創作、編輯,再到重新定義新聞傳媒專業和行業,速度令人目眩。
新事物難免衝擊現狀,帶來新問題,試管嬰兒、克隆、基因編輯,無不在某些方面挑戰人類社會倫理。AI也不例外。這是另一篇文章的話題。