人工智能70年:科幻和現實的交融
人類飛跑著進入人工智能(AI)時代。粗略估算現在人們日常生活中有20多種尋常的AI,從垃圾郵件過濾器到叫車軟件。
AI被分為兩類,這些執行具體任務的AI屬於「弱人工智能」;另一類「強人工智能」,又稱「通用人工智能」(AGI) ,能夠模仿人類思維、決策,有自我意識,自主行動。這一類目前主要出現在科幻作品中,還沒有成為科學現實。
人工智能的起源可以追溯到哲學、虛構和想象。
作為計算機科學的一個分支,人工智能學科只有大約70年歷史,不乏跌宕和學術門派之爭,定義含混和因此造成的困惑、迷思彷彿層巒疊嶂,科幻和現實經常相互越界。
AI研發史上經歷過兩次「寒冬」,2018年人們又開始談論第三個AI寒冬將至的可能性。
人工智能正在如何改變我們的生活?它將把我們帶向何方?人類和機器的關係如何界定?看懂現在,展望未來,或許可以從回顧歷史開始。
古老的夢
地球上第一個行走的機器人叫塔洛斯,是個銅製的巨人,大約2500多年前在希臘克里特島降生在匠神赫菲斯托的工棚。據荷馬史詩《伊利亞特》描述,塔洛斯當年在特洛伊戰爭中負責守衛克里特。諸神飲宴時有會動的機械三足鼎伺候。
埃德利安·梅耶(Adrienne Mayor)在《諸神與機器人》(Gods and Robots)甚至把希臘古城亞歷山大港稱為最初的硅谷,因為那裏曾經是無數機器人的家園。
除了古希臘、羅馬,其他古文明也不乏人類對"複製自己"的探索。猶太人傳說中有生命的泥人,印度傳說中,守衛佛祖舍利子的機器人武士(模仿古希臘羅馬自動人形機的設計);佛教傳入前日本的神照神社,中國的兵馬俑,後來又有了達芬奇的機器人武士、會下象棋的木頭人"土耳其",等等。雖然跟現在一般理解的人工智能似乎風馬牛不相干,但這些嘗試都體現了人類複製、模擬自身的夢想。
不過,法國索邦大學計算機學教授讓-加布裏埃爾·加納西亞(Jean-Gabriel Ganascia)認為,古代神話中人形物體被賦予生命,與今天人們想象和擔憂的「通用人工智能」,即具有超級智能的機器,都更多屬於想象而不是科學現實,至少目前如此。
在開創人工智能學科的先驅者心目中,AI的初衷是用機器來模擬人類、動植物和物種種群的演變,這個學科立足於這樣一種猜想:所有認知功能都可以被精確描述,從而有可能在計算機上複製。
作為現代科技學科的AI歷史很短,但不乏跌宕坎坷。
1940年代——奠基
1943年,美國神經科學家麥卡洛克(Warren McCulloch)和邏輯學家皮茨(Water Pitts)提出神經元的數學模型。後來有人說現代AI夢就誕生在那個時候。
那個夢是一篇題目繞口的論文,《神經活動中內在思想的邏輯演算》(A Logical Calculus of Ideas Immanent in Nervous Activity)。這篇論文被視為人工智能學科的奠基石。現在大熱的「深度學習」,前身是人工神經網絡,而其基礎就是神經元的數學模型。
這篇論文的發表也標誌著人工智能學科三大派之一的仿生學派誕生。這個學派從神經網絡的連接機制著手來發展人工智能,被稱為連接主義派,後來符號邏輯派佔上風幾十年,神經仿生派一直到二十世紀八、九十年代才翻身,以新連接主義面目復興。
AI的另一塊基石是加拿大神經心理學家赫布(Donald Hebb)1949年提出「赫布規則」,簡單說就是兩個細胞如果總是同時被激活,那麼它們之間就有某種關聯,關聯度與同時激活概率成正比關係。這個規則今天用在機器自動學習算法中。
1950年代——起步
現在人們普遍把1956年叫做AI元年。人工智能作為一門學科,在這個時期起步並取得了早期成功。
圖靈和圖靈機
英國電腦奇才、密碼學家、邏輯學家、計算機與人工智能之父圖靈(Alan Turing)曾想,機器能不能模仿人類的認知、學習過程,用邏輯推理和已有的信息來解決問題,作出決定?他1936年提出圖靈機的設想,就是一種抽象計算模型,實質上是一種數學邏輯機。
1950年,圖靈發表《計算機與智能》(Computing Machineray and Intelligence)論文,文中闡述了"模仿遊戲"的設想和測試方式,就是後來大家熟知的圖靈測試。這篇文章是對機器模仿人類智能的深度思考和系統論述。
達特茅斯人工智能夏季研討會
人工智能(artificial intelligence)這個詞1955年首次亮相。當時4位AI鼻祖寫了一份提案,申請開一個研討會研究人工智能。他們估計兩個月,10個人參加,就足以取得重大突破。他們是麥卡錫(John McCarthy)、明斯基(Marvin Minsky)、羅切斯特(Nathaniel Rochester)和香農(Claude Shannon)。
申請獲准,暑期研討會於1956年8月31日在新罕布什爾州達特茅斯學院召開。
研討會被普遍 視為人工智能作為一門學科的創立,所以這一年算AI元年。
早期成果
AI元年後,喜訊不斷。1957年,GPS(通用問題解決器)設想問世。這個設想的原理是任何形式化的符號問題都可以用這個電腦程序來解決。提出設想的是美國卡內基梅隆大學教授、認知心理學和計算機專家紐厄爾(Allen Newell)、西蒙(Herbert A. Simon)和肖。這個設想屬於邏輯、符號派。在短短60年時間裏也經歷了冷暖。
1959年,麥卡錫提出世界上第一個完整的AI系統。那是他在《具備常識的程序》中提出的能像人類一樣學習的假想程序,"Advice Taker"。同年,他和明斯基牽頭在MIT成立了人工智能實驗室。
也是在這一年,塞繆爾首創了機器學習這個概念。他1956年寫的跳棋程序具有自學能力,是世界第一個。
1960年——伊莉莎
1961年,世界第一款工業機器人Unimate在美國新澤西的通用電氣工廠上崗試用。1966年,第一台能移動的機器人Shakey問世,就是那個會抽煙的機器人。跟Shakey同年出生的還有伊莉莎。
1966年問世的伊莉莎(Eliza)可以算作今天亞馬遜語音助手Alexa、谷歌助理和蘋果語音助手Siri們的祖母,可以跟人進行書面交流。
「她」沒有人形,沒有聲音,就是一個簡單的機器人程序,通過人工編寫的DOCTOR腳本跟人類進行類似心理諮詢的交談。Eliza的「父親」,後來成為MIT教授的維森鮑姆(Joseph Weizenbaum)解釋說,用這個名字,是因為人們可以教這個程序學習掌握新的語言技能,談吐越來越優雅,就像《窈窕淑女》裏被調教得十分出色的賣花姑娘伊莉莎。
伊莉莎問世時,機器解決問題和釋義語音語言的苗頭已經初露端倪。但是,抽象思維、自我認知和自然語言處理功能等人類智能對機器來說還遙不可及。
半個多世紀後的今天,機器人索菲亞仍需依靠事先輸入的內容才能與人交流,但能說能笑能哭,而且是美女形象。
批評聲鵲起
這個時期出現了對人工智能的尖銳批評。
《煉金術與人工智能》發表於1965年,作者德雷弗斯把這篇著名的檄文跟後來陸續寫的文章集成《計算機不能幹什麼》一書,後人凡批評AI必提此書。
另一個刺耳的聲音來自古德(I. J. Good)。他1965年發表了一篇對人工智能未來可能對人類構成威脅的文章,可以算「AI威脅論」的先驅。他認為機器的超級智能和無法避免的智能爆炸最終將超出人類可控範疇。後來著名科學家霍金、發明家和實業家馬斯克對人工智能的恐怖預言跟古德半個世界前的警告遙相呼應。
法國計算機學家加納西亞把這段時間稱為AI發展史上的"預言者時期",因為學科初創並取得早期成果令人欣喜,難免說些頭腦發熱的話。
流傳較廣的包括美國經濟學家西蒙(Herbert Simon司馬賀)1958年預言,再過10年機器就能問鼎國際象棋世界冠軍;結果是1997年才成真。另外,AI鼻祖明斯基在1968年《2001太空漫遊》記者會上說機器智能30年內可趕超人類 ,現在只是設想。
1968年,科幻大片《2001太空漫遊》上映,導演庫布裏克對人類心靈深處那個古老的渴望做了太空時代的演繹。
1970年代-機器人問診
1970年,世界第一個擬人機器人WABOT-1在日本早稻田大學誕生。
除此之外,這段時間AI領域基本上是埋頭科研,主要側重研究機器模擬記憶心理學和理解機制、知識和推理。因此,這個階段AI語義知識表示技術有長足進展,進而推動了專家系統的研發。
專家系統利用一流專家的知識來再現他們的思維過程;從1980年代早期開始在醫療診斷和其他一些領域廣泛應用。
1972年,針對細菌感染的醫療診斷系統MYCIN問世,凖確率69%,專科醫生是80%。1978年 ,用於電腦銷售過程中為顧客自動配置零部件的專家系統XCON誕生。XCON是第一個投入商用的AI專家,也是當時最成功的一款。
1979年,斯坦福大學開始研發自動駕駛技術,但世界上第一次無人駕駛汽車完成首秀是在1986年;那是一輛奔馳麵包車,德國聯邦大學研製,車上有攝像機和感應裝置。它在無人的街道上行駛速度達55mph。
1980年代——《終結者》
數據和知識積累推動計算機學習算法發展,使機器能夠利用自己的經驗自動調整編程,AI的應用突飛猛進,如指紋、語音識別等。人工智能、計算機和人造生命開始和其他學科交融,生出混合系統。
1984年,美國普林斯頓大學教授、物理學家、分子生物學家和神經學家霍普菲爾德用模擬集成電路實現了自己兩年前提出的神經網絡模型,這個模型帶動了神經網絡學派的復興。深度學習大熱並取得突破。
同年,深度學習"三巨頭"辛頓(Geoffrey Hinton)、本吉奧(Yoshua Bengio)和楊立昆(Yann LeCun)發表反向傳播算法論文,開啟深度學習潮流。
那年,卡梅隆大片《終結者》上映,作家布魯克斯(Rodney Allen Brooks)發表《大象不下棋》,提出更高層次的AI系統設想:在與環境互動的基礎上打造人工智能。
人工智能三大源頭之一,哲學,又站到聚光燈下。1981年,美國哲學家、數學家與計算機科學家普特南(Hilary W. Putnam)發表《理性、真理與歷史》,提出著名的「缸中腦」假象試驗。
這本身是一個哲學命題,缸中靠營養液存活、通過電腦接收各種刺激而產生感知的大腦,實際上就是虛擬現實。這個假想為人工智能提供了啟示,也引發了對人工智能的哲學思考,也催生了許多科幻作品,比如《盜夢空間》、《源代碼》和《阿凡達》。
AI的兩個冬季
1974-1980年,1987-1993年,AI遭遇兩次寒冬。
第一次是因為兩份學術報告發表,導致AI領域研究經費銳減。一份是1966年在美國自動語言處理顧問委員會(ALPAC)的《語言與機器:翻譯和語言學中的計算機》(Language and Machines: Computers in Translation and Linguistics),另一份是英國萊特希爾教授(Sir James Lighthill)1973年發表的《人工智能普查報告》。這兩份報告都表達了對先前的投資未能產生預期受益的失望,結論是不應該繼續往AI這個無底洞砸錢。
不過,一線的科研仍在繼續,但直接說AI的少了,諸如機器學習、信息數學、基於知識的系統和模式識別之類新詞開始湧現。
出現第二個冬季則是因為桌面電腦迅速普及,AI系統的金主,包括美國國防部,覺得投資AI性價比不高,興趣大減。但到20世紀末,AI領域再度春暖花開。標誌性事件是1997年IBM深藍大勝世界象棋冠軍卡斯帕洛夫。
歷史上這兩次「錢荒」,跟AI研究資金來源較單一,主要來自政府給學術機構的科研撥款。隨著AI產業化加深,越來越多研發資金來自企業。但AI領域內部的混亂、門派紛爭、各自為政的問題依然存在。
1990年代——聊天機器人
1990年代後期,人工智能與機器人和人機界面結合,產生了具有情感和情緒的智能代理,情緒/情感計算(即評估情緒的變化然後在機器上再現)得以迅速發展,尤其是對話代理(聊天機器人)。
1993年,維諾爾·溫奇發表《即將來臨的技術奇點》(The Coming Technological Singularity)一文,預言30年後人類將能夠創造具有超級智慧的機器,由此走上人類終結之路。這個時刻就是後來很多人說的「奇點」。數學家霍金和企業家馬斯克都是機器終結人類說法的信眾。
但對於這個奇點究竟是否存在目前仍有不同看法。
1997年,IBM的深藍超級電腦擊敗世界象棋冠軍卡斯帕洛夫,西蒙1958年的預言算是實現了,儘管晚了近40年。
21世紀——深度學習
進入21世紀,許多人工智能的能力已經超越人類,比如圍棋、德州撲克,比如證明數學定理,比如學習從海量數據中自動構建知識,識別語音、面孔、指紋,駕駛汽車,處理海量的文件、物流和製造業的自動化操作。
機器人可以識別和模擬人類情緒,可以充當陪伴和護理員了。AI的應用也因此遍地開花,很快進入人類生活的各個領域。
深度學習和強化學習成了時代強音。
一個普遍認同的說法是,2012年的ImageNet年度挑戰開啟了這一輪AI復興浪潮,把深度學習和大數據推到前台,大量投資資金湧入。ImageNet是為視覺認知軟件研究而設計建立的大型視覺數據庫,由華裔AI科學家李飛飛2007年發起;她當時是普林斯頓大學教授。
ImageNet挑戰是每年一度的全行業比武,比誰家的電腦視覺算法最強。2012年奪冠的多倫多大學團隊的圖像識別軟件AlexNet錯誤率比第二名低10.8%。觀察人士總結秘密武器有3個:大數據、更強的電腦、更聰明的算法。
李飛飛現為美國斯坦福大學教授、斯坦福大學人工智能實驗室與視覺實驗室負責人、谷歌雲人工智能和機器學習首席科學家,斯坦福以人為本人工智能研究院共同院長。
另一個值得一提的名字是樊麾,生於中國,圍棋手,職業二段,現任法國圍棋隊總教練。他2015年10月與谷歌人工智能AlphaGO較量0:5敗於對方。他對BBC中文網表示,輸給機器的感覺終身難忘。
過去10年中,人工智能開始寫新聞、搶獨家,經過海量數據訓練學會了識別貓,IBM超級電腦沃森戰勝了智力競賽兩任冠軍,谷歌阿爾法狗戰勝了圍棋世界冠軍,波士頓動力的機器人Atlas學會了三級障礙跳。沃森和阿爾法狗的秘訣都是強化學習。
這個領域的鎮海寶典《深度學習》2015年發表,作者辛頓、本吉奧和楊立昆1980年代就合寫了同樣開行業先河的經典論文,闡述反向傳播算法,2019年獲圖靈獎。
不得不提的是索菲亞。2017年這個擬人機器人亮相時艷驚天下,與人交談語言生動、深刻,沙特搶先給"她"發公民證,後來被楊立昆揭露是個騙局。
因為,索菲亞雖然具備不少先進的技術,包括仿生材料做的皮膚和逼真的面部表情,與人互動時的共情反應,但她只會說事先輸入和設置的話,不具備人們以為她擁有的應用語言智能和思想意識。很快,索菲亞銷聲匿跡。
現代科學誕生前,世界上有迷信,有工匠。然後科學和技術融合,科技和迷信並存;科技和迷信之間有一片寬闊地帶,繁茂地生長著科幻,小說、影視和藝術。
深度學習似乎表明人類向複製自己的原始意願又邁進了一步;人工智能的發展將繼續跌宕起伏,而人與機器的關係、人工智能帶來的倫理挑戰日益成為AI領域的焦點話題。
有人預言,幾百年後,世界上的智慧智能將由3部分組成:人類智能(AI)+人類可控的人工智能+人類不可控的機器智能。
這一切又都離不開人類文明曙光初現時一個古老的夢想。
想象和現實從來不可能一刀兩斷切割,科技和商業更是如影隨形,但區分人工智能(AI)和通用人工智能(AGI),或許有助於減緩第三次「AI寒冬」將至的擔憂和焦慮。
.