無所不能的 AI 做不出小學(xué)數(shù)學(xué)題?AI 簡直離了大譜......
盡管近年來人工智能技術(shù)取得了迅猛發(fā)展,在圖像識別、語言處理和數(shù)據(jù)分析等領(lǐng)域表現(xiàn)出色,但在處理常識性問題時仍然存在明顯的不足。
當你使用 AI 時,有時它給出的答案是完美的。但有時面對一些簡單的常識性判斷,它的答案很奇怪,不是你所預(yù)期的那樣,但仍然相關(guān),可以啟發(fā)思路;而有時它的答案只是胡言亂語,甚至顯得非常“智障”。下面是一個示例:
問:我想要生日蛋糕。我應(yīng)該......
答:......去一個更危險的地方,然后被逮捕。
此外,AI 也沒那么擅長數(shù)學(xué)。
有人曾這樣問 AI:如果一根香蕉重 0.5 磅,而我有 7 磅香蕉和 9 個橙子,我總共有多少個水果?
機器人快速回復(fù):你有 1* 個水果、7 個香蕉和 9 個橙子。然而正確答案應(yīng)該是:有 23 個水果
當前的人工智能系統(tǒng)盡管在某些智力要求極高的任務(wù)中表現(xiàn)出驚人的能力(在許多情況下都勝過人類),但仍然缺少人類獨特的常識。
雖然它們在處理某些事情上非常熟練,但在陌生的環(huán)境中,它們會莫名其妙地以難以預(yù)測的方式崩潰,因為它們沒法像人類那樣,根據(jù)常識來應(yīng)對社會生活中的各種情況。
今天我們就來跟隨《機器如人:通往人類智慧之路》這本書,來了解下有關(guān)人工智能掌握常識的問題。
圖庫版權(quán)圖片,轉(zhuǎn)載使用可能引發(fā)版權(quán)糾紛
為何人工智能
無法像人一樣理解常識知識?
盡管只有少數(shù)人工智能研究人員在研究人工智能的常識,但自從人工智能問世以來,這個話題就一直熱度不減。
在 20 世紀 50 年代,美國計算機科學(xué)家約翰·麥卡錫(John McCarthy,1927—2011)首次定義了人工智能的概念,并且于 195* 年發(fā)表了最早涉及人工智能的論文《具有常識的程序》(Programs with Common Sense)。
如今,六十多年過去了,人們可能想當然地認為:歷經(jīng)多年發(fā)展,人工智能早已掌握常識。然而,加里·馬庫斯曾提到:“令人遺憾的是,讓人工智能獲取常識的難度遠超我們的想象。而且我們還會看到,未來人類對機器獲取常識的需求將越發(fā)強烈,而這同樣遠超我們的想象?!边@意味著:迄今為止,人類還沒有想出如何讓人工智能掌握常識。常識是人工智能領(lǐng)域中無可爭辯的核心要素之一。
在非正式應(yīng)用的場景下,GPT 會給人帶來很多快樂。但當答案事關(guān)重大時,我們很難把它給出的答案當真。這不僅是因為它偶爾會犯錯,而是因為它會不假思索地給出匪夷所思的答案。很難說清它為什么要這么回答。雖然 GPT 產(chǎn)生的回答非常流暢,而且大部分都緊扣主題,但它并沒有反映出對世界的真正理解。就像谷歌翻譯一樣,它不知道自己在說什么。
從表面上看,這些人工智能系統(tǒng)似乎并沒有什么共同之處,不同領(lǐng)域中的不同應(yīng)用程序以完全不同的方式實現(xiàn)。然而,我們還是找到了一個共同點:這些成功往往依靠基于巨大的計算資源實現(xiàn)的“暴力”手段。“深藍”采用了“暴力”窮舉,而谷歌翻譯則運用了“暴力”數(shù)據(jù)。
如果我們進一步思考,會發(fā)現(xiàn)此類系統(tǒng)具有以下兩大特點:
① 人工智能系統(tǒng)在某些專業(yè)領(lǐng)域表現(xiàn)出了高水平的性能,可以識別貓的照片、診斷血液感染或玩街機視頻游戲等。在許多情況下,其性能遠超人類的能力。
② 人工智能系統(tǒng)在其專業(yè)領(lǐng)域之外的表現(xiàn)極差。如果讓它去完成一些設(shè)計用途以外的任務(wù),它甚至不能達到最低的能力水平。這一體系體現(xiàn)了其應(yīng)對能力的脆弱性。
鑒于這兩大特點,很難將這些系統(tǒng)的行為與我們對人類的認識直接聯(lián)系起來。當此類系統(tǒng)的支持者試圖描述其整體性能時,會說這些系統(tǒng)展現(xiàn)出“智能”,但這一術(shù)語通常不適用于人類。
事實上,有一種術(shù)語適用于人類,它確實與這兩大特點相當接近。“低能特才者”是指雖然具有嚴重智力或?qū)W習(xí)障礙,但在某些特定的智力任務(wù)中表現(xiàn)出驚人天賦的人。一個著名的例子就是在電影《雨人》(Rain Man)中達斯汀·霍夫曼(Dustin Hoffman)飾演的角色。這類人在上述特點中,① 是“學(xué)者”水平,而 ② 是“白癡”水平。
圖庫版權(quán)圖片,轉(zhuǎn)載使用可能引發(fā)版權(quán)糾紛
當我們說一個系統(tǒng)在其專業(yè)領(lǐng)域之外表現(xiàn)不佳時,并不是說它缺失其他領(lǐng)域的高水平專業(yè)知識。我們并不期望一個血液診斷應(yīng)用程序能成為象棋大師,也不會期望一個語言翻譯系統(tǒng)能夠證明數(shù)學(xué)定理。更重要的是,我們期望擁有一種通用的能力,即使是非專業(yè)者的人類也會擁有,那就是常識。
可是,一個已經(jīng)擁有專業(yè)知識的人工智能系統(tǒng)為什么還需要常識呢?
答案是,常識可以使人工智能系統(tǒng)在處理超出其直接專業(yè)領(lǐng)域的內(nèi)容時表現(xiàn)得更加合理,至少可以避免像非專業(yè)人士那樣犯明顯的錯誤。如果系統(tǒng)只面對棋局,那么它的唯一關(guān)注點就是贏得比賽,常識對它來說就沒有太大的價值。然而,當我們超越棋盤本身,將棋局視為發(fā)生在現(xiàn)實世界中的活動時,常識就會發(fā)揮作用。
世界是由一系列事件組成的,雖然我們對其中大部分事件都非常熟悉,也能預(yù)料出來,但還有很多時間(比如每天報紙報道的新聞)都是非常陌生的。一個人工智能系統(tǒng),即使掌握了某種專業(yè)知識,能夠考慮到除極罕見事件之外的所有事件,仍然會遺漏掉很多經(jīng)常發(fā)生的事件。
換句話說,如果我們希望人工智能系統(tǒng)能夠以合理的方式處理現(xiàn)實世界中的常見事物,我們需要的不僅是從已發(fā)生事件中獲取專業(yè)知識。考慮到龐大的數(shù)據(jù)量,僅憑觀察和內(nèi)化過去發(fā)生的事件來預(yù)測未來是遠遠不夠的,無論采取多么“暴力”的方式。我們需要常識。
構(gòu)建一個具有常識的
人工智能需要什么?
那么,構(gòu)建一個具有常識的人工智能系統(tǒng)究竟需要哪些條件?
要實際構(gòu)建一個具有常識的人工智能系統(tǒng),我們需要考慮構(gòu)建兩個事物:一個是常識性推理器,一個是常識知識庫。
① 建立常識性推理器
我們可能會問,人類的常識性推理源自何處
例如,如果我們被告知杰克正在看著安妮,我們會立即得出結(jié)論,杰克正在看某個人,而無須別人教我們?nèi)绾蔚贸鲞@個結(jié)論。如果我們被告知巴巴是一頭大象,并且已經(jīng)知道大象的特征,就無須別人教我們?nèi)绾芜\用這些關(guān)于大象的知識來推測巴巴的顏色或耳朵的大小。人類在這類情況下進行的推理是邏輯性推理,但它是一種基本形式的邏輯,無須在課堂上或從教科書中學(xué)習(xí)。
然而,對機器而言,我們別無選擇,只能費盡心思手動編寫這些推理形式的代碼。是的,如果所有必要的推理過程都可以通過某種機器學(xué)習(xí)過程自動完成,那當然很好。但目前來看,這是一個艱巨的任務(wù)。一些研究結(jié)果表明,某些神經(jīng)網(wǎng)絡(luò)架構(gòu)確實可以學(xué)習(xí)一些過程(例如二進制數(shù)的乘法),但這些看起來更像是精彩的演示,而無法成為構(gòu)建系統(tǒng)的實用方法。
我們對一些程序給出了相當詳細的說明,然而,對于實例化概念、模擬變化、處理不一致性或利用強度或重要性等注釋的具體內(nèi)容,我們只是大致提及了其中可能涉及的因素。而且,我們幾乎沒有提及自下向上的調(diào)用、類比和相似性的使用、情境的識別以及常識在更廣泛的認知架構(gòu)中的總體位置和協(xié)調(diào)。對于這些事物的研究與整合,我們?nèi)匀恍枰M行大量的工作。
② 建立常識知識庫
現(xiàn)在我們來看常識性知識。此時,我們不能指望只有幾十個項目需要考慮。如果關(guān)于醫(yī)院的知識算作一個項目,而關(guān)于生日聚會的知識算作兩個項目,那么預(yù)計其中涉及的項目將達到上萬甚至幾十萬之多。所有這些知識源于何處呢?
就人類而言,答案很明確:
在某些情況下,我們通過重復(fù)的經(jīng)驗獲得常識理解(比如在炎熱的夏天怎樣吃即將融化的冰激凌);在某些情況下,我們從朋友那里得到建議(比如參加派對時該穿什么衣服或者不該穿什么衣服);在其他情況下,我們的理解可能來源于指南或手冊(比如如何設(shè)置家用打印機)。
換句話說,對人類來說,有些知識是通過親身經(jīng)歷獲得的,而另一些知識則來自其他人的語言(口頭或書面)。
對于人類通過個人經(jīng)歷獲取的知識,我們是否應(yīng)該期望機器也擁有類似的經(jīng)歷,并以類似的方式學(xué)習(xí)這些知識呢?如果人類需要多年時間才能掌握此類知識,那么機器也需要如此嗎?
在一篇名為《軟件體的生命周期》(The Lifecycle of Software Objects)的精彩科幻故事中,作者特德·姜(Ted Chiang)提到了以下內(nèi)容:
這并無捷徑可言。如果你想創(chuàng)建出人類花費二十年經(jīng)歷才獲取的常識,那么你就需要投入二十年的時間來完成這項任務(wù)。你無法依靠在短時間內(nèi)收集到同等數(shù)量的啟發(fā)式方法,經(jīng)驗在算法上是不可壓縮的。
也許這是正確的。然而,即使經(jīng)驗本身是無法壓縮的,但其中一些需要學(xué)習(xí)的知識可能仍然是可壓縮的。
圖庫版權(quán)圖片,轉(zhuǎn)載使用可能引發(fā)版權(quán)糾紛
總之,常識不涉及復(fù)雜的任務(wù)。正如麥卡錫在六十多年前首次提出的那樣,常識能夠從你所知道和被告知的內(nèi)容中得出簡單而直接的結(jié)論,并將常識有效應(yīng)用于你所要做的任何事情,
這就是擁有常識的機器的未來圖景。
《機器如人:通往人類智慧之路》
中國科學(xué)技術(shù)出版社
[美] 羅納德·J.布拉赫曼 著
[加] 赫克托·J.萊韋斯克 著
智越坤 譯
《機器如人》深入探討了如何在人工智能系統(tǒng)中融入廣泛、強大的常識,而非僅僅依賴狹隘、專門的專業(yè)知識。書中提出了一種賦予人工智能系統(tǒng)常識和有效推理能力的創(chuàng)新方法,探討了我們?nèi)绾涡湃巫灾鳈C器做出決策的關(guān)鍵問題,并明確值得信賴的自主人工智能系統(tǒng)需要具備的兩個基本要求:有行動理由和能夠接受建議。這兩點的實現(xiàn)都取決于系統(tǒng)是否具備常識。本書為人工智能領(lǐng)域的專業(yè)人士和對人工智能感興趣的讀者提供寶貴的見解和指導(dǎo),引領(lǐng)他們走向智能技術(shù)的未來。
策劃制作
來源丨圖書《機器如人:通往人類智慧之路》,中國科學(xué)技術(shù)出版社
作者|羅納德·J.布拉赫曼 赫克托·J.萊韋斯克
譯者丨智越坤
策劃丨王夢如
責(zé)編丨王夢如
審校丨徐來 林林