如何才能實(shí)現(xiàn)“通用”型 AI?科學(xué)家:從人腦尋找靈感
編者按:深度學(xué)習(xí)在單個(gè)領(lǐng)域已經(jīng)取得了可喜的突破。但是若論綜合實(shí)力,現(xiàn)在的AI根本無法跟人相比。人是通用學(xué)習(xí)機(jī)器,但AI不是。腦科學(xué)家Jeff Hawkins 稱科學(xué)家需要不斷從人腦那里尋找靈感來開發(fā)一般人工智能。為此,他認(rèn)為自己團(tuán)隊(duì)的最近發(fā)現(xiàn)也許為AGI的實(shí)現(xiàn)描繪了一幅清晰的路線圖。
諸如“深度學(xué)習(xí)”和“卷積神經(jīng)網(wǎng)絡(luò)”等人工智能技術(shù)在圖像識(shí)別、自動(dòng)駕駛汽車等其他困難任務(wù)方面已經(jīng)取得了驚人的進(jìn)步。隨著融資和收購行為的加速,眾多的人工智能公司看上去已經(jīng)站在了風(fēng)口的位置。
然而,主要的人工智能研究人員卻意識(shí)到事情有點(diǎn)不對勁。盡管取得了令人印象深刻的進(jìn)展,但目前的人工智能技術(shù)其實(shí)是很局限的。例如,深度學(xué)習(xí)網(wǎng)絡(luò)在開始能夠正確工作之前通常需要數(shù)百萬個(gè)訓(xùn)練樣例,而人類只需要看幾次就可以學(xué)習(xí)新的東西。這限制了深度學(xué)習(xí)網(wǎng)絡(luò)的應(yīng)用類型。雖然這些網(wǎng)絡(luò)的平均準(zhǔn)確度很高,但還是會(huì)錯(cuò)得非常離譜。比方說,圖像中的一點(diǎn)微小的變化也會(huì)導(dǎo)致AI系統(tǒng)將牙刷誤認(rèn)為是棒球棒。在一些應(yīng)用中,這類錯(cuò)誤可能會(huì)導(dǎo)致災(zāi)難性的失敗,造成致死和受傷。由于這樣那樣的限制,人工智能的領(lǐng)導(dǎo)者認(rèn)為應(yīng)該換種思路去做。最著名的人工智能科學(xué)家之一Geoff Hinton最近在解釋他對當(dāng)前的AI技術(shù)感到“非常懷疑”時(shí)表示,我們需要另起爐灶。 “我的看法是要把它全部扔掉,重新開始。”深度學(xué)習(xí)網(wǎng)絡(luò)領(lǐng)先的實(shí)踐者Francois Chollet下結(jié)論說:“你沒法靠擴(kuò)展如今的深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)一般人工智能。”
Chollet認(rèn)為,從根本上來說深度學(xué)習(xí)是有限的,但人類智能不是。的確,人腦極其靈活。人類不僅會(huì)駕駛汽車,我們還可以建造摩天大樓,管理農(nóng)場和對計(jì)算機(jī)編程。甚至我們拿起簡單物體,比如拿起咖啡杯然后用手指熟練操縱的能力,也遠(yuǎn)遠(yuǎn)超出了任何AI系統(tǒng)之所及。我們每個(gè)人都已經(jīng)學(xué)會(huì)了數(shù)以百計(jì)的復(fù)雜技能,并且能夠連續(xù)不斷的混合運(yùn)用。反過來,深度學(xué)習(xí)系統(tǒng)只能處理相對較少的任務(wù),而且一次只能做一件事。每一項(xiàng)新任務(wù)它們都需要進(jìn)行重新訓(xùn)練。人類是通用學(xué)習(xí)機(jī)器;但AI系統(tǒng)不是。人工智能要想繼續(xù)取得成功有賴于于突破當(dāng)前的局限性,使AI更通用。
最近人工智能科學(xué)家已經(jīng)開始在大腦上面尋找靈感。 Google DeepMind聯(lián)合創(chuàng)始人Demis Hassibis表示:“我們試圖開發(fā)的那種一般智能是否存在?對于這個(gè)問題人類大腦是我們現(xiàn)在唯一的證據(jù),所以我們認(rèn)為理解大腦是如何實(shí)現(xiàn)這些能力的努力是值得的。”
我同意。我一直在研究大腦,至今已有三十多年。 2004年,我寫了《關(guān)于智能》,這本書提出了AI對大腦理論有何種需要的建議。 2005年,我跟人一起創(chuàng)立了Numenta公司,該公司專注于對新大腦皮層,也就是人腦最重要的、與智能關(guān)系最密切部分進(jìn)行逆向工程。我們試圖通過研究大腦細(xì)胞如何共同建立知覺和行為來理解什么是智能。大腦的工作機(jī)制和目前的AI技術(shù)有相似之處,這說明AI正走在正確的軌道上。但是兩者之間也有著顯著差異。大腦的能力不僅比現(xiàn)有的AI系統(tǒng)強(qiáng)得多,而且大腦的具體結(jié)構(gòu)也遠(yuǎn)比AI所使用的人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)復(fù)雜得多。大腦正在做的事情目前的AI系統(tǒng)做不了。
Numenta的研究揭示了大腦使用的幾個(gè)重要原則,那種我們相信AI最終必須將其納入的原則。比如說,大腦的每個(gè)神經(jīng)元都有成千上萬個(gè)個(gè)突觸(神經(jīng)元之間的連接)。這些突觸大部分是做什么用的至今還是個(gè)謎。我們還發(fā)現(xiàn)神經(jīng)元利用了大部分的突觸來做出預(yù)測。這些預(yù)測發(fā)生在細(xì)胞內(nèi)部,并在我們?nèi)绾晤A(yù)測未來中扮演著必不可少的角色。 AI里面使用的人工神經(jīng)元沒有這個(gè)特性,也不能像大腦那樣做出豐富多樣的預(yù)測。我們還發(fā)現(xiàn)為什么在大腦中的學(xué)習(xí)主要是通過形成新的突觸來實(shí)現(xiàn)的。這是一種比深度學(xué)習(xí)修改現(xiàn)有連接的做法更強(qiáng)大的學(xué)習(xí)形式。它解釋了我們是如何快速學(xué)習(xí)新事物同時(shí)又不會(huì)影響到以前的學(xué)習(xí)的。
雖然我們還有好幾個(gè)其他對智能至關(guān)重要的發(fā)現(xiàn),但是這里我還是想說一下我們最近的一個(gè)也許是最重要的發(fā)現(xiàn)。我們正在研究如何通過觸摸來識(shí)別物體。由此我們推斷出新大腦皮層的一個(gè)新特性,它不僅適用于觸摸,而且也適用于視覺,以及新皮層所做的一切。我有時(shí)把它稱為“缺失的要素”,或者正如本文的標(biāo)題所說,是“強(qiáng)AI的秘密”。我們最近發(fā)表了一篇科學(xué)論文詳細(xì)介紹了這一發(fā)現(xiàn);我會(huì)在這里概括介紹一下。
看看這張圖。這顯然是個(gè)杯子。但是,當(dāng)然,它其實(shí)并不是杯子,而是一個(gè)平面上的線條集合。令人驚訝的是,你很難把這個(gè)圖像看成是一個(gè)平面上的線條集合而不是一個(gè)三維的杯子。腦科學(xué)家普遍認(rèn)為,新大腦皮層從人眼中提取圖像,然后通過一系列步驟老析取出越來越復(fù)雜的特征,直到它識(shí)別出圖像。深度學(xué)習(xí)的工作機(jī)制也是這樣的。這個(gè)過程被稱為模式識(shí)別,深度學(xué)習(xí)網(wǎng)絡(luò)很擅長這個(gè)。在用許多圖像進(jìn)行訓(xùn)練之后,拿一張新的圖像出來它就能告訴你是什么。但是除了標(biāo)簽以外,它們并不理解這個(gè)對象還是什么。與之相反相反,當(dāng)你看到一幅圖像時(shí),你馬上技能感覺到它的三維形狀。你可以想象從不同的角度來看它會(huì)是什么樣的,你會(huì)知道它可能可以裝液體,甚至知道它摸起來會(huì)是什么感覺。深度學(xué)習(xí)網(wǎng)絡(luò)擅長給圖像貼標(biāo)簽但不理解它是什么,而新皮層理解對象的結(jié)構(gòu)以及它的行為。
直到最近,還沒有人理解新大腦皮層是如何將平面圖像轉(zhuǎn)化為真實(shí)物體的心理表征的。我們弄明白了大腦是如何做到這一點(diǎn)的。我們推斷所有到新皮層的輸入都是跟表示“位置”的信號(hào)相配對的。當(dāng)你看著杯子的圖像時(shí),圖像的每個(gè)部分,每條線段都會(huì)分配給三維杯子的相應(yīng)位置。這與計(jì)算機(jī)創(chuàng)建對象的CAD模型相似。我們的理論解釋了為什么你從三維角度來感知杯子,為什么你會(huì)想象旋轉(zhuǎn)杯子會(huì)是什么樣子,以及如果你觸摸它的話會(huì)是什么感覺。這也解釋了為什么你對杯子的感覺是穩(wěn)定的,即便你的眼睛移動(dòng)并凝視圖像上的不同位置也是如此。只要輸入特征被分配到杯子相應(yīng)的正確位置,圖像出現(xiàn)在視網(wǎng)膜的任何地方都沒有關(guān)系。
我們一直在探索這個(gè)發(fā)現(xiàn)的意義,并相信它可以解決大腦如何工作的許多奧秘。盡管我們先是通過研究觸覺然后視覺來推斷出這個(gè)屬性的,但是確定位置信號(hào)的神經(jīng)結(jié)構(gòu)存在于新皮質(zhì)的每個(gè)部分。這令人振奮地表明,新皮層中的所有處理都與位置有關(guān),即使這些位置與世界的物理位置并不一一對應(yīng)。這也表明我們利用了操縱物理實(shí)體的相同神經(jīng)機(jī)制來操縱抽象概念。當(dāng)然了,操縱概念是一般智能的核心特征。
數(shù)十年來人們一直在討論AI需要模仿大腦的多少東西的問題。最近僅跟大腦松散相關(guān)的深度學(xué)習(xí)的成功,給無需大腦理論AI也能取得進(jìn)展的說法提供了支持。但是,這種成功了突出了深度學(xué)習(xí)的局限性,使得對新方法的需求更加明顯。大腦顯然是是尋找新想法的好地方。Amazon CEO 貝索斯最近表示:“人類所做的事情跟目前我們做機(jī)器學(xué)習(xí)和機(jī)器智能的方式有著根本的不同。”
說到構(gòu)建通用AI,我們不需要模仿大腦所做的一切。 但是大腦所運(yùn)用的一些原則不容忽視, 它們對于任何展現(xiàn)出一般人工智能的系統(tǒng)都是必不可少的。我們通過研究發(fā)現(xiàn)了其中的幾個(gè)基本原理。我相信,我們最近的發(fā)現(xiàn)將被證明是最重要的。它完全改變了我們對大腦處理感官輸入的認(rèn)知,以及大腦如何表示對世界的認(rèn)識(shí)的思考。
我們希望,隨著越來越多的人工智能從業(yè)人員認(rèn)識(shí)到現(xiàn)有人工智能技術(shù)的局限性,他們也能認(rèn)識(shí)到一般人工智能的路線圖正在腦理論界迅速形成。大腦理論的發(fā)現(xiàn)可能還需要幾年的時(shí)間才能完全整合進(jìn)人工智能,但對于我來說,如何實(shí)現(xiàn)目標(biāo)的路線圖已經(jīng)非常清晰。
原文地址:https://medium.com/@Numenta/the-secret-to-strong-ai-61d153e26273
譯者:boxi,由36氪編譯組出品。編輯:郝鵬程。
譯文地址:http://36kr.com/p/5103924.html
本文由 @boxi 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自 unsplash
- 目前還沒評(píng)論,等你發(fā)揮!