卡內(nèi)基梅隆大學教授 :是時候打破人腦與機器之間的壁壘了
?卡內(nèi)基梅隆大學計算機科學學院教授Tom Mitchell
編者按:
4月27日,由長城會主辦的全球移動互聯(lián)網(wǎng)大會(GMIC)在北京開幕,在其中全球科學創(chuàng)新峰會上,美國卡內(nèi)基梅隆大學計算機科學學院機器學習系主任Tom Mitchell做了“突破人類與機器的壁壘”的主題演講。他認為,腦科學和人工智能在過去幾十年都有了巨大的發(fā)展,現(xiàn)在是時候打破它們之間界限的時候了,未來將發(fā)展出更加具有人類能力的人工智能,我們對大腦的理解也將會更加計算機化。以下內(nèi)容整理自嘉賓演講,未經(jīng)演講者審閱。
演講 | Tom Mitchell(卡內(nèi)基梅隆大學計算機科學學院教授)
整理 | 劉美幸、劉嘉欣
責編 | 陳曉雪
● ● ●
智能如何在物理材料中實現(xiàn)突破?這是科學界一個偉大但未被解答的問題。
我們當前有兩種研究的方式:研究大腦,因為我們的大腦是智能的;努力開發(fā)人工智能。這是兩種研究智能的方向,而且人類對它的研究已經(jīng)進行了很長一段時間了。
關于智能的這兩個研究方向是不是“相差太遠”了?它們就像是在互相忽視對方一樣,從來沒有交集,這兩方面的專家對對方領域都了解得不多,是不是到了該讓它們產(chǎn)生交集得時候了?是不是該進行一些戰(zhàn)略改變,投入更多的資源進行兩者之間的交叉研究?
實際上,這兩方面在過去幾十年都取得了許多顯著進步。人工智能在圍棋、國際象棋、撲克等方面取得了不俗的戰(zhàn)績,包括去年戰(zhàn)勝圍棋冠軍李世石。計算機視覺進展也很快,過去十年里面,識別率從60%變成了95%。去年10月,微軟已經(jīng)宣布了它相應的一個數(shù)據(jù)庫,也實現(xiàn)了主要突破,比如前面講到了下圍棋、下象棋,人工智能突破非??欤澈笾饕且粋€深層次的機器學習。
腦科學發(fā)展也非常迅猛,我們能更好地引入功能性磁共振成像(fRMI)、腦電圖(EEG)等高科技,這些微創(chuàng)或者無創(chuàng)的方法使得我們可以在毫秒間分析幾千個影像,查看人腦的一些活性。與人腦研究相比,動物的大腦研究更加令人歡欣鼓舞。我們對老鼠和其他一些動物進行基因改造,對它稍微放電刺激,研究動物大腦基因的一些修飾、改變,這樣可以更好地管理和控制人的神經(jīng)活動。當老鼠在迷宮中跑動時,我們可以掃描其腦活動,而當老鼠在一個迷宮行走的時候,我們可以通過它的神經(jīng)元放電的狀況來了解老鼠對自己位置的感覺。我們還發(fā)現(xiàn)人們社交時,大腦中管社交的部分會得到同步激活,而且自閉癥患者和正常人在該區(qū)域會出現(xiàn)不一樣狀況。
無論是在人工智能方面還是腦科學方面,我們都取得了令人矚目的巨大進展。所以,就有這樣一個問題,它們?yōu)槭裁床痪酆掀饋??無論腦科學還是人工智能方面都是進行交叉的研究。
首先是計算機視覺,這樣的一個神經(jīng)網(wǎng)絡,可以用來預測人腦當中的神經(jīng)元的活動,包括它的視覺皮層相應的活動。我們可以來看一些細節(jié),單個神經(jīng)網(wǎng)絡當中的單元,通過輸入輸出可以看到相關的情況,它的輸入可以進行研究,它到底是怎樣的組合,我們也可以看到單個神經(jīng)元組成的網(wǎng)絡,一個輸出成為另外一個輸入的情況,如果對這樣深層次的網(wǎng)絡進行訓練,比如把輸入的影像通過輸出,展現(xiàn)出這個影像到底是什么,實現(xiàn)相應的深度學習。
2014年,我們做了一些實驗,訓練了不同的網(wǎng)絡,每一個點都是代表他們訓練過的人工神經(jīng)網(wǎng)絡。在訓練了這些神經(jīng)網(wǎng)絡之后,我們把同樣的影像給另外的神經(jīng)網(wǎng)絡看。fMRI掃描也在人的大腦當中相應的部分觀測到神經(jīng)活動,有相似的預測。這是令人一個非常稱奇的結(jié)果。我們現(xiàn)在可以建立一種橋梁,訓練人工神經(jīng)網(wǎng)絡,預測大腦的腦神經(jīng)活動。這樣就打開了無限的可能,可以回答很多有趣的問題。比如,人的視覺到底是怎么運作的,可以用怎樣的設備設計更好的人工神經(jīng)網(wǎng)絡幫助我們做這樣的預測。這樣人工的神經(jīng)網(wǎng)絡可以進一步推動,一層一層地輸入、輸出,而大腦的確是不一樣的,大腦是有前輸和后輸?shù)?,而我們就可以在這個橋梁當中研究,人工的大腦和人的大腦當中到底什么區(qū)別,可以相互借鑒、促進。
這里有另外一個例子,來自于最近的一個研究,自然語言的研究已經(jīng)得到了很大的提升。比如谷歌翻譯現(xiàn)在也比之前要更加精確了,為什么呢?主要是由于深層次的神經(jīng)網(wǎng)絡,甚至是因為有一些儲存。通過對大腦的研究,我們來研究大腦怎么樣用這個神經(jīng)活動來解釋相應的一些詞義,這些詞義給我們一些更好的回答問題的方式。對這些細節(jié)進行研究后,我們產(chǎn)生一種模型或者理論來幫助我們對大腦的活動進行預測,任何一個詞輸入人腦會出現(xiàn)怎樣的一個詞義。通過這樣一個模型的結(jié)構(gòu),任何輸入都可以被研究。比如說電話,首先這個模型產(chǎn)生一個代碼,用它預測大腦的神經(jīng)活動,能預測出大腦中兩萬多個不同的位置。進一步通過矢量預測,比如這里是“芹菜”和“飛機”兩個矢量,兩個矢量的特征都和相應的詞對應,我們可以看到和芹菜相關聯(lián)的有“吃”,“味道”一類,而對“飛機”來說,相關聯(lián)的就出現(xiàn)很多動詞,相關的一些詞就出現(xiàn)了。
通過這樣一些模型當中的編碼,可以很好地反映出皮層中出現(xiàn)的詞,有助于我們對模型進行訓練。我們看到對任何詞的神經(jīng)活動,比如“芹菜”,把這些語義的特征組合起來,通過模型分析,關聯(lián)這些特征,“吃”這個詞和“芹菜”這個詞是關聯(lián)度最高的,通過這樣的研究很有意義,給到一個新詞,比如說之前沒有培訓過。我們發(fā)現(xiàn),在83%的情況下有兩個新的詞,哪個是第一個關聯(lián),哪個是第二個關聯(lián),有50%的可能性是正確的,有的詞從來沒有出現(xiàn)也是有很高的識別率。詞義的表達,是我們矢量表達法在詞義解釋上的應用。
第三個例子是強化學習,這個是非常流行的,比如相關的訓練當中會出現(xiàn)強化學習。很多時候?qū)游锏莫剟钍菑娀瘜W習的一種很好的方式。
這里有張圖,底部有一些橫線,每一個點都是對應到猴子一個正在放電的神經(jīng)元,在下面可以看到有時間的序列,給猴子一些糖,猴子的神經(jīng)元就有放電的現(xiàn)象。神經(jīng)元放電代表什么呢?可能是猴腦對這個獎勵,也就是這個糖有所感應,所以放電了。
所以,實驗的第二部分是,實驗者培訓這些猴子,讓它們知道給糖之后的1秒就會開始閃光,這個圖就變了。我們可以看到的就是給猴子糖以后,猴子的神經(jīng)元沒有任何反應,而是當閃光以后,猴子的神經(jīng)元才放電,說明并不是因為給了糖神經(jīng)元才反應,而是對獎勵這個事情本身放電,這是很酷的情況。
第三種情況,沒有給糖,只是閃光,猴子怎么反應?沒有給糖,沒有任何獎勵,這個神經(jīng)元就會怎么樣來表達呢?我們發(fā)現(xiàn),閃光之后沒有給糖,是一種令猴子抑郁的舉動。一些物質(zhì)是與強化學習直接相關的。在這樣的信號之下,我們可以看到的是能出現(xiàn)獎勵和這個時間的方程式,在這樣的一個情況下,很好來解釋了我們能看到猴子神經(jīng)元的一個表現(xiàn),因此在我們的人工智能的算法和我們?nèi)说拇竽X之間或者動物的大腦之間,有這樣一種橋梁和關系。因此強化學習的算法對機器人的控制是可以用的,或者是可以用于打敗人類冠軍的AlphaGo的訓練。因此,這樣一些對大腦行為的觀測和檢測可以幫助我們進行一些人工神經(jīng)網(wǎng)絡的訓練。
這就是我要講的三個例子, 一個是計算機視覺,一個是文本含義與預測,一個是通過獎賞強化學習。
人工智能和大腦是兩種研究智能的方式,二者發(fā)展都很迅速,現(xiàn)在到了二者融合的時間了。盡管人的大腦不是由硅組成的計算機,但是任何產(chǎn)生智能的物理的方式,它都是有一些信息的約束條件的,形成一種結(jié)構(gòu),這樣的一種結(jié)構(gòu)可以深層次地學習。在人工智能和人腦之間的學習中,我們可以找到更多的答案幫助我們推進科學的進步。
制版編輯:鄧志英丨