行業(yè)動(dòng)態(tài)

加入“記憶”,通用型人工智能又邁出一步

來(lái)源:聚銘網(wǎng)絡(luò)    發(fā)布時(shí)間:2017-03-24    瀏覽次數(shù):
 

信息來(lái)源:中國(guó)信息產(chǎn)業(yè)網(wǎng) 

CNII網(wǎng)訊  現(xiàn)在人工智能(AI)概念炒得火熱,仿佛未來(lái)人類的一切都將被AI所接管。但實(shí)際上,人工智能的發(fā)展中仍有一個(gè)特別棘手的問(wèn)題有待解決,那就是機(jī)器無(wú)法像人類一樣自由靈活地運(yùn)用通用智慧來(lái)應(yīng)對(duì)挑戰(zhàn)。換言之:人工智能在運(yùn)用過(guò)去的經(jīng)驗(yàn)和知識(shí)方面是受限的。因此,發(fā)展“通用型人工智能”就成為最明確的主攻方向。

谷歌的DeepMind團(tuán)隊(duì)近日發(fā)表論文稱,在這一領(lǐng)域再次取得了突破,聯(lián)合帝國(guó)理工學(xué)院開(kāi)發(fā)出一套名為“彈性權(quán)重固化”的新算法,讓機(jī)器學(xué)習(xí)、記住并重新使用信息成為可能。

DeepMind的James Kirkpatrick表示:“如果我們想要擁有更智能、更有應(yīng)用價(jià)值的計(jì)算機(jī)程序,那么,它就必須具備‘通用型人工智能’的能力?!?/span>

對(duì)于人類來(lái)說(shuō),知識(shí)技能的遷移是再正常不過(guò)的事情了。最典型的例子是:一個(gè)專業(yè)的滑雪玩家往往在滑冰時(shí)也會(huì)得心應(yīng)手。但這一步的跨越對(duì)于人工智能來(lái)說(shuō)卻面臨著不小的挑戰(zhàn)。

其癥結(jié)在于大多數(shù)的人工智能系統(tǒng)都是基于所謂的神經(jīng)網(wǎng)絡(luò)來(lái)解決問(wèn)題,就像DeepMind的AI系統(tǒng)可以學(xué)會(huì)下圍棋或打撲克,這其實(shí)都是在經(jīng)歷了無(wú)數(shù)次的訓(xùn)練和失誤之后才練就的技能。但這兩種技能實(shí)際上是不能并存的,就比如AI學(xué)會(huì)了打撲克,那它就必須把有關(guān)下圍棋的知識(shí)“刪除”。想來(lái)也是可惜,難怪研究人員將之稱為“災(zāi)難性遺忘”。

如果這一問(wèn)題得不到解決,那么人工智能就永遠(yuǎn)不會(huì)達(dá)到人類的智慧程度,自然其解決問(wèn)題的靈活程度也就不能和人類相媲美了。“人類和動(dòng)物能夠掌握大量知識(shí)的一個(gè)關(guān)鍵因素,就在于他們可以在以前知識(shí)的基礎(chǔ)上不斷學(xué)習(xí)新東西?!盞irkpatrick說(shuō)。

而為了實(shí)現(xiàn)這一目標(biāo),研究人員首先在神經(jīng)科學(xué)領(lǐng)域進(jìn)行了探索,他們發(fā)現(xiàn),動(dòng)物通過(guò)保持頭腦中關(guān)于過(guò)往技能的印象,來(lái)實(shí)現(xiàn)不斷學(xué)習(xí),而這往往也是在面臨生存的壓力時(shí)所不得不做出的抉擇,就比如老鼠如果不能快速地學(xué)會(huì)尋找食物的技能,那它們很快就會(huì)被餓死。

早在2014年,DeepMind通過(guò)用機(jī)器學(xué)習(xí)的方法,教會(huì)AI系統(tǒng)玩一款A(yù)tari公司出品的游戲,突然間吸引了極大關(guān)注。那時(shí),AI系統(tǒng)可以做到順利通關(guān),并取得比人類更高的得分,但卻不能記住它贏得游戲的過(guò)程。

玩每一款A(yù)tari公司出品的游戲,AI系統(tǒng)都需要?jiǎng)?chuàng)建一個(gè)單獨(dú)的神經(jīng)網(wǎng)絡(luò)。一旦沒(méi)有把游戲相關(guān)的信息傳遞給計(jì)算機(jī),AI系統(tǒng)就無(wú)法運(yùn)行這一款游戲。

如今,DeepMind聯(lián)合帝國(guó)理工學(xué)院開(kāi)發(fā)出一套新的算法,讓神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)、記住并重新使用信息成為可能。這種名為彈性權(quán)重固化的算法所依賴的是“突觸固化”理論。在人腦中,這一點(diǎn)被稱為學(xué)習(xí)和記憶的基礎(chǔ)。

DeepMind表示:“我們的方法是通過(guò)有選擇性地減慢對(duì)重要權(quán)重值的學(xué)習(xí),使機(jī)器能記住之前的任務(wù)。”

Kirkpatrick解釋說(shuō),算法會(huì)選擇運(yùn)用它所學(xué)習(xí)的內(nèi)容來(lái)玩一款游戲,然后保留其中學(xué)到的最為重要的部分?!拔覀冎辉试S程序非常緩慢地漸進(jìn)式地改變,那樣的話才總是會(huì)有學(xué)習(xí)新任務(wù)的空間,而同時(shí)這種改變不會(huì)覆蓋之前學(xué)到的內(nèi)容?!?/span>

在測(cè)試中,研究人員利用被新算法強(qiáng)化過(guò)的DQN深度神經(jīng)網(wǎng)絡(luò)隨機(jī)玩10款A(yù)tari公司的游戲,幾天之后,他們發(fā)現(xiàn)AI系統(tǒng)已經(jīng)可以做到和人類玩家一樣優(yōu)秀了,這其中很大的一部分功勞都屬于這種新的算法。沒(méi)有它,人工智能幾乎學(xué)不會(huì)其中任何一款游戲。

Kirkpatrick說(shuō),“我們之前的游戲AI系統(tǒng)只能學(xué)習(xí)玩一款游戲,而如今我們新發(fā)布的系統(tǒng)已經(jīng)對(duì)多款游戲都得心應(yīng)手了。”

在AI玩游戲的過(guò)程中,研究人員還注意到一些有趣的現(xiàn)象。例如,當(dāng)AI系統(tǒng)在玩賽車類游戲的時(shí)候,對(duì)于游戲中的白天、晚上、雪等不同的場(chǎng)景,AI系統(tǒng)已經(jīng)可以將它們分解為不同的任務(wù)來(lái)一一進(jìn)行解決了,這倒是很出乎大家的預(yù)料。

然而,緊接著又有新的問(wèn)題出現(xiàn)了,那就是研究人員無(wú)法證明,AI系統(tǒng)是否可以把每一款游戲都玩到極致。概括來(lái)講,AI系統(tǒng)雖然已經(jīng)可以利用學(xué)過(guò)的知識(shí)來(lái)解決現(xiàn)有的問(wèn)題,但它是否會(huì)因?yàn)檫\(yùn)用這種方法而將問(wèn)題解決得更好,還值得商榷?!皩?duì)于AI來(lái)說(shuō),還有改進(jìn)的余地?!盞irkpatrick說(shuō)。

而AI沒(méi)有精通每一款游戲的一個(gè)原因就在于,它對(duì)于游戲策略的運(yùn)用仍然沒(méi)能做得很好?!半m然我們知道連貫學(xué)習(xí)的重要性,但我們始終沒(méi)能實(shí)現(xiàn)突破,進(jìn)入到模擬人類和動(dòng)物那種學(xué)習(xí)模式的階段。這的確是一個(gè)艱難的挑戰(zhàn),但我們知道沒(méi)有什么事是不可逾越的。”Kirkpatrick說(shuō)。

“我們距離通用型人工智能還有很長(zhǎng)的路要走,也還有很多的研究和挑戰(zhàn)需要解決。”Kirkpatrick補(bǔ)充道,“關(guān)鍵在于,搭建起一個(gè)可以學(xué)習(xí)解決新任務(wù)和新挑戰(zhàn)的系統(tǒng),同時(shí)還要繼續(xù)保留他們已經(jīng)學(xué)到的技能。而我們所做的研究就是朝這個(gè)方向進(jìn)行的有意義的摸索。”

倫敦大學(xué)學(xué)院Gatsby計(jì)算神經(jīng)科學(xué)科主任Peter Dayan對(duì)于這項(xiàng)研究工作給予了高度評(píng)價(jià)。他說(shuō),計(jì)算機(jī)如果實(shí)現(xiàn)通用型人工智能就意味著,它已經(jīng)可以做到將不同任務(wù)進(jìn)行關(guān)聯(lián),充分利用已掌握的技能來(lái)解決新的問(wèn)題。

但質(zhì)疑的聲音自然也是存在的。英國(guó)西部大學(xué)布里斯托機(jī)器人實(shí)驗(yàn)室的Alan Winfield說(shuō),這項(xiàng)研究的確很好,但它顯然沒(méi)有做到更接近通用型人工智能。至少,DeepMind的專家們沒(méi)有透露學(xué)習(xí)能力的遷移是如何具體實(shí)現(xiàn)的,我們到底能不能直接運(yùn)用它也都還沒(méi)有定論。

 
 

上一篇:2017年03月23日 聚銘安全速遞

下一篇:LastPass密碼管理器再曝嚴(yán)重漏洞,基于瀏覽器的密碼管理器還能用嗎?