<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 深度學(xué)習教父Geoffrey Hinton的“膠囊”論文公開(kāi),帶你讀懂它

深度學(xué)習教父Geoffrey Hinton的“膠囊”論文公開(kāi),帶你讀懂它

作者: 時(shí)間:2017-10-30 來(lái)源:心科技 收藏

  在人工智能學(xué)界,Geoffrey Hinton擁有非常崇高的地位,甚至被譽(yù)為該領(lǐng)域的愛(ài)因斯坦。在人工智能領(lǐng)域最頂尖的研究人員當中,Hinton的引用率最高,超過(guò)了排在他后面三位研究人員的總和。目前,他的學(xué)生和博士后領(lǐng)導著(zhù)蘋(píng)果、Facebook以及OpenAI的人工智能實(shí)驗室,而Hinton本人是谷歌大腦(Google Brain)人工智能團隊的首席科學(xué)家。

本文引用地址:http://dyxdggzs.com/article/201710/370703.htm

  

深度學(xué)習教父Hinton的Capsule論文公開(kāi),帶你一起讀懂它

  就在幾個(gè)小時(shí)之前,由 Hinton 和其在谷歌大腦的同事 Sara Sabour、Nicholas Frosst 合作的 NIPS 2017 論文《Dynamic Routing Between Capsules》已經(jīng)正式對外公開(kāi),解釋了不同 Capsules (膠囊)間路由的學(xué)習。

深度學(xué)習教父Hinton的Capsule論文公開(kāi),帶你一起讀懂它

 

  研究背景

  目前的神經(jīng)網(wǎng)絡(luò )中,每一層的神經(jīng)元都做的是類(lèi)似的事情,比如一個(gè)卷積層內的每個(gè)神經(jīng)元都做的是一樣的卷積操作。而Hinton堅信,不同的神經(jīng)元完全可以關(guān)注不同的實(shí)體或者屬性,比如在一開(kāi)始就有不同的神經(jīng)元關(guān)注不同的類(lèi)別(而不是到最后才有歸一化分類(lèi))。具體來(lái)說(shuō),有的神經(jīng)元關(guān)注位置、有的關(guān)注尺寸、有的關(guān)注方向。這類(lèi)似人類(lèi)大腦中語(yǔ)言、視覺(jué)都有分別的區域負責,而不是分散在整個(gè)大腦中。

  為了避免網(wǎng)絡(luò )結構的雜亂無(wú)章,Hinton提出把關(guān)注同一個(gè)類(lèi)別或者同一個(gè)屬性的神經(jīng)元打包集合在一起,好像膠囊一樣。在神經(jīng)網(wǎng)絡(luò )工作時(shí),這些膠囊間的通路形成稀疏激活的樹(shù)狀結構(整個(gè)樹(shù)中只有部分路徑上的膠囊被激活),從而形成了他的Capsule理論。值得一提的是,同在谷歌大腦(但不在同一個(gè)辦公室)的Jeff Dean也認為稀疏激活的神經(jīng)網(wǎng)絡(luò )是未來(lái)的重要發(fā)展方向,不知道他能不能也提出一些不同的實(shí)現方法來(lái)。

  Capsule這樣的網(wǎng)絡(luò )結構在符合人們“一次認知多個(gè)屬性”的直觀(guān)感受的同時(shí),也會(huì )帶來(lái)另一個(gè)直觀(guān)的問(wèn)題,那就是不同的膠囊應該如何訓練、又如何讓網(wǎng)絡(luò )自己決定膠囊間的激活關(guān)系。Hinton這篇論文解決的重點(diǎn)問(wèn)題就是不同膠囊間連接權重(路由)的學(xué)習。

  解決路由問(wèn)題

  首先,每個(gè)層中的神經(jīng)元分組形成不同的膠囊,每個(gè)膠囊有一個(gè)“活動(dòng)向量”activity vector,它是這個(gè)膠囊對于它關(guān)注的類(lèi)別或者屬性的表征。樹(shù)結構中的每個(gè)節點(diǎn)就對應著(zhù)一個(gè)活動(dòng)的膠囊。通過(guò)一個(gè)迭代路由的過(guò)程,每個(gè)活動(dòng)的膠囊都會(huì )從高一層網(wǎng)絡(luò )中的膠囊中選擇一個(gè),讓它成為自己的母節點(diǎn)。對于高階的視覺(jué)系統來(lái)說(shuō),這樣的迭代過(guò)程就很有潛力解決一個(gè)物體的部分如何層層組合成整體的問(wèn)題。

  對于實(shí)體在網(wǎng)絡(luò )中的表征,眾多屬性中有一個(gè)屬性比較特殊,那就是它出現的概率(網(wǎng)絡(luò )檢測到某一類(lèi)物體出現的置信度)。一般典型的方式是用一個(gè)單獨的、輸出0到1之間的回歸單元來(lái)表示,0就是沒(méi)出現,1就是出現了。在這篇論文中,Hinton想用活動(dòng)向量同時(shí)表示一個(gè)實(shí)體是否出現以及這個(gè)實(shí)體的屬性。他的做法是用向量不同維度上的值分別表示不同的屬性,然后用整個(gè)向量的模表示這個(gè)實(shí)體出現的概率。為了保證向量的長(cháng)度,也就是實(shí)體出現的概率不超過(guò)1,向量會(huì )通過(guò)一個(gè)非線(xiàn)性計算進(jìn)行標準化,這樣實(shí)體的不同屬性也就實(shí)際上體現為了這個(gè)向量在高維空間中的方向。

  采用這樣的活動(dòng)向量有一個(gè)很大的好處,就是可以幫助低層級的膠囊選擇自己連接到哪個(gè)高層級的膠囊。具體做法是,一開(kāi)始低層級的膠囊會(huì )給所有高層級的膠囊提供輸入;然后這個(gè)低層級的膠囊會(huì )把自己的輸出和一個(gè)權重矩陣相乘,得到一個(gè)預測向量。如果預測向量和某個(gè)高層級膠囊的輸出向量的標量積更大,就可以形成從上而下的反饋,提高這兩個(gè)膠囊間的耦合系數,降低低層級膠囊和其它高層級膠囊間的耦合系數。進(jìn)行幾次迭代后,貢獻更大的低層級膠囊和接收它的貢獻的高層級膠囊之間的連接就會(huì )占越來(lái)越重要的位置。

  在論文作者們看來(lái),這種“一致性路由”(routing-by-agreement)的方法要比之前最大池化之類(lèi)只保留了唯一一個(gè)最活躍的特征的路由方法有效得多。

  網(wǎng)絡(luò )構建

  作者們構建了一個(gè)簡(jiǎn)單的CapsNet。除最后一層外,網(wǎng)絡(luò )的各層都是卷積層,但它們現在都是“膠囊”的層,其中用向量輸出代替了CNN的標量特征輸出、用一致性路由代替了最大池化。與CNN類(lèi)似,更高層的網(wǎng)絡(luò )觀(guān)察了圖像中更大的范圍,不過(guò)由于不再是最大池化,所以位置信息一直都得到了保留。對于較低的層,空間位置的判斷也只需要看是哪些膠囊被激活了。

  這個(gè)網(wǎng)絡(luò )中最底層的多維度膠囊結構就展現出了不同的特性,它們起到的作用就像傳統計算機圖形渲染中的不同元素一樣,每一個(gè)膠囊關(guān)注自己的一部分特征。這和目前的計算機視覺(jué)任務(wù)中,把圖像中不同空間位置的元素組合起來(lái)形成整體理解(或者說(shuō)圖像中的每個(gè)區域都會(huì )首先激活整個(gè)網(wǎng)絡(luò )然后再進(jìn)行組合)具有截然不同的計算特性。在底層的膠囊之后連接了PrimaryCaps層和DigitCaps層。

  實(shí)驗結果

  由于膠囊具有新的特性,所以文中的實(shí)驗結果也并不只是跑跑Benchmark而已,還有很多對膠囊帶來(lái)的新特性的分析。

  數字識別

  首先在MNIST數據集上,經(jīng)過(guò)三次路由迭代學(xué)習、層數也不算多的CapsNet就得到了優(yōu)秀的錯誤率。

  

深度學(xué)習教父Hinton的Capsule論文公開(kāi),帶你一起讀懂它

 

  同時(shí),作者們依據CapsNet中的表征對“網(wǎng)絡(luò )認為自己識別到”的圖像進(jìn)行重構,表明在正確識別的樣本中(豎線(xiàn)左側),CapsNet可以正確識別到圖像中的細節,同時(shí)降低噪聲。

  健壯性

  由于網(wǎng)絡(luò )結構中DigitCaps部分能夠分別學(xué)到書(shū)寫(xiě)中旋轉、粗細、風(fēng)格等變化,所以對小變化的健壯性更好。在用一個(gè)隨機抹黑過(guò)數字的MNIST數據集訓練CapsNet后,作者們用它來(lái)識別affNIST數據集。這個(gè)數據集中的樣本都是經(jīng)過(guò)小幅度變化后的MNIST樣本,變化后的樣本如下圖。這個(gè)CapsNet直接拿來(lái)識別affNIST的正確率有79%;同步訓練的、參數數目類(lèi)似的CNN只有66%。

深度學(xué)習教父Hinton的Capsule論文公開(kāi),帶你一起讀懂它

  分割高度重合的數字

  作者們把MNIST數據集中的數字兩兩疊在一起建立了MultiMNIST數據集,兩個(gè)數字的邊框范圍平均有80%是重合的。CapsNet的識別結果高于CNN基準自不必提,但作者們接下來(lái)做的圖形分析中清晰地展現出了膠囊的妙處。

  如圖,作者們把兩個(gè)激活程度最高的膠囊對應的數字作為識別結果,據此對識別到的圖像元素進(jìn)行了重構。對于下圖中識別正確的樣本(L指真實(shí)標簽,R指激活程度最高的兩個(gè)膠囊對應的標簽),可以看到由于不同的膠囊各自工作,在一個(gè)識別結果中用到的特征并不會(huì )影響到另一個(gè)識別結果,不受重疊的影響(或者說(shuō)重疊部分的特征可以復用)。

深度學(xué)習教父Hinton的Capsule論文公開(kāi),帶你一起讀懂它

  另一方面,每個(gè)膠囊還是需要足夠多的周邊信息支持,而不是一味地認為重疊部分的特征就需要復用。下圖左圖是選了一個(gè)高激活程度的膠囊和一個(gè)低激活程度膠囊的結果(*R表示其中一個(gè)數字既不是真實(shí)標簽也不是識別結果,L仍然為真實(shí)標簽)??梢钥吹?,在(5,0)圖中,關(guān)注“7”的膠囊并沒(méi)有找到足夠多的“7”的特征,所以激活很弱;(1,8)圖中也是因為沒(méi)有“0”的支持特征,所以重疊的部分也沒(méi)有在“0”的膠囊中用第二次。

  膠囊效果的討論

  在論文最后,作者們對膠囊的表現進(jìn)行了討論。他們認為,由于膠囊具有分別處理不同屬性的能力,相比于CNN可以提高對圖像變換的健壯性,在圖像分割中也會(huì )有出色的表現。膠囊基于的“圖像中同一位置至多只有某個(gè)類(lèi)別的一個(gè)實(shí)體”的假設也使得膠囊得以使用活動(dòng)向量這樣的分離式表征方式來(lái)記錄某個(gè)類(lèi)別實(shí)例的各方面屬性,還可以通過(guò)矩陣乘法建模的方式更好地利用空間信息。不過(guò)膠囊的研究也才剛剛開(kāi)始,他們覺(jué)得現在的膠囊至于圖像識別,就像二十一世紀初的RNN之于語(yǔ)音識別 —— 研究現在只是剛剛起步,日后定會(huì )大放異彩。

  現在,對 Capsule 理論的研究還處于比較早期的階段,這也就意味著(zhù)其還有很多的問(wèn)題有待考察。不過(guò),現在已經(jīng)有越來(lái)越多的跡象表明 Capsule 可以解決一些問(wèn)題,相信它是一個(gè)值得進(jìn)一步挖掘的路徑,正如 Hinton 曾對《麻省理工科技評論》表示,“Capsule 理論一定是對的,不成功只是暫時(shí)的。”



關(guān)鍵詞: 深度學(xué)習

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>