自律學(xué)習SDL模型賦能自動(dòng)駕駛
最近發(fā)生的幾起自動(dòng)駕駛惡性事故,某種意義上看,都是因為深度學(xué)習的識別問(wèn)題造成的。為什么被大家崇拜的深度學(xué)習在識別圖像上會(huì )出現問(wèn)題?
本文引用地址:http://dyxdggzs.com/article/202109/428180.htm原因有幾個(gè)方面,最主要的是深度學(xué)習在理論上屬于函數映射模型,簡(jiǎn)單說(shuō)就是給它訓練什么圖像就只能識別哪個(gè)圖像,不具有舉一反三的能力。通常我們用手機拍攝一個(gè)圖像,在屏幕上雖然看不出圖像有什么變化,這是因為大腦有記憶能力。但是對于沒(méi)有智能的機器識別來(lái)說(shuō),隨著(zhù)相機的抖動(dòng),拍攝角度,光線(xiàn)等的微小變化所得到的都是完全不同的圖像。深度學(xué)習就是這樣,哪怕圖像有一點(diǎn)錯位,也會(huì )認為是另一個(gè)圖像。所以深度學(xué)習需要上萬(wàn)乃至上百萬(wàn)個(gè)圖像的訓練才能識別一個(gè)圖像。這就意味著(zhù)用深度學(xué)習模型的自動(dòng)駕駛的圖像識別裝置,遇到?jīng)]有訓練過(guò)的圖像時(shí),明明有障礙物,也會(huì )做出沒(méi)有障礙物的判斷結果,出現撞車(chē)的惡性事故在所難免。盡管開(kāi)發(fā)者們下力量不斷的搜集大量圖像數據進(jìn)行訓練,但是面對眾多種路況這種做法從科學(xué)觀(guān)的立場(chǎng)上講是徒勞的。這也就是馬斯克指責目前學(xué)術(shù)界給出的AI不夠智能的原因所在。
我們希望更加智能的自動(dòng)駕駛的誕生,需要各方努力,特別需要探索和尋找更好的算法模型。2018年發(fā)表在國際機器人大會(huì )上的自律學(xué)習模型是一個(gè)值得自動(dòng)駕駛領(lǐng)域關(guān)注的算法模型。自律學(xué)習(Self-Discipline Learning)SDL模型其實(shí)就是人工智能領(lǐng)域所期待的機器學(xué)習模型。這種模型之所以強大是因為具有四個(gè)特殊的技術(shù)特征。
第一個(gè)技術(shù)特征是能讓機器模仿人來(lái)處理自動(dòng)駕駛的識別,機器推理,以及自動(dòng)駕駛的控制問(wèn)題的算法。深度學(xué)習是基于統計學(xué)的機器學(xué)習模型,其實(shí)是屬于模式識別的理論,本不是人工智能的主流算法。人工智能的定義就是把人的智慧授予機器,讓機器具有超越人的能力。因此對于上述自動(dòng)駕駛所面臨的復雜系問(wèn)題,近幾十年一直圍繞著(zhù)如何實(shí)現人為介入,就是說(shuō)讓人介入到算法里去,把人在如何解決問(wèn)題的方法構成算法,用這樣的算法讓機器去代替人解決復雜系問(wèn)題。人工智能的第一,二次高潮的主流算法就是力圖解決給機器賦予人的智慧的問(wèn)題,只是因為當時(shí)缺少數學(xué)基礎理論的支持,還無(wú)法在技術(shù)上實(shí)現讓機器智能的目的。因此真正的人工智能算法一定要直接解決如何把人的智慧讓機器深度理解,讓機器變聰明來(lái)代替人的工作。
談到這里,恐怕包括一些專(zhuān)家學(xué)者們都會(huì )感到茫然。這么復雜的算法何時(shí)才能得到?其實(shí)支持新一代人工智能的核心理論并不一定是極其抽象的理論,傳統的理論由于過(guò)于僵化不容易做到人為介入,把人的智慧授予機器,在當今人工智能領(lǐng)域是行不通的。而往往被人看不上的現代數學(xué)卻是可以成為人工智能可以產(chǎn)生突破性的核心理論。其中,模糊集合理論就為我們提供了可以針對任何一種事物的定式化方法。把人的智慧用足夠多的隸屬函數(Membership Function)的公式來(lái)表達,機器按照這些隸屬函數來(lái)處理各種復雜系問(wèn)題,機器就可以同人一樣聰明起來(lái)。
這是受第二次人工智能高潮為了讓機器聰明起來(lái),所推出的規則庫理論的啟發(fā),由于當時(shí)用規則所實(shí)現的知識表現過(guò)于簡(jiǎn)單,規則只能告訴機器在什么情況下,應該如何做?面對復雜系問(wèn)題卻需要無(wú)窮個(gè)規則才能解決,所以規則庫理論以失敗告終。今天,用隸屬函數進(jìn)行知識表現,一個(gè)隸屬函數可以相當無(wú)窮個(gè)規則,所以不用懷疑隸屬函數的能力。
我們可以用自動(dòng)駕駛中目前很難解決的機器推理為例子,介紹上述算法的驚人作用。
自動(dòng)駕駛的機器推理難就難在要想控制自動(dòng)駕駛車(chē)正確的行駛,至少要考慮前后左右共有8輛車(chē)之間的距離,速度,加速度,以及自動(dòng)駕駛車(chē)的速度,加速度,嚴格講這就是超越了40個(gè)組合要素的圖靈機不可解的NP(Non-deterministic Polynomial)問(wèn)題。所以目前推出的自動(dòng)駕駛就是國際大公司也苦于做不好這個(gè)功能,我們看到的這些自動(dòng)駕駛很少變道,寧可跟著(zhù)前面的車(chē)停下等待。
面對這個(gè)難題,我們搞的自動(dòng)駕駛中的機器推理系統,就是把人在駕駛汽車(chē)時(shí)的安全駕駛,安全禮讓?zhuān)约棒~(yú)貫而行的安全駕駛的智慧用數百個(gè)隸屬函數來(lái)表達實(shí)現了機器深度理解,再通過(guò)深度的推理指揮自動(dòng)駕駛的行駛,這樣的自動(dòng)駕駛在路上跑,真的同人的駕駛很接近。為了讓機器推理能夠適應目前在路上經(jīng)常出現的野蠻駕駛的同行車(chē),我們做了幾乎可以模擬實(shí)際路況的自動(dòng)駕駛仿真系統,這個(gè)仿真系統中自動(dòng)駕駛車(chē)是用我們的機器推理模型來(lái)控制,周?chē)耐熊?chē)可以由人來(lái)控制,用人來(lái)控制同行車(chē)的目的就是,可以由人主動(dòng)的構成各種變化多端甚至包括一些危險的路況場(chǎng)景,通過(guò)人同自動(dòng)駕駛博弈,用以考驗機器推理的效果。這就是在新一代人工智能模型下,目前傳統模型不可解決的問(wèn)題,卻可以輕而易舉的解決的案例。
由此可見(jiàn),讓機器聰明起來(lái)并不是不可想象的神話(huà),路在腳下只要用心就可以擺脫傳統的理論的束縛,在人工智能的研究中產(chǎn)生突破性的成果。
近代數學(xué)中的高斯過(guò)程理論也是人工智能的核心理論。著(zhù)名數學(xué)家高斯發(fā)明的高斯分布的偉大之處在于它可以通過(guò)少量的數據就能得到大數據的訓練結果,基于這個(gè)理論所搞出的機器學(xué)習模型一定具有舉一反三的能力。高斯分布還給出了一切事務(wù)發(fā)展的必然結果,如同人類(lèi)發(fā)展也是不以人的意志為轉移的,一定按照高斯分布由人類(lèi)起源到人類(lèi)的高度發(fā)展時(shí)期,最后一定趨于逐漸的終結,由起源到終結是一個(gè)對稱(chēng)的過(guò)程,是由高斯分布所決定的。
構成自律學(xué)習SDL模型的其中一個(gè)核心的算法是“概率尺度自組織”,這是一個(gè)既簡(jiǎn)單又實(shí)用的自律學(xué)習的算法?!案怕食叨茸越M織”的迭代過(guò)程是在高斯分布的任何的初始空間里,逐步朝著(zhù)最大的概率空間遷移,并最終在最大概率空間里收斂的過(guò)程。我們的自動(dòng)駕駛的三維圖像識別就是用了這么簡(jiǎn)單的算法,自動(dòng)駕駛所遇到的任何障礙物,在三維空間里是一個(gè)密度很大的物體,也就是概率分布最大的空間,利用概率尺度自組織的遷移特性,不管障礙物在什么地方,都可以被算法直接抓住,這種圖像識別不需要事先訓練圖像,不需要特征抽出,徹底避免了深度學(xué)習對障礙物與背景不好分離,造成把白色車(chē)廂看成是云而釀成惡性事故的發(fā)生。
隨著(zhù)機器學(xué)習被業(yè)界高度重視,距離問(wèn)題是機器學(xué)習的核心理論。為解決概率空間的數據的直接分類(lèi)問(wèn)題,吸引了無(wú)數數學(xué)家們投入概率空間距離的研究,雖然有KL(Kullback ?Leible)距離等很多的概率空間距離被發(fā)明,但是基于目前的數學(xué)基礎,數學(xué)家們把概率空間抽象化,看成是獨立的無(wú)窮維的空間,不能把歐幾里德空間與概率空間融合,以及還解決不了非線(xiàn)性函數的復雜的求解問(wèn)題,致使目前數學(xué)界提出幾乎所有的概率空間距離都不能在工程上應用。
其實(shí)依據概率空間的嚴格定義,測度為一的空間就是概率空間,也就是一個(gè)高斯分布的數據就是一個(gè)概率空間數據。這就揭示出我們現實(shí)的數據是由歐幾里德空間發(fā)展到了概率空間的。經(jīng)過(guò)長(cháng)時(shí)間的探索,我們發(fā)現了歐幾里德里空間距離與概率空間距離之間僅僅存在一個(gè)與概率空間的概率密度相關(guān)常數,在歐幾里德空間距離里消除概率空間的距離的這個(gè)常數就可以得到一個(gè)精確的可以統一歐幾里德空間與概率空間的距離公式。
自律學(xué)習SDL模型就是用我們發(fā)明的概率空間距離作為概率空間數據之間的尺度,以概率尺度自組織的最大概率尺度為聚類(lèi)的依據,就可以自律的進(jìn)行數據聚類(lèi)。特別是在最大概率空間下的聚類(lèi),也可以說(shuō)是在接近母體的高斯分布下的聚類(lèi)。這是一個(gè)當今最佳的機器學(xué)習模型。即可以把概率空間的數據直接聚類(lèi),又可以得到在概率空間里以小數據學(xué)習得到相當于大數據學(xué)習的效果。
SDL模型還可以直接用于自動(dòng)駕駛的控制,在控制領(lǐng)域近20年一直沒(méi)有突破,本來(lái)為解決隨機性的控制問(wèn)題引入了自適應控制理論,但是,控制是應用于在線(xiàn)系統的,利用統計學(xué)理論,需要在線(xiàn)的抽取大量的統計數據,這是現實(shí)應用中很難做到的,因此自適應控制一直停滯不前。機器學(xué)習為自適應控制提供了非常強大的支持,機器學(xué)習可以在離線(xiàn)上訓練數據,使用訓練后的數據進(jìn)行在線(xiàn)控制,不影響在線(xiàn)控制的速度。因此導入機器學(xué)習實(shí)現最佳的自適應控制是人們期待的算法。
自動(dòng)駕駛的控制問(wèn)題也對現代控制理論提出了挑戰,汽車(chē)是重的載體,在高速運動(dòng)中會(huì )產(chǎn)生很大的動(dòng)能,目前雖然有模型預測控制(Model Predictive Control)MPC模型,以及線(xiàn)性二次型調節器控制(Linear Quadratic Regulator)LQR模型,但是,自動(dòng)駕駛需要根據不同的路況不斷的改變控制狀態(tài),傳統的最佳控制是最不適應多變的自動(dòng)駕駛的控制。把人在駕駛汽車(chē)時(shí)的生物意識的自然反應是駕駛汽車(chē)的最佳的方法,把人的駕駛智慧通過(guò)SDL模型的機器學(xué)習所得到的自動(dòng)駕駛的高階信息,機器通過(guò)調用高階信息控制自動(dòng)駕駛,實(shí)現了讓機器按照人的駕駛智慧進(jìn)行自動(dòng)駕駛,這是目前最理想的自動(dòng)駕駛的控制方法。這種控制方法,不管是冰凍的道路,雪地,以及大水淹沒(méi)的道路都可以讓自動(dòng)駕駛平穩的行駛,實(shí)踐證明導入這樣的自動(dòng)駕駛的控制算法,可獲得最理想的自動(dòng)駕駛的效果。
使用我們發(fā)明的概率尺度自組織以及概率空間距離公式,以概率空間為中心的自律聚類(lèi)這一新的機器學(xué)習的發(fā)明其先進(jìn)性,在美國獲得的發(fā)明專(zhuān)利中被肯定,這也是構成了SDL模型的第二個(gè)技術(shù)特征。
只有符合科學(xué)的理論才可以被實(shí)踐所接受!在人工智能領(lǐng)域存在著(zhù)很多缺乏科學(xué)依據宣傳,人工神經(jīng)網(wǎng)絡(luò )是否是深度學(xué)習可以產(chǎn)生一定應用效果的根源?
帶著(zhù)這個(gè)問(wèn)題我們的團隊勵志要打開(kāi)人工神經(jīng)網(wǎng)絡(luò )的黑箱,我們基于組合理論的基本原則,經(jīng)過(guò)大家的努力奮戰終于在一個(gè)人工神經(jīng)網(wǎng)絡(luò )中找到了全局最佳解,這個(gè)全局最佳解實(shí)際上就是一個(gè)高維線(xiàn)性方程的解。在獲得全局最佳解的過(guò)程中,我們又掌握了各種數據函數映射的特點(diǎn),以及與梯度下降法SGD(Steepest Gradient Descent)的解的關(guān)系。從而人工神經(jīng)網(wǎng)絡(luò )的不被人知的黑箱被打開(kāi)了。通過(guò)打開(kāi)黑箱推動(dòng)了深度學(xué)習的技術(shù)進(jìn)步,我們發(fā)現深度學(xué)習的應用效果主要是卷積核以及反向傳播的作用,而人工神經(jīng)網(wǎng)絡(luò )的作用主要是分類(lèi)。利用SDL模型可以最佳的最高效率的自律聚類(lèi)的特點(diǎn),再加上把SDL模型與卷積核與反向傳播技術(shù)的融合,甩掉人工神經(jīng)網(wǎng)絡(luò ),使小數據小模型的SDL模型的能力超越一般的深度學(xué)習,這就是自律學(xué)習SDL模型的第三個(gè)技術(shù)特征。
自律學(xué)習SDL模型的第四個(gè)技術(shù)特征就是:利用自律學(xué)習的聚類(lèi)結構簡(jiǎn)單以及可分析性的特點(diǎn),可以方便的融合其他技術(shù)。為了解決深度學(xué)習還很難解決的針對不同類(lèi)的數據在低維空間混合在一起不可分問(wèn)題,引用核函數(Kernel Function)理論,把數據映射到高維空間,使不可分離的數據利用高維空間的超平面就可以分離的技術(shù)特征,使SDL模型在分類(lèi)技術(shù)上又產(chǎn)生了飛躍。
SDL模型在幾十年的人工智能的應用中,如今已形成一整套完整的理論體系,和立竿見(jiàn)影的應用效果??梢栽谀壳吧疃葘W(xué)習所做不到的工業(yè)控制,醫療領(lǐng)域,自動(dòng)駕駛,以及嵌入式系統等的所有IT產(chǎn)品,以及所有的應用場(chǎng)景下發(fā)揮獨特的作用。SDL模型確實(shí)可以實(shí)現人們對人工智能的期望,實(shí)現全社會(huì )的人工智能的大普及,可以獲得以往任何技術(shù)所不能產(chǎn)生的經(jīng)濟效果。
當今在人工智能領(lǐng)域的技術(shù)發(fā)展日新月異,經(jīng)過(guò)長(cháng)年的實(shí)踐針對復雜系問(wèn)題用人的智慧賦予機器讓機器做出超越人的工作是新一代人工智能的核心理論,也是在工程上最行之有效的方法,在目前人工智能的基礎理論還沒(méi)有完全建立起來(lái)時(shí),掌握這一核心理論一定會(huì )在實(shí)踐中獲得突破!寄托于年輕一代利用這個(gè)核心理論,在人工智能的發(fā)展過(guò)程之中建功立業(yè)!
評論