顧澤蒼博士:苦行AI三十年結碩果
美國OpenAI公司推出ChatGPT轟動(dòng)社會(huì ),但AI專(zhuān)家們都知道ChatDPT投入100億美金,但完全靠人的手工勞動(dòng),不是靠算法。
本文引用地址:http://dyxdggzs.com/article/202303/444943.htm近日,顧澤蒼博士提出的導入他們獨創(chuàng )的智能AI模型,可以超越ChatGPT所使用的強化學(xué)習模型效果的、離線(xiàn)的特定場(chǎng)景的智能AI的ChatBot系統方案,已被美國人工智能的著(zhù)名的Cole實(shí)驗室通過(guò),認為顧博士的該方案的算法確實(shí)是超越ChatGPT,性能沒(méi)法比,要一起共同研制出ChatBot。
Cole實(shí)驗室的這一高度評價(jià)是對顧澤蒼博士依據他自己從事三十多年人工智能積累的豐富經(jīng)驗基礎上發(fā)明出的高性能的自律學(xué)習SDL模型和領(lǐng)先世界水平的創(chuàng )新的智能AI模型的肯定,也為中國人工智能模型爭了光。對于顧澤蒼博士取得的這一成果,國內一些領(lǐng)導、專(zhuān)家們可能還會(huì )保持他們多年對顧博士堅持不懈地在人工智能模型上的發(fā)明和創(chuàng )新的成果冷漠,可能還是不信。
為做小結,顧博士寫(xiě)出“縱觀(guān)本次人工智能高潮的技術(shù)進(jìn)步與發(fā)展”一文。并做出如下感言:這篇短短的文章卻濃縮了三十多年苦心研究的結果,在我們很多年輕人還在迷戀有彎道超車(chē)的捷徑可走!并沒(méi)想到真正的追求需要在深山里修行,面對風(fēng)風(fēng)光光的世外桃源,不被誘惑一心修煉才可以來(lái)處不易獲得和璧隋珠!
【縱觀(guān)本次人工智能高潮的技術(shù)進(jìn)步與發(fā)展】
天津市阿波羅信息技術(shù)有限公司顧澤蒼
人類(lèi)史無(wú)前例的如此牽動(dòng)整個(gè)社會(huì ),而且又如此投入了巨大財富的第三次人工智能高潮即將落下帷幕,在此,如何評價(jià)本次
高潮對社會(huì )乃至對科學(xué)進(jìn)步所起的作用?這是一個(gè)令人關(guān)注的議題。
本次人工智能的主流算法深度學(xué)習盡管從一開(kāi)始被業(yè)界頂禮膜拜,后來(lái)又遭到很多的非議!但是,應該肯定原始的神經(jīng)網(wǎng)絡(luò )的算法幾經(jīng)被否定,發(fā)展到今天的深度學(xué)習確立了不可替代的應用效果,應該載入人工智能的史冊。
深度學(xué)習算法是建立在歐幾里德空間中的數據訓練的,為實(shí)現統計學(xué)的效果,一定要依賴(lài)于大數據的訓練,這是深度學(xué)習算法的短板,但是這也有它的優(yōu)點(diǎn)。歐幾里德空間的數據是一個(gè)一個(gè)獨立的,通過(guò)卷積神經(jīng)網(wǎng)路可以任意的映射到不同的輸出位置,通過(guò)反復的誤差修正的訓練,可以把例如屬于狗的數據放在一個(gè)類(lèi),把屬于貓的數據放在令一類(lèi),因此可以實(shí)現最佳的分類(lèi)結果。
在識別狗的圖像時(shí),按照統計學(xué)的“隨大流兒”的原理,狗的數據仍然會(huì )被映射到狗的數據類(lèi)中,而不會(huì )映射到貓的數據類(lèi)中,這樣機器就很容易識別出這個(gè)圖像是狗。這就告訴我們深度學(xué)習模型可以讓不同類(lèi)別的數據任意擴大他們之間的間隔,以防止誤識別。這就是為什么深度學(xué)習會(huì )比傳統的機器學(xué)習算法應用效果好的根本原因,并不是什么其他理論所起到的作用。
但是,在日常的家電,工業(yè)控制等領(lǐng)域中,更需要導入人工智能技術(shù),這就是深度學(xué)習的大數據大模型的短板,產(chǎn)品的價(jià)格限制了這種模型的導入。
一種小數據小硬件的自律學(xué)習(Self-Discipline Learning,SDL)模型應運而生,SDL模型既然是小數據小模型會(huì )讓人擔心性能是否能滿(mǎn)足應用的需要?通過(guò)我們在自動(dòng)駕駛的光學(xué)感知上的開(kāi)發(fā)深有體會(huì ),應用效果的好與壞不一定依賴(lài)于數據的大小,硬件模型的規模。
那么如何保證小數據小模型的應用效果的突出體現?從SDL模型的三大優(yōu)勢就可以找到答案。
SDL模型具有三個(gè)優(yōu)勢:
第一個(gè)優(yōu)勢是:可實(shí)現訓練數據聚集在概率空間,小數據的訓練可以產(chǎn)生大數據的效果。
我們發(fā)明的概率尺度自組織的算法可以讓高斯分布的觀(guān)察值的最優(yōu)解,成為接近統計學(xué)所稱(chēng)的“母體”的最大概率的解。由此產(chǎn)生的最大概率值,最大概率尺度,以及最大概率空間,這是全新的最佳化理論,最適合于解決人工智能中的隨機性的問(wèn)題。
我們日常所遇到的數據是從確定性的歐幾里德空間,發(fā)展到了不確定的概率空間,解決這兩個(gè)空間的距離問(wèn)題勢在必行。在數學(xué)界還在為不能統一歐幾里得空間與概率空間的距離問(wèn)題而煩惱時(shí),我們已做到可以在工程應用上,可以通過(guò)公式直接計算這個(gè)不同空間之間的距離,被用到SDL模型中計算歐幾里得空間的數據與訓練后的最大概率空間中的數據之間的尺度,成為可跨越不同空間之間的數據自律聚類(lèi)算法。通過(guò)SDL模型所進(jìn)行的小數據的訓練,所形成的最大概率空間卻可以包容大數據的效果。因此,SDL模型也是一個(gè)高效率的機器學(xué)習模型。
第二個(gè)優(yōu)勢是:通過(guò)Kernel函數實(shí)現最大概率空間的高維平面聚類(lèi)。高維空間的數據是極其復雜的,往往在低維空間是完全重合在一起的,SDL模型結合Kernel函數可以獲得高維平面的分類(lèi)效果。這是小數據小硬件的SDL模型,通過(guò)算法可以獲得僅僅是低維空間分類(lèi)的大模型的應用效果的重要成果。
第三個(gè)優(yōu)勢是:SDL模型融合深度學(xué)習的精華可以獲得超越深度學(xué)習的應用效果。
通過(guò)我們團隊日以繼夜的奮戰,打開(kāi)了深度學(xué)習的黑箱,找到了真正讓深度學(xué)習產(chǎn)生應用效果的根源,我們結合深度學(xué)習在特征抽出,卷積神經(jīng)網(wǎng)絡(luò )的訓練是深度學(xué)習對應用效果起到重要作用的部分,同我們的SDL模型嫁接,既可以體現SDL模型的小數據訓練以及高斯分布模型的效果,同時(shí)也可體現深度學(xué)習的函數映射模型的特點(diǎn)。
經(jīng)過(guò)多年的努力,我們從底層到應用完成了一個(gè)適合于嵌入式系統的機器學(xué)習模型的全新的提案,對于在家電,工業(yè)控制等領(lǐng)域必將會(huì )得到廣泛的應用。
在我們搞自動(dòng)駕駛的過(guò)程中,針對自動(dòng)駕駛在復雜的道路上行駛,要想獲得L4級別以上的自動(dòng)駕駛效果,至少是40個(gè)要素以上的組合,這就是自動(dòng)駕駛領(lǐng)域中的圖靈機不可解的NP問(wèn)題。由于我們在很早的時(shí)候為解決大規模集成電路的最小面積的模塊組合,最短接線(xiàn)長(cháng)的組合問(wèn)題上就提出過(guò)一個(gè)可以繞開(kāi)集成電路領(lǐng)域的NP問(wèn)題,可獲得了集成電路的最佳化組合的算法。在這個(gè)成果的基礎上經(jīng)過(guò)努力研究,我們提出了一個(gè)可以讓L4級別的自動(dòng)駕駛真正落地的算法,今后的自動(dòng)駕駛在也不需要GPS,不需要高清地圖,不需要對路況事先訓練,可以如同人那樣自如的在各種不特定的道路上行駛,這就是特斯拉的創(chuàng )始人馬斯克所希望的智能AI的自動(dòng)駕駛。
目前,我們也在同美國的人工智能的著(zhù)名的Cole實(shí)驗室共同研究,導入智能AI模型,做出可以超越ChatGPT所使用的強化學(xué)習模型的效果,搞出離線(xiàn)的特定場(chǎng)景的智能AI的ChatBot系統。
我們在人工智能算法的大道上疾駛,已經(jīng)窺見(jiàn)到人工智能未來(lái)的憧憬,倍感任重而道遠。
評論