AI = 神經(jīng)網(wǎng)絡(luò )?這8個(gè)技術(shù)就不是!
AI熱潮中,有關(guān)神經(jīng)網(wǎng)絡(luò )的聲音最大。然而,AI遠遠不止如此。
本文引用地址:http://dyxdggzs.com/article/201804/378865.htm目前在AI技術(shù)領(lǐng)域中,投入資金最多的當屬對神經(jīng)網(wǎng)絡(luò )的研究了。在眾人眼中,神經(jīng)網(wǎng)絡(luò )技術(shù)貌似就是“程序構造的大腦”(雖然比喻很不準確)。神經(jīng)網(wǎng)絡(luò )的概念早在20世紀40年代就被提出,但直到現在,人們對于神經(jīng)元及大腦的工作方式仍然知之甚少,最近幾年,科研界關(guān)于神經(jīng)網(wǎng)絡(luò )技術(shù)創(chuàng )新的呼聲越來(lái)越強,渴望重啟神經(jīng)網(wǎng)絡(luò )的熱潮……其實(shí),除了神經(jīng)網(wǎng)絡(luò )以外,AI領(lǐng)域中還包含很多更有趣、更新穎,更有前景的技術(shù),文章中就將這些技術(shù)介紹給大家。
1. Knol提取
Knol指信息單元,也就是關(guān)鍵字、詞等,Knol提取技術(shù)則是從文本中提取關(guān)鍵信息的過(guò)程。舉個(gè)簡(jiǎn)單的例子:比如“顧名思義,章魚(yú)有8條腿”這句話(huà)經(jīng)過(guò)提取后,就變成了這個(gè)樣子:“章魚(yú)”:“腿的數目”:我們常用的Google搜索引擎就依賴(lài)于這項技術(shù),后續介紹的技術(shù)中,很多也都包含了這項技術(shù)。
2. 本體構建
本體構建是基于NLP的技術(shù),旨在用軟件來(lái)構建實(shí)體名詞的層次結構,這一技術(shù)對實(shí)現AI會(huì )話(huà)大有幫助。雖然本體構建表面看起來(lái)簡(jiǎn)單,但事實(shí)上構建卻并不容易,主要因為事物之間的實(shí)際聯(lián)系比我們所認為的要復雜的多。例如,利用NLP分析文本來(lái)建立實(shí)體關(guān)系集:例句:“我的拉布拉多犬剛剛生了一群小狗崽,它們的父親是只獅子狗,所以它們是拉布拉多貴賓犬(一種混血犬)”這句話(huà)被轉換后,就變成了:“小狗崽”:“可能是”:“拉布拉多貴賓犬”,“擁有/生(have)”:“父親”},“拉布拉多犬”:“擁有/生(have)”:“小狗崽”。但是,人類(lèi)在進(jìn)行語(yǔ)言表達時(shí),通常不會(huì )將所有的關(guān)系都陳述出來(lái),比如這句話(huà)中,是要通過(guò)推斷才能得出“我的拉布拉多犬為雌性”這一事實(shí),這就是本體構建的難點(diǎn)所在。正如此,本體構建技術(shù)目前只應用在了頂尖的聊天機器人中。
3. 自定義啟發(fā)式
啟發(fā)式是一種用于分類(lèi)的規則,通常類(lèi)似于“如果這件物品是紅色的”或“如果Bob在家里”這樣的條件語(yǔ)句,這些條件語(yǔ)句常伴隨某項動(dòng)作或決定,例如:如果某物“成分”屬性中包含“砷”這一元素:則它的“毒藥”屬性為“True”。對于每個(gè)新的信息,都伴隨著(zhù)新的啟發(fā)式和新的關(guān)系,隨著(zhù)新的啟發(fā)式的建立,又可以對相關(guān)的名詞產(chǎn)生新的理解。比如:?jiǎn)l(fā)式一:"puppies"(小狗)說(shuō)明是幼崽(Babies);啟發(fā)式二:幼崽(Babies)說(shuō)明很年輕;通過(guò)以上兩個(gè)啟發(fā)式推斷出:"puppies"都很年輕。啟發(fā)式的難點(diǎn)在于,多數情況下,規則并不會(huì )如“If/Then”一樣簡(jiǎn)單。類(lèi)似于“有些人頭發(fā)是金色的”這樣的語(yǔ)句,就很難用啟發(fā)式來(lái)表述。所以我們有了“認知論”(見(jiàn)下)。
4. 認識:認識論是本體構建和自定義啟發(fā)式的結合,并在其中加入了概率特性,通過(guò)概率表示名詞與任一屬性產(chǎn)生關(guān)聯(lián)的可能。比如,用這樣本體結構:'人':'性別':'男':0.49,'女':0.51,'種族':'亞裔':0.6,'非洲裔':0.14來(lái)表示對一個(gè)人性別和種族的判斷。同時(shí),概率能幫助識別一些具有多重含義的“混合型”詞組,比如像“梅子像是打了激素的葡萄干”這句話(huà)中,因為“打了激素”這一詞組很大可能地意味著(zhù)“體積較大”,從而得出,這句話(huà)很大可能的意思是“梅子體積比葡萄干大”。
認識論的實(shí)現相比本體構建要困難得多。首先,它需要更多的數據;并且,由于其結構的復雜性,很難在確定規則后快速地建立起數據庫來(lái)實(shí)現查找;還有,規則的確定通?;谀稠検挛镌谝欢挝淖种斜惶峒暗念l率,但文字卻未必能真實(shí)地反映現實(shí)情況。
認識論與Asimov提出的“張量流”理論很相似。Google開(kāi)發(fā)的同名TensorFlow系統并不是真正基于張量,而認識論是基于張量的。
5. 自動(dòng)量規技術(shù)
一個(gè)量規系統,必定包含相應的評估標準。想象一下,在選購房子時(shí),有房屋面積,位置,價(jià)格和風(fēng)格等因素需要考量,而這些因素未必都是積極的,這就需要有通過(guò)衡量取舍來(lái)決策。比如,相比價(jià)格你更在乎房屋面積,就會(huì )寧愿多花幾倍的錢(qián)來(lái)購買(mǎi)大房子。自評估技術(shù)通過(guò)你對不同因素的重視程度來(lái)確定每項因素的權重,從而提出決策建議。通過(guò)這一過(guò)程,還可以預測庫存變化,推薦產(chǎn)品,實(shí)現自動(dòng)駕駛等。也就是說(shuō),大多數神經(jīng)網(wǎng)絡(luò )可以實(shí)現的功能,自動(dòng)量規技術(shù)都能勝任,盡管需要更長(cháng)的訓練時(shí)間,但卻有著(zhù)快幾個(gè)數量級的決策速度。
6. 矢量差分
矢量差分技術(shù)常用于圖像分析,也可用于時(shí)變數據的處理。通過(guò)對目標構建抽象矢量圖,將候選對象與待識別目標對象進(jìn)行比較,從而判斷出是否為“最佳的約會(huì )臉型”或“最佳的買(mǎi)入時(shí)機”等。
通常,目標對象之間差異都伴隨一個(gè)衡量差異程度的量化規則,通過(guò)特征的矢量化,將一些“模糊”的概念,簡(jiǎn)單、清晰的表示出來(lái)。比如,對于人類(lèi)來(lái)講,我們籠統地認為對稱(chēng)的臉型更具有吸引力,但是對于計算機,就需要精確的計算來(lái)判斷,而這時(shí),通過(guò)30個(gè)三角形來(lái)進(jìn)行臉部抽象,比通過(guò)完整臉部圖像來(lái)進(jìn)行運算對比,能節省很多的計算時(shí)間和存儲空間。對于非圖像的數據的處理也是可以的。比如股票價(jià)格變動(dòng)、每股收益與保證金的比率等,通過(guò)對這些數據矢量化,將其與理想值進(jìn)行比較,就可以確定一次投資的利好或風(fēng)險程度。
7. 矩陣卷積
卷積矩陣常用于圖像處理領(lǐng)域中的邊緣檢測和提高對比度等方面,例如,PhotoShop中的許多濾鏡都是基于卷積矩陣或疊加卷積(按特定順序進(jìn)行多個(gè)卷積運算)實(shí)現的。同時(shí),卷積矩陣還可用于處理非圖像數據。比如,當使用卷積矩陣對時(shí)序向量進(jìn)行處理時(shí),可以像邊緣檢測那樣,快速地找出模式來(lái),再在最小或最大值處查找特定值或范圍,從而做出判斷。
8. 多視角決策系統
一項決定的做出并不簡(jiǎn)單。多視角決策系統以一種更民主的形式,多方面地作出決定。
比如,在剛剛房子的例子中,你對于某套房子的看好可能基于并不全面的因素,而之后的一個(gè)“這套房子建在懸崖上”的事實(shí)(當然,這種壓倒性因素可能來(lái)自于Knol提取)就會(huì )消除你先前的所有好感,讓你重新決策。
所以,決策需要通過(guò)更全面的因素考量,而多視角決策系統,可以利用兩個(gè)人的兩套標準(比如你和你的配偶)來(lái)衡量決策。多視角決策系統還可應用于自動(dòng)駕駛領(lǐng)域,比如,收集10000個(gè)車(chē)主的看法來(lái)制定新標準等。
寫(xiě)在最后——要相信技多不壓身
許多人眼中只有一把工具,掉進(jìn)“我有的就是一把錘子,所以一切都是釘子”的深坑。諸如Recognant這樣的公司,在應用神經(jīng)網(wǎng)絡(luò )的同時(shí),也同樣在應用文章中這些相對冷門(mén)的技術(shù),畢竟相比于神經(jīng)網(wǎng)絡(luò )硬件系統,
這些軟件技術(shù)的優(yōu)勢就在于,能針對不同情況進(jìn)行隨時(shí)的調整和開(kāi)發(fā),而無(wú)需花費額外的成本。所以,技術(shù)面窄,就有可能被一些情況所困住,而技術(shù)面越寬,面對問(wèn)題就越容易迎刃而解。
評論