<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 學(xué)貫中西:讓機器學(xué)習華夏智慧

學(xué)貫中西:讓機器學(xué)習華夏智慧

作者:高煥堂(銘傳大學(xué),長(cháng)庚大學(xué) 教授,臺北) 時(shí)間:2021-11-16 來(lái)源:電子產(chǎn)品世界 收藏


本文引用地址:http://dyxdggzs.com/article/202111/429680.htm

0   前言

(ML)除了能夠學(xué)習大數據(big data)中的規律和法則之外,也能夠學(xué)習人類(lèi)的智慧。華夏文化淵源長(cháng)久、博大精深,處處充滿(mǎn)智慧。因此,我們可以讓機器來(lái)學(xué)習華夏的文化底蘊和智能,還能更上層樓而學(xué)貫中西。

1   復習:什么是特征(feature)?

之路,首先從觀(guān)察特征出發(fā)?;貞浺幌?,人們對于周?chē)膯?wèn)題或事件常從不同的角度來(lái)觀(guān)察或看出不同的特征。所謂特征(feature),就是一件事物或一群事物,其具有與眾不同的特色或表征。例如,人們在辨別其他人的長(cháng)相時(shí),常常會(huì )觀(guān)察對方的臉形、眼神、嘴巴、發(fā)型等特征來(lái)區分和判斷,只要記住對方獨特的長(cháng)相特征就可以,而不必記憶其他細節。這是人們天賦的觀(guān)察和提取特征的能力。再如,當您一大早從家里出門(mén)時(shí),常常會(huì )先觀(guān)察天氣的特征:溫度23℃、“陽(yáng)光普照”等。在前面各期曾經(jīng)說(shuō)明了ML()的目的并不一定是拿數據來(lái)運算,而是在于〈觀(guān)察〉在此X 空間里數據的大小、分布及重復出現頻率(次數)等。每一條數據成為空間里的一個(gè)點(diǎn)(point),而每一項特征則成為空間的一個(gè)維度(dimension)。于是,各條數據的特征值成為該點(diǎn)的坐標值。

2   特征的種類(lèi)

在ML(機器學(xué)習)領(lǐng)域,特征常分為兩種:數值型(Numerical)特征與分類(lèi)型(Categorical)特征?!皵抵敌吞卣鳌笔谴蠹液苁煜さ?,可以用整數或浮點(diǎn)數表示,是能拿來(lái)進(jìn)行加減乘除等數學(xué)計算的特征(值)。例如剛才提到的氣溫是23℃。這就是一個(gè)數值特征。再如,人的身高、貓尾巴長(cháng)度等也都是數值特征。至于分類(lèi)型特征,又可細分為兩種:次序型(ordinal)特征和名目型(nominal)特征。

1637031492748429.png

圖1 特征

其中,“次序型特征”是具有順序、可分等級的特征。例如,衣服的大小常常分為:?。⊿)、中(M)、大(L)、特大(XL)4 個(gè)等級。再如,牛排的熟度可分為:Blue、Rare、Medium Rare、Medium、Medium Well 和Well Done 6 個(gè)級別。

再如,《孫子兵法》有言:“不戰而屈人之兵,善之善者也。故上兵伐謀,其次伐交,其次伐兵,其下攻城?!逼渲蟹譃? 個(gè)等級:伐謀、伐交、伐兵和攻城?!秾O子兵法》又言:“知彼知己,百戰不殆。不知彼而知己,一勝一負。不知彼不知己,每戰必殆?!逼渲蟹譃槿齻€(gè)等級:知彼知己、不知彼而知己和不知彼不知己。

“名目型(nominal)特征”只是對事物分門(mén)別類(lèi)之后各類(lèi)別的名稱(chēng)或標簽而已。例如,性別:男、女。兩儀:陰、陽(yáng)。五行:金、木、水、火、土。它們之間沒(méi)有級別之分。

3   如何對“分類(lèi)型特征”進(jìn)行編碼

在ML 領(lǐng)域,必須將分類(lèi)型特征轉換成數字,又稱(chēng)為對這些特征進(jìn)行編碼(encoding)。對于次序型與名目型特征,各有不同的方法將它們轉換成數字。例如,對于次序型(ordinal)特征常使用卷標編碼(label-encoding)方式進(jìn)行轉換。例如,衣服的?。⊿)、中(M)、大(L)、特大(XL)4 個(gè)等級對應1、2、3、4,這樣特征(值)之間的大小順序也就呈現出。再如,牛排熟度的Blue、Rare、Medium Rare、Medium、Medium Well 和Well Done 6 個(gè)等級對應1、2、3、4、5、6,這樣就可以了。

另外,對于名目型(nominal)特征則常使用唯1 編碼(one-hot-encoding)方式進(jìn)行轉換,在中文里又稱(chēng)為“獨熱編碼”。例如上述的兩儀。

1637035768995834.png

圖2 兩儀

由于它們之間不具有順序性,所以也可把“陽(yáng)”對應成[01],而“陰”對應成[10]。

再如,上述的五行,有如下的對應關(guān)系:

金 ---- > [10000] 木 ---- > [01000]

水 ---- > [00100] 火 ---- > [00010]

土 ---- > [00001]

由于每一個(gè)編碼中都含有一個(gè)1,其他都為0,所以稱(chēng)為One-Hot-Encoding 編碼;簡(jiǎn)稱(chēng)OHE 編碼。

4   “分類(lèi)型特征”的范例

剛才已經(jīng)提到了華夏文化中的五行觀(guān)念,就是金、木、水、火、土。使用OHE 編碼如下:

1637035836705712.png

圖3 五行

大家知道,五行之間有“相生”關(guān)系,也有“相克”關(guān)系。

1637035877547457.png

圖4 相生相克關(guān)系

現在,來(lái)建立一個(gè)兩層神經(jīng)網(wǎng)絡(luò )(NN)模型,如圖5 所示。

1637035928569340.png

圖5 神經(jīng)網(wǎng)絡(luò )模型

以NN 模型表示如圖6 所示。

1637035975946787.png

圖6 NN模型

在Z 空間中設定了5 個(gè)目標值,如圖7 所示。

1637036017697043.png

圖7 目標值

只要按下“學(xué)習”按鈕,ML 就會(huì )尋找出隱藏層的權重WH 和BH,同時(shí)尋找出輸出層的權重W 和B。如圖8所示。

1637036297415394.png

圖8 輸出層權重W和B

有了隱藏層的權重WH 和BH,以及輸出層的權重W 和B 之后,就可以隨時(shí)輸入層X(jué) 空間,對應隱藏層H 空間,再對應輸出層的Z 空間,就得到預測值了。例如,把剛才訓練好的權重拿過(guò)來(lái),就可以隨時(shí)輸入X 值,然后通過(guò)兩層權重的計算得到Z 預測值。這個(gè)過(guò)程,就是所謂的:預測(Predict)。如圖9所示。

1637036350333249.png

圖9 預測

請按下“相生”,輸入木和水的OHE 編碼,然后通過(guò)兩層權重的計算得到Z 預測值。如圖10所示。

1637036405865547.png

圖10 “相生”預測值

例如,輸入測試數據:木=[0,1,0,0,0],通過(guò)NN 模型的兩層權重計算得到預測值。此時(shí),ML 計算出預測值:Z=[0.02、0、0、0.95、0.03]。那么,ML 如何得知這個(gè)預測值就是“火”呢?非常簡(jiǎn)單,只要看看Z 空間中這個(gè)預測值代表的點(diǎn)靠近哪一個(gè)目標值(點(diǎn))就知道了。例如,預測值Z=[0.02、0、0、0.95、0.03],非??拷黐0、0、0、1、0],所以歸于“火”類(lèi)。如圖11所示。

1637036440609052.png

圖11 “火”預測值

同樣,另一測試資料:水=[0、0、1、0、0],通過(guò)NN 模型的兩層權重計算得到預測值:Z=[0、0.97、0、0、0.03]。那么,ML 如何得知這個(gè)預測值就是“木”呢?非常簡(jiǎn)單,只要看看Z 空間中這個(gè)預測值代表的點(diǎn)靠近哪一個(gè)目標值(點(diǎn))就知道了。例如,這預測值Z=[0、0.97、0、0、0.03],非??拷黐0、1、0、0、0],所以歸于“木”類(lèi)。

5   結語(yǔ)

善于使用OHE 編碼將非常方便表達華夏文化中的概念(Concept)和術(shù)語(yǔ)。然而,您可能會(huì )問(wèn):如果數千或數萬(wàn)個(gè)術(shù)語(yǔ),其OHE 編碼將變得很冗長(cháng),實(shí)際上可行嗎?答案是沒(méi)問(wèn)題的。因為ML 有很好的機制可以進(jìn)行“降維”,能有效化解上述問(wèn)題。下一期,將會(huì )繼續說(shuō)明。

(本文來(lái)源于《電子產(chǎn)品世界》雜志2021年11月期)



關(guān)鍵詞: 202111 機器學(xué)習

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>