<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 設計應用 > 如何善用通用性行業(yè)KG(知識圖)

如何善用通用性行業(yè)KG(知識圖)

作者:高煥堂 時(shí)間:2025-01-29 來(lái)源:EEPW 收藏

1   認識

本文引用地址:http://dyxdggzs.com/article/202501/466648.htm

1.1 食物FlavorGraph為例

在上一期里,藉由< 用戶(hù)、食材和食譜> 三位一體的多層次關(guān)聯(lián)來(lái)建立(KG:Knowledge Graph)。并且基于上述KG體通過(guò)三個(gè)階段來(lái)生成反事實(shí)食材組合的圖譜,這結合了多階段的GCN模型和反事實(shí)分析來(lái)進(jìn)行推薦和創(chuàng )新。其中,幕后有一個(gè)基礎組件:FlavorGraph。它即是俗稱(chēng)的:行業(yè)KG(industry knowledge graph),是由Sony AI團隊與韓國高麗大學(xué)合作建立的食材配對通用性KG。它的數據量包含1,561 項風(fēng)味化合物(flavor molecules)和百萬(wàn)筆食譜,形成食物和化合物組成的巨大知識網(wǎng)絡(luò ),表達食材跟食材或食材與化合物之間的關(guān)系,可用來(lái)推薦互補的配料,幫助廚師們創(chuàng )新烹飪菜肴。

1.2 以醫藥DRKG為例

DRKG(Drug Repurposing Knowledge Gaph)是由亞馬遜上海AI實(shí)驗室聯(lián)合來(lái)自亞馬遜AI北美、明尼蘇達大學(xué)、俄亥俄州立大學(xué)、湖南大學(xué)的研究者,共同構建的大規模藥物再利用,其包括屬于13種實(shí)體類(lèi)型(entity-types)的97, 238個(gè)實(shí)體(entities);以及屬于107種邊緣類(lèi)型(edge-types)的5,874,261 項連結(links)。如圖-1所示。

1738138064780647.png

圖1 通用性DRKG(引自https://github.com/gnn4dr/DRKG)

這DGRK非常有助于新藥開(kāi)發(fā),它可以有效縮短藥物研發(fā)周期、降低成本和風(fēng)險。從上述的醫療行業(yè)的DRKG,以及飲食行業(yè)的FlavorGraph 等,我們來(lái)觀(guān)察它們對于各行業(yè)的AI應用,提供了很大的幫助。

2   行業(yè)KG+AI模型

KG和AI模型結合起來(lái),更能夠掌握數據之間的關(guān)系和準確涵意,提升了推論的準確性,也更發(fā)揮AI器學(xué)習方法的能力。愈來(lái)愈多企業(yè)開(kāi)始使用AI來(lái)幫助決策,KG+AI將智能融入數據本身,來(lái)為AI提供了更可解釋、更準確的背景。進(jìn)而協(xié)助企業(yè)人士降低決策風(fēng)險,提升企業(yè)效益。例如,在醫藥行業(yè),能解釋某藥物為何對特定疾病有效。而在飲食行業(yè)FlavorGraph提供的通用化學(xué)風(fēng)味知識,并由AI模型(如GCN模型)進(jìn)一步挖掘潛在菜單組合的關(guān)系,激發(fā)食譜創(chuàng )新。其中,KG與GCN模型的結合過(guò)程,如下。

2.1 數據收集與篩選

收集企業(yè)內部數據(如食材采購列表、銷(xiāo)售記錄),并且清洗數據,去除冗余或不相關(guān)的數據。利用行業(yè)KG結構化數據提升GCN模型輸入數據的質(zhì)量。

2.2 立KG

設計節點(diǎn)(node)與邊(edge)的類(lèi)型,例如「食材」、「料理」、「風(fēng)味」等。并且定義節點(diǎn)特征(feature)和關(guān)系(relationship),例如「包含」、「兼容」、「替代」等。

2.3 練GCN模型

訓練GCN來(lái)實(shí)現模型的目標,包括使用模型來(lái)提取知識。例如風(fēng)味搭配建議、新菜單推薦等。

上述的KG 與GCN 模型是互補的,KG 中的數據是高度結構化的圖形數據,包含節點(diǎn)和關(guān)系。而GCN能夠處理圖結構數據,通過(guò)聚合鄰居節點(diǎn)的信息來(lái)學(xué)習每個(gè)節點(diǎn)的表示。于是,GCN自然適配KG的結構,捕捉節點(diǎn)間復雜的語(yǔ)義關(guān)系。這KG是行業(yè)數據的「智能連接器」,能有效提升企業(yè)AI解決方案的效率與準確性。例如,FlavorGraph與DRKG已經(jīng)展現燦爛光芒,應用于許多商業(yè)場(chǎng)景,讓企業(yè)采用行業(yè)KG,結合自身數據打用造更有競爭力的AI 應用。

3   基于,建構下游企業(yè)KG

(如FlavorGraph)蘊含豐富的行業(yè)共享性知識,而企業(yè)則針對小領(lǐng)域的特殊需求(如拉面的烹飪過(guò)程、食材搭配、口味調配等),建立專(zhuān)用的企業(yè)KG( 如FoodKG) 更具針對性。如圖2所示。

1738138247983186.png

圖2 行業(yè)KG支持下游任務(wù)

從行業(yè)KG(如FlavorGraph)中提取相關(guān)節點(diǎn)與邊,補充企業(yè)內部數據(如食材采購列表、銷(xiāo)售記錄)。清洗數據,去除冗余或不相關(guān)的數據。有了行業(yè)KG提供跨域知識的支持,能有效應用于拉面食材推薦、菜單設計和個(gè)性化服務(wù)等多種場(chǎng)景。這種模式是一種知識驅動(dòng)的AI遷移學(xué)習,能加速AI針對企業(yè)目標的應用。

現在,就來(lái)觀(guān)摩這個(gè)「知識驅動(dòng)AI遷移學(xué)習」的第一項事情:將行業(yè)FlavorGraph 的節點(diǎn)嵌入(node embedding)作為企業(yè)FoodKG + GCN的初始特征(initial features)。將已有的行業(yè)知識(如FlavorGraph中的節點(diǎn)嵌入)轉化為模型可用的初始特征,等同于利用外部的知識來(lái)增強本地圖譜的表現。無(wú)論是餐飲、醫療、金融、制造還是零售行業(yè),都能從跨域知識的遷移中受益。初始特征來(lái)自于成熟的知識圖譜,代表了節點(diǎn)間的隱含語(yǔ)義與結構關(guān)系。這種初始化能顯著(zhù)提升模型在各行業(yè)的學(xué)習能力和性能。預先訓練的嵌入能輕松應用于新節點(diǎn)或關(guān)系的擴展,而無(wú)需重新從零訓練。不同行業(yè)的圖譜和嵌入可共享或遷移,促進(jìn)跨領(lǐng)域應用。例如,將醫療行業(yè)的知識嵌入應用于健康食品推薦(如從DRKG遷移到FlavorGraph)。還有,將財務(wù)數據圖譜嵌入用于供應鏈風(fēng)險管理等許多商業(yè)情境。

其中,節點(diǎn)嵌入(node embeddings)是將知識圖譜中的節點(diǎn)轉換為數值向量,亦即壓縮節點(diǎn)的高維屬性與關(guān)系信息到低維空間中,保留圖結構的核心語(yǔ)義。然后,于節點(diǎn)嵌入的向量空間,衡量節點(diǎn)之間的相似性。使用行業(yè)大KG的節點(diǎn)嵌入作為下游企業(yè)小KG+GCN 模型輸入,非常有助于提升推薦、分類(lèi)、或預測任務(wù)的準確度?;贙G 的知識來(lái)生成節點(diǎn)嵌入的常見(jiàn)技術(shù)包刮:DeepWalk、Node2 Vec、GraphSAGE、或GCN 等。

4   實(shí)際案例演示:實(shí)踐下游任務(wù)

剛才提到了,每個(gè)食材和化學(xué)成分都是FlavorGraph圖中的節點(diǎn)(node),這些節點(diǎn)之間的邊(edge)代表食材和化學(xué)成分之間的關(guān)聯(lián)。例如,某些食材共享相似的化學(xué)成分或風(fēng)味特性。然后,FlavorGraph + AI的框架中,其關(guān)鍵任務(wù)之一就是:生成食材及其化學(xué)成分的節點(diǎn)嵌入。

由于SONY AI團隊已經(jīng)使用FlavorGraph + DeepWalk方法來(lái)生成其節點(diǎn)嵌入了。所以在企業(yè)KG 的下游任務(wù)建構中,就能直接讀取它,來(lái)做為下游FoodKG + GCN的起始輸入節點(diǎn)特征。

4.1 從FlavorGraph讀取節點(diǎn)嵌入

現在,就來(lái)寫(xiě)一個(gè)小Python 程序讀取之。

image.png

image.png

此程序運行時(shí),就會(huì )從FlavorGraph取出食材( 如蛋)的節點(diǎn)嵌入,輸出如下:

1738138437900945.png

由于FlavorGraph是行業(yè)大型KG,其包容眾多食材,其節點(diǎn)嵌入向量采取較高的300維度。例如,這程序讀取的食材<蛋> 的嵌入向量含有300個(gè)數值。

4.2 建立企業(yè)KG

基于FlavorGraph生成的節點(diǎn)嵌入,就能建立下游任務(wù)的高質(zhì)量企業(yè)KG。通常企業(yè)KG的節點(diǎn)和邊的數量,都比上游通用性KG少很多,但是為了接受從上游遷移而來(lái)的節點(diǎn)嵌入,所以企業(yè)KG的節點(diǎn)特征( 向量) 也必須設定成:300維?,F在,就動(dòng)手撰寫(xiě)一個(gè)小Python程序,來(lái)建立一個(gè)小型FoodKG。它只有200個(gè)節點(diǎn),以及171個(gè)邊。如下代碼:

image.png

image.png

此程序運行時(shí),就會(huì )從nodes_tiny_200.csv和edges_tiny_200.csv兩個(gè)檔案里, 讀取200個(gè)節點(diǎn)和171個(gè)邊的數據,建立一個(gè)下游的FoodKG。接著(zhù),從上游FlavorGraph讀取節點(diǎn)嵌入,做為FoodKG的起始節點(diǎn)特征。并且輸出如下:

1738138558314117.png

于是,準備好了FoodKG。

4.3 企業(yè)KG來(lái)訓練GCN

接下來(lái),就是引進(jìn)GCN模型來(lái)學(xué)習FoodKG的數據。這是一般典型的GCN 訓練,于此省略其訓練代碼。

image.png

此程序運行時(shí),就展開(kāi)訓練200 回合,并輸出:

1738138626525659.png

這是典型的GCN訓練流程。從loss 值的持續下降,這GCN的學(xué)習效果是良好的。至此,完成了一項關(guān)鍵任務(wù):利用行業(yè)KG提供的預訓練嵌入,將KG節點(diǎn)轉化為可用于GCN模型的數值特征,并且展開(kāi)訓練。

5   結束語(yǔ)

通用性行業(yè)KG可以支持建構各種企業(yè)KG,并結合GCN等模型,來(lái)支持眾多企業(yè)AI的下游任務(wù)。例如,也能支持建立發(fā)酵食材的IngGraph,來(lái)實(shí)踐另一項下游客制化任務(wù)。發(fā)酵過(guò)程中的食材(例如:酸奶、醬油、啤酒、泡菜等)往往會(huì )經(jīng)歷復雜的化學(xué)反應和微生物活動(dòng)。在FlavorGraph風(fēng)味關(guān)聯(lián)圖中,這些食材都是圖中的節點(diǎn),而發(fā)酵過(guò)程中的風(fēng)味轉變、化學(xué)物質(zhì)(如有機酸、酯類(lèi)、醇類(lèi)等)的變化則成為邊來(lái)連接這些節點(diǎn)。GCN模型不僅學(xué)習食材間的靜態(tài)關(guān)聯(lián),還能捕捉發(fā)酵過(guò)程中風(fēng)味的變化。而下游IngGraph這樣的系統可以幫助用戶(hù)實(shí)現更精確的食材搭配與風(fēng)味設計,尤其是針對那些風(fēng)味組合復雜、需要高度自定義的發(fā)酵食材領(lǐng)域。

(本文來(lái)源于《EEPW》



評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>