邁向決策式AI:提供反事實(shí)的建議
1 認識反事實(shí)思考
計算機科學(xué)界諾貝爾獎「圖靈獎」得主Judea Pearl(珀爾) 在他的開(kāi)創(chuàng )性著(zhù)作《The Book of Why》一書(shū)里,提到了「因果關(guān)系階梯」(Ladder of Causality)的概念。他指出了這個(gè)階梯上的三個(gè)梯級——聯(lián)想(Association)、干預(Intervention) 和反事實(shí)(Counterfactuals)。其中,最頂級的是反事實(shí)梯級,位于這梯級的思考者可以想象(Imaging) 不存在的世界并推斷觀(guān)察到的現象,并試圖去了解事件的起因來(lái)深刻理解問(wèn)題緣由。因而他們能夠考慮在第1 層或第2 層級所無(wú)法想象到的一些場(chǎng)景( 圖-1)。
圖-1 因果關(guān)系階梯
近年來(lái),許多專(zhuān)家用心研究反事實(shí)推理對人們決策(Decision-making)的影響,其提倡決策者應該根據反事實(shí)來(lái)評估可能采取的替代性方案或行動(dòng)。其中的反事實(shí)推理意味著(zhù)思考過(guò)去或未來(lái)事件的替代可能性。當一個(gè)人修改先前的事實(shí)事件,然后評估該變化的后果時(shí),就會(huì )出現反事實(shí)思考了。例如,人們常常會(huì )透過(guò)想象某些因素可能會(huì )有所不同來(lái)反思車(chē)禍的結果,便能為已經(jīng)發(fā)生的生活事件創(chuàng )造可能的替代方案,于是出現反事實(shí)思考:「如果我沒(méi)有分心聽(tīng)歌,而無(wú)意中超速,就不會(huì )發(fā)生車(chē)禍?!?/p>
2 讓AI來(lái)參與反事實(shí)推理
反事實(shí)思考使人們能夠探索最初可能沒(méi)有考慮過(guò)的< 替代性> 路徑和解決方案。換句話(huà)說(shuō),參與反事實(shí)推理可以透過(guò)鼓勵個(gè)人考慮< 替代方案> 來(lái)激發(fā)創(chuàng )意,幫助人們以不同的方式看待事物,從而帶來(lái)創(chuàng )造性的發(fā)現。因而人們能根據預期結果調整自己的行動(dòng)來(lái)增強未來(lái)規劃,從而獲得更成功的行動(dòng)方案和效果。
于是,也可以讓AI 來(lái)探索創(chuàng )造性的< 替代方案>,并與人類(lèi)協(xié)作參與反事實(shí)推理,將能幫助人們以不同的方式看待事物,從而帶來(lái)創(chuàng )造性的發(fā)現。使得人們能根據預期結果調整自己的行動(dòng)來(lái)增強未來(lái)規劃,從而獲得更成功的行動(dòng)方案和效果。人們基于A(yíng)I 提供的替代性方案,就可以深入了解新的可能性和創(chuàng )新方法,透過(guò)擴大考慮的解決方案的范圍來(lái)幫助解決問(wèn)題。它促使個(gè)人跳出框框思考并評估不同的結果,因而可以找出最初可能并不明顯的新穎解決方案。
3 訓練AI模型,來(lái)提供替代方案
茲以食譜的創(chuàng )新與推薦為例,來(lái)說(shuō)明AI 模型的規劃與訓練流程。透過(guò)這項< 反事實(shí)推理> 流程,不僅能說(shuō)明發(fā)現新的食材組合,還能模擬用戶(hù)的偏好變化對推薦結果的影響,從而為個(gè)性化推薦和食材創(chuàng )新提供強有力的支持。例如,透過(guò)GCN 模型可以仿真“如果用戶(hù)偏好發(fā)生變化,食材組合會(huì )如何變化”的反事實(shí)思考步驟。并能推測出使用者未嘗試過(guò)但可能感興趣的食材組合,從而生成更具創(chuàng )意和吸引力的食譜。這種方式不僅能推薦使用者偏好的食材,還能引導用戶(hù)嘗試新的搭配,促進(jìn)食譜的創(chuàng )新和多樣化。
階段一、訓練GCN模型獲取食材嵌入
訓練GCN 模型獲取原始的食材嵌入(Ingredient embedding),通過(guò)食材圖譜(Graph) 的關(guān)系學(xué)習每個(gè)食材的特征表示。例如,有6 種食材( 蔥、蛋、鹽、糖、蒜和胡椒),以及其關(guān)系( 圖-2),可以使用圖結構來(lái)表示之。
圖-2 食材圖譜
接著(zhù),就讓GCN模型來(lái)從食材圖譜的關(guān)系中,學(xué)習每個(gè)食材的潛藏空間向量表示,這通稱(chēng)為:食材嵌入。于是,就撰寫(xiě)Python程序代碼來(lái)實(shí)踐GCN,執行時(shí)輸出食材嵌入,如下:
這些嵌入將為后續的推薦和反事實(shí)生成提供關(guān)鍵特征。
階段二、訓練另一個(gè)GCN模型,獲取反事實(shí)連結
基于用戶(hù)喜愛(ài)的食材關(guān)系,構建推薦GCN,生成新的< 用戶(hù)- 食材> 的潛在連結,又稱(chēng)為:反事實(shí)連結(Counterfactual Links),簡(jiǎn)稱(chēng)為:CF_Links。這利用GCN 來(lái)推薦新連結( 即CF Links),這一步可仿真用戶(hù)對新食材組合的潛在偏好,是推薦系統的核心。這種方式將用戶(hù)行為與食材特征結合起來(lái),通過(guò)生成新的連結,能夠發(fā)現潛在的< 用戶(hù)- 食材> 關(guān)系,成為反事實(shí)分析的基礎。例如,有4 位用戶(hù)(User),其喜愛(ài)食材(Item)的關(guān)系( 圖-3),可以使用圖譜結構來(lái)表示之。
圖-3 <用戶(hù)-食材>圖譜
接著(zhù),就來(lái)建立另一個(gè)GCN模型來(lái)從< 用戶(hù)- 食材> 圖譜的關(guān)系中,展開(kāi)學(xué)習并推測出用戶(hù)可能感興趣的新食材組合,然后把這項新食材推薦給該用戶(hù)。于是,就撰寫(xiě)Python程序代碼來(lái)實(shí)踐GCN,并生成CF_Links,如下:
這程序生成了CF_Links表,從表中可以看出來(lái),針對User-0探索出兩條新連結:[0, 2] 和[0, 3]。在從兩條之間挑出一條比較緊密的關(guān)聯(lián)( 即[0, 2]),于是就推薦食材-2 給他。同樣地,針對User-1 探索出一條新連結:[1, 0]。于是就推薦食材-0 給她。這些CF_Links表示用戶(hù)對食材的反事實(shí)偏好( 即用戶(hù)對不同食材的潛在興趣),就能為用戶(hù)推薦最相關(guān)的食材組合( 圖-4)。
圖-4 基于CF_Links來(lái)推薦
這樣就生成了個(gè)性化推薦清單。例如,為用戶(hù)推薦他們可能感興趣的食材創(chuàng )新組合。
階段三、訓練另一個(gè)GCN模型,構建反事實(shí)的食材圖譜
本階段的任務(wù)是:利用反事實(shí)鏈接(CF_Links) 為目標,來(lái)訓練一個(gè)反事實(shí)GCN模型,生成新的食材嵌入,來(lái)構建反事實(shí)的食材圖譜。這三階段流程不僅能說(shuō)明發(fā)現新的食材組合,還能發(fā)揮反事實(shí)思考,想象用戶(hù)偏好變化對推薦結果的影響,從而為個(gè)性化推薦和食材創(chuàng )新提供極大助力。于是,就撰寫(xiě)Python 程序代碼來(lái)實(shí)踐反事實(shí)GCN 模型,并生成食材之間的CF_Links,如下:
這程序生成了新的連結:食材-4與食材-5。其表示食材與食材的反事實(shí)連結( 圖-5)。
圖-5 食材的反事實(shí)連結
這程序生成了新的連結:食材-4 與食材-5。就能逐步生成食材創(chuàng )新組合,而創(chuàng )造新食譜。例如:原來(lái)的食譜X = { 食材-2, 食材-5}。就有可能把食材-4 添加到原來(lái)食譜X 里了。
4 結束語(yǔ):邁向決策式AI
當食材-4 與食材-5 之間的相似度,除了考慮它們與用戶(hù)之間的喜愛(ài)度之外,還能考慮這兩種食材之間的口味相似度,就有可能建議以食材-5 來(lái)替換食譜X里食材-4 了,就成為用戶(hù)選擇食譜X 時(shí)的替代決策方案。例如針對上述圖-3 里的每一條連結,都提出一個(gè)替代性方案。如下:
除了飲食決策之外,上述的GCN模型也可應用于其他領(lǐng)域,例如在醫藥方面的文章:《基于藥物相互作用的慢性病決策支持系統》(Decision Support System for Chronic Diseases Based on Drug-Drug Interactions), 也有很精采的應用和效果。這篇文章提出了DSSDDI 決策支持系統,其基于藥物之間的相互作用來(lái)支持醫生開(kāi)藥決策。
(本文來(lái)源于《EEPW》202411)
評論