人工智能“訓”出影像科“大拿”
春節長(cháng)假剛過(guò),一則消息就讓人工智能(AI)圈振奮不已。在2月22日最新一期的《細胞》雜志上,廣州市婦女兒童醫療中心張康團隊的研究榮登雜志封面,他們所帶來(lái)的成果是一款能精確診斷眼病和肺炎兩大類(lèi)疾病的AI系統。
本文引用地址:http://dyxdggzs.com/article/201803/376658.htm

對于以數據為基礎食材的AI來(lái)說(shuō),沒(méi)有什么比醫學(xué)影像數據更好“咀嚼”的
在2月23日舉辦的新聞發(fā)布會(huì )上,研發(fā)團隊介紹,新一代AI平臺“本領(lǐng)強大”,既能讀X光片和超聲數據,又可以閱讀CT(X射線(xiàn)斷層掃描)和MR(磁共振)影像;可在30秒內診斷黃斑變性和糖尿病視網(wǎng)膜黃斑水腫這兩種眼科疾病,還可在幾秒內對兒童肺炎病原學(xué)類(lèi)型進(jìn)行差異性分析和判定,診斷的準確性和靈敏性均達到90%以上。
據了解,這不僅是中國研究團隊首次在頂級生物醫學(xué)雜志發(fā)表有關(guān)醫學(xué)人工智能的研究成果,也是世界范圍內首次使用如此龐大的標注好的高質(zhì)量數據進(jìn)行遷移學(xué)習,并取得高度精確的診斷結果,實(shí)現用AI精確推薦治療手段的突破。
“未來(lái)我們將繼續增加這個(gè)系統能夠診斷的視網(wǎng)膜疾病,同時(shí)還將加入包括腫瘤等其他系統的疾病。”美國加州大學(xué)圣地亞哥分校人類(lèi)基因組醫學(xué)研究所所長(cháng)、廣州市婦女兒童醫療中心基因檢測中心主任張康表示。
舉一反三的遷移學(xué)習
在眼科治療中,視網(wǎng)膜OCT(光學(xué)相干斷層掃描)成像技術(shù)是最常用的診斷技術(shù)之一,通過(guò)獲取視網(wǎng)膜組織的高分辨率圖像,醫生們能夠精準地對年齡相關(guān)性黃斑變性和糖尿病性黃斑水腫等致盲性眼病作出診斷,并提供治療方案。
基于OCT技術(shù)的普遍性,如果能讓AI技術(shù)來(lái)處理這些圖片,無(wú)疑將會(huì )大大增強診斷的效率和準確度。為此,張康團隊獲取了超過(guò)20萬(wàn)張OCT的圖像,并使用其中來(lái)自近5000名患者的10萬(wàn)張圖像,訓練一款深度學(xué)習算法。在經(jīng)歷了大量迭代訓練后,這款算法的準確率達到了目前的最優(yōu)值。
“在學(xué)習了超過(guò)20萬(wàn)病例的OCT圖像數據后,AI平臺診斷黃斑變性、黃斑水腫的準確性達到96.6%,靈敏性達到97.8%,特異性達到97.4%。”據張康介紹,新一代AI平臺既能基于OCT數據實(shí)現常見(jiàn)視網(wǎng)膜疾病的識別和嚴重性定量評估,也能基于胸部X光影像數據實(shí)現兒童肺炎病原學(xué)類(lèi)型的差異性分析和快速準確判定。
那么,“學(xué)習訓練”后的AI平臺,診斷水平為什么會(huì )得到快速提高?這就是該研究應用算法的創(chuàng )新之處——遷移學(xué)習。
所謂“遷移學(xué)習”,就是把已訓練好的模型參數遷移到新的模型來(lái)幫助新模型訓練,也就是運用已有的知識來(lái)學(xué)習新的知識,找到已有知識和新知識之間的相似性。這實(shí)際上就相當于舉一反三。
“比如你過(guò)去沒(méi)有見(jiàn)過(guò)老虎,但當你見(jiàn)了三只老虎之后,再出現第四只你就認識了。”醫學(xué)影像人工智能專(zhuān)家、匯醫慧影CEO柴象飛對《中國科學(xué)報》記者解釋?zhuān)?ldquo;當我們對一個(gè)事物建立了基本認知之后,再去學(xué)習新的事物就會(huì )相對容易,并且只需很少的樣本就可以有一個(gè)知識的遷移,這就是遷移學(xué)習。”
相較于其他大多數學(xué)習模型的“從零開(kāi)始”,遷移學(xué)習利用卷積神經(jīng)網(wǎng)絡(luò )(CNN)學(xué)習基于已有的訓練好的源任務(wù)參數的基礎上學(xué)習目標任務(wù)輸入數據的特點(diǎn),獲得新的網(wǎng)絡(luò )模型及其參數。以醫學(xué)影像學(xué)習為例,該系統會(huì )識別目標系統中圖像的特點(diǎn),從研究人員導入的源系統的結構和參數從發(fā),利用輸入圖像數據的相似性訓練構建新的系統模型和參數。
華中科技大學(xué)生命科學(xué)與技術(shù)學(xué)院教授薛宇表示,傳統機器學(xué)習算法訓練數據集大,特征提取比較困難,這樣造成的結果是,數據集小預測不準,變大后預測準確率提高,但數據集再大就又不準了。深度學(xué)習的好處是,數據集越大準確性越高,特征提取能力也比傳統機器學(xué)習算法強得多。
“CNN是深度學(xué)習算法里的一類(lèi)方法,處理圖像數據比較有優(yōu)勢。這項研究策略是先讓機器學(xué)習1000類(lèi)圖片的特征然后建立模型,再針對需要研究的問(wèn)題進(jìn)行遷移學(xué)習,這樣的話(huà),訓練集足夠大準確性也高。”薛宇點(diǎn)評道,“理論上訓練集不斷增大,準確性可以完全超過(guò)任何頂級專(zhuān)家的診斷。”
首先要克服數據困境
對于以數據為基礎食材的AI來(lái)說(shuō),沒(méi)有什么比醫學(xué)影像數據更需要“咀嚼”的。在醫療中,超過(guò)80%的數據來(lái)自于CT、X線(xiàn)、MR、超聲等醫學(xué)影像,AI可以借助這些海量數據生成算法模型,保證模型最大的包容性。
但在柴象飛看來(lái),醫療領(lǐng)域還有一個(gè)顯著(zhù)特點(diǎn),就是醫療數據沒(méi)有辦法像人臉、指紋、車(chē)牌等圖像數據一樣有一個(gè)豐富的來(lái)源。
“實(shí)際上,醫療影像的數據是很有限的,尤其單病種,我們每個(gè)人平均一年都拍不到一張片子,比如間質(zhì)性肺炎或某一個(gè)部位的骨折,全國每年可能只有幾萬(wàn)個(gè)患者,并且還分散在各個(gè)地區及各個(gè)醫院,數據獲取十分困難。”柴象飛說(shuō)。
正如影像科醫師需要閱讀大量的臨床醫學(xué)圖像一樣,“喂食”病理圖像數據也是AI系統最主要的學(xué)習方式。“喂食”的病理圖像數據越充足,AI的分析能力才能越強大。
“能拿到非常好的數據,才能知道算法在什么地方存在哪些問(wèn)題,通過(guò)AI反復計算來(lái)達到最好的效果。”張康同樣指出,AI應用在醫療領(lǐng)域,數據獲取是一個(gè)很大的挑戰。“中國醫院有大量病人的數據,但是如果沒(méi)有經(jīng)過(guò)純化、沒(méi)有高質(zhì)量標注過(guò),這樣的數據直接輸入計算機是不會(huì )獲得預期結果的。”
另外,盡管大多數放射科已經(jīng)完成過(guò)數百萬(wàn)次的影像檢查,結構化程度也較高,但是大部分都沒(méi)有醫生的標注信息。醫療影像的專(zhuān)業(yè)性決定了它的特殊性,影像數據的標注大部分只能仰賴(lài)專(zhuān)業(yè)的、有經(jīng)驗的相關(guān)醫學(xué)領(lǐng)域從業(yè)人員,很難像語(yǔ)音數據、文本數據或是自然圖像一樣將標注任務(wù)外包出去。
不僅如此,張康還指出,AI醫療領(lǐng)域一直是由幾個(gè)大的IT公司壟斷,如果形成對數據和技術(shù)的封鎖,也會(huì )對AI在醫療行業(yè)的發(fā)展應用造成限制。
急需培養醫工融合人才
目前,影像已然成為AI在醫療領(lǐng)域落地的主要突破口,然而柴象飛認為,這個(gè)口子并不容易突破,AI與醫療場(chǎng)景的結合還有很長(cháng)的路要走,AI開(kāi)發(fā)人員和工程化人員對醫療行業(yè)的陌生就是最大的挑戰。
AI醫學(xué)影像不同于只是單純需要理論型人才或是應用型人才的其他領(lǐng)域,它需要的是大量醫工結合的復合型人才。在美國有多年研究經(jīng)歷的柴象飛深刻感受到,國內外在該交叉領(lǐng)域的人才培養方面還存在較大差異。
“在美國,工科學(xué)生都有七八年的醫院工作經(jīng)驗,從事聯(lián)合性開(kāi)發(fā),再把成果交給器械廠(chǎng)商做商業(yè)化。但是國內有相關(guān)經(jīng)驗的人卻非常少,大量醫生有興趣和意愿卻往往工科背景不足,還有一部分醫生很希望做產(chǎn)業(yè)化,但商業(yè)方面經(jīng)驗和能力也相對不足。”柴象飛說(shuō)。
為了培養更多的復合型人才,匯醫慧影啟動(dòng)了“優(yōu)才計劃”,將國內優(yōu)秀的醫學(xué)及計算機人才輸送到美國斯坦福大學(xué)等全球頂級名校進(jìn)行學(xué)習深造,提高我國醫療領(lǐng)域綜合型人才在全球市場(chǎng)的競爭力。
廣州市婦女兒童醫療中心主任夏慧敏表示,患者日益增長(cháng)的優(yōu)質(zhì)醫療資源需要與專(zhuān)業(yè)醫療人員培養不足的矛盾,是醫院面臨的痛點(diǎn)之一。研究更好的技術(shù)手段和平臺,既能在一定程度上解決醫療服務(wù)能力不足的問(wèn)題,又能提高健康服務(wù)的公平性和可及性。
對于此番研究團隊開(kāi)發(fā)的這套AI系統,張康希望,未來(lái)能應用到包括初級保健、社區醫療、家庭醫生、急診室等領(lǐng)域,形成大范圍的自動(dòng)化分診系統。
評論