微軟AI心臟病風(fēng)險預測指標面世 實(shí)現數據可視化指日可待
有許多風(fēng)險因素決定了人們患心臟病的風(fēng)險,例如生活方式、家族史、職業(yè)、現有疾病等等。了解人們患心臟病的風(fēng)險可以幫助他們或他們的醫生優(yōu)先考慮干預措施。近日,微軟推出了由人工智能支持的心臟病風(fēng)險評分API,供大型印度醫院網(wǎng)絡(luò )Apollo使用。
本文引用地址:http://dyxdggzs.com/article/201808/390903.htm“世界范圍內基于人工智能的模型是在幾十年前形成的,并以西方人口為基礎。我們的新API評分基于A(yíng)pollo Hospitals共享的40萬(wàn)印度人的數據,可以輕松識別每位患者的風(fēng)險水平,“微軟印度總經(jīng)理Anil Bhansali表示?!白鳛?a class="contentlabel" href="http://dyxdggzs.com/news/listbylabel/label/AI">AI領(lǐng)域的技術(shù)合作伙伴或專(zhuān)家,我們與醫療保健提供商和醫生合作,整合數據以幫助構建AI模型,”Bhansali補充說(shuō)。
這個(gè)AI工具考慮了21種風(fēng)險因素,包括飲食、吸煙和吸煙偏好等生活方式屬性以及通過(guò)呼吸率、高血壓、收縮壓和舒張壓反映的心理壓力和焦慮,并將對治療計劃提供豐富的見(jiàn)解和早期診斷。
“該評分將風(fēng)險分為高、中、低,并提供了對可修改的最大風(fēng)險因素的見(jiàn)解,從而幫助醫生以更全面的方式咨詢(xún)患者,同時(shí)為患者提供改善生活方式和及時(shí)干預的見(jiàn)解?!盉hansali闡述道。印度每年有近300萬(wàn)心臟病發(fā)病人數,3000萬(wàn)印度人患有冠心病。
“AI和ML與我們醫生的全球專(zhuān)業(yè)知識的合并將有助于預防心臟病、拯救生命并確?;加行呐K病的人能夠做出明智的健康選擇,”Apollo醫院常務(wù)董事Sangita Reddy表示。
“印度民眾的心臟風(fēng)險評分是精確醫療保健如何加速預防心血管疾病和減輕疾病負擔的真實(shí)例子,”Bhansali指出?!半m然我們目前正在與Apollo合作,但我們也正在確定合作伙伴,我們可以在其中實(shí)際嘗試此API評分,”他補充說(shuō)。
事實(shí)上,微軟并不是第一個(gè)利用AI技術(shù)來(lái)預測心臟病的機構。在幾個(gè)月前,《科學(xué)》雜志報道了英國諾丁漢大學(xué)流行病學(xué)家 Stephen Weng 博士團隊發(fā)表在《PLOS ONE》上的重要研究成果,Weng 博士團隊將機器學(xué)習算法應用于電子病歷的常規數據分析,發(fā)現與當前的心臟病預測方法相比,深度學(xué)習算法不僅可以更準確地預測心臟病發(fā)病風(fēng)險,還可以降低假陽(yáng)性患者數量 。
「這項研究的重要性再怎么強調都不過(guò)分」,沒(méi)有參與這項研究的斯坦福大學(xué)血管外科醫生 Elsie Ross 博士在接受《科學(xué)》雜志采訪(fǎng)時(shí)表示,「我真的希望醫生敞開(kāi)胸懷擁抱人工智能,利用這個(gè)工具更好地幫助患者?!?/p>
我相信大部分心血管醫生對人工智能的期待與 Ross 博士一樣。因為據世界衛生組織統計,在 2012 年,全球非傳染病導致的死亡人數為 3800 萬(wàn),其中心血管疾病(心臟病和中風(fēng)等)為 1750 萬(wàn)人,占所有非傳染疾病導致死亡病例的 46.2%;而讓人感到畏懼的癌癥導致的死亡為 820 萬(wàn),占所有非傳染疾病導致死亡病例的 21.7% 。心血管疾病的預防與治療確實(shí)刻不容緩。
實(shí)際上科學(xué)家也一直在努力尋找與心腦血管疾病相關(guān)的風(fēng)險因子,以達到預防疾病的目的。例如美國心臟病學(xué)院與美國心臟病協(xié)會(huì )(American College of Cardiology/American Heart Association;ACC/AHA)等機構通過(guò)多年的研究,將高血壓、膽固醇、年齡、吸煙和糖尿病等一系列因素列為與心血管疾病風(fēng)險高相關(guān)的因素,并推出了 ACC/AHA 預測模型 。除此之外,還有其他組織機構推出的 QRISK2、Framingham 和 Reynolds 等預測模型。
ACC/AHA 的預測主要風(fēng)險因子組合
然而,在 Weng 博士看來(lái),這些方法都不給力。因為所有標準的心血管病風(fēng)險評估模型都有一個(gè)隱含的假設,即每個(gè)風(fēng)險因子與心血管疾病之間的關(guān)系都是線(xiàn)性的 ,這些模型可能過(guò)度簡(jiǎn)化了它們之間的關(guān)系。
相對于復雜的生命活動(dòng),這顯然太簡(jiǎn)單了,無(wú)法揭示患者服用的藥物,或其他疾病和生活方式因素對疾病的影響。甚至還有一些因素是反直覺(jué)的,很多人認為脂肪對身體有害,會(huì )增加健康人患心血管疾病的風(fēng)險。但在一些情況下,它實(shí)際上是保護心臟的?!高@些例外在人體內實(shí)實(shí)在在地發(fā)生,」Weng 博士說(shuō)?!赣嬎憧茖W(xué)給了我們探索那些復雜關(guān)系的機會(huì )?!?/p>
為了探索利用機器學(xué)習預測心血管病發(fā)病風(fēng)險的方法,Weng 博士團隊從 Clinical Practice Research Datalink (CPRD)數據庫篩選了 378256 名符合標準居民的 10 年(2005 年 1 月 1 日起)電子病歷,這些居民在 2005 年都是各方面指標正常的健康人。
然后隨機將這個(gè)龐大的數據庫分成兩份,其中 295267(78%)個(gè)居民的電子病歷,用來(lái)訓練機器學(xué)習算法,剩下的 82989 個(gè)居民的 10 年電子病歷用來(lái)驗證算法的準確性。據 Weng 博士了解,這是全世界范圍內,首次在如此大規模的群體中,使用機器學(xué)習預測人類(lèi)患心血管疾病的風(fēng)險。
為了找到更合適的機器學(xué)習算法,Weng 博士和其同事采用了 4 種機器學(xué)習算法,它們分別是:隨機森林(random forest)、邏輯回歸(logistic regression)、梯度提升(gradient boosting)和神經(jīng)網(wǎng)絡(luò )(neural networks)。將 ACC/AHA 模型作為對照。
第一步工作是讓 4 種機器學(xué)習算法在沒(méi)有人類(lèi)指示的情況下,通過(guò)分析 295267 的電子病歷數據,各自「創(chuàng )造」一個(gè)預測模型。當研究人員將標準化的數據「喂」給這四種算法之后,它們很快找到了各自認為的與心血管病發(fā)生相關(guān)性較高的風(fēng)險因子。
在這一步,機器學(xué)習算法就顯現出了它的優(yōu)勢。與 ACC/AHA 指南相比,年齡、性別和吸煙三項風(fēng)險因素,也被四種機器學(xué)習算法列為首要風(fēng)險因素。然而,現行的許多心血管疾病算法認為糖尿病是風(fēng)險因子之一,四種機器學(xué)習模型要么不考慮這項因素,要么只認為糖化血紅蛋白是風(fēng)險因素。
四種深度學(xué)習算法自己「摸索」出來(lái)的重要風(fēng)險因子
更有意思的是,這四種機器學(xué)習模型認為房顫、種族差異、慢性腎病、慢性阻塞性肺疾病和嚴重精神病等疾病,以及是否服用皮質(zhì)類(lèi)固醇,以及甘油三酯水平等生物標志物等是重要風(fēng)險因素。但是這些在現存的模型里都是不存在的。
這再一次表明,機器學(xué)習可以幫助研究人員發(fā)現一些潛在的風(fēng)險因子,這些變量憑人力是很難發(fā)現的,但是機器學(xué)習可以從其他變量中推斷出來(lái) 。那機器學(xué)習的這幾套模型到底靠譜嗎?
第二步,Weng 博士將四種機器學(xué)習算法自主建立的模型與 ACC/AHA 模型進(jìn)行比較,讓它們分別預測剩下的 82989 個(gè)居民哪些 10 年后會(huì )患心血管疾病(實(shí)際總發(fā)病人數為 7404 人,當然研究人員沒(méi)有把這個(gè)信息告訴深度學(xué)習模型),哪些不會(huì )發(fā)病。它們的預測結果如下。
四種深度學(xué)習「摸索」出的模型預測能力與 ACC/AHA 模型的比較
不難看出,四種機器算法自主創(chuàng )建的模型要優(yōu)于 ACC/AHA 模型。隨機森林模型的敏感性比 ACC/AHA 高出 2.6%,邏輯回歸模型的敏感性比 ACC/AHA 高出 4.4%,梯度提升機和神經(jīng)網(wǎng)絡(luò )模型的敏感性比 ACC/AHA 高出 4.8%。從本研究的結果看來(lái),最好的神經(jīng)網(wǎng)絡(luò )算法比傳統模型多正確預測了 355 個(gè)居民的發(fā)病風(fēng)險。這意味著(zhù),在更大的人群里,將有數以萬(wàn)計的人會(huì )因此而得救。
實(shí)現數據處理過(guò)程可視化的方法
然而,我們也不難發(fā)現,即使引入深度學(xué)習算法之后,還有 30% 以上的高風(fēng)險居民沒(méi)有被提前預測出來(lái)。這意味著(zhù)深度學(xué)習算法還需要大幅改進(jìn)。Weng 希望在將來(lái)能將更多的生活因素和遺傳因素納入分析范圍,進(jìn)而提升其精確度。
這件事情卻未必那么容易。因為機器學(xué)習算法就像「黑箱」,你輸入數據,它反饋結果,然而在這個(gè)黑箱之中到底發(fā)生了什么,目前研究人員是很難知道的,這使得科學(xué)家難以在算法上做調整。不過(guò),科學(xué)家正在努力改進(jìn)這一現狀,爭取實(shí)現數據處理過(guò)程的可視化 。
評論