機器學(xué)習算法,攻克難疾的新救星
近日,由劍橋大學(xué)領(lǐng)導的研究人員設計了一種用于藥物發(fā)現的機器學(xué)習算法,該算法的效率是工業(yè)標準的兩倍,可以加快開(kāi)發(fā)新的疾病治療方法的進(jìn)程。
本文引用地址:http://dyxdggzs.com/article/201902/397540.htm

研究人員使用他們的算法來(lái)識別新的分子,激活了一種被認為與阿爾茨海默病和精神分裂癥相關(guān)的蛋白質(zhì)。
藥物發(fā)現的一個(gè)關(guān)鍵問(wèn)題是預測一個(gè)分子是否會(huì )激活特定的生理過(guò)程。所以研究人員會(huì )構建一個(gè)統計模型尋找已知的激活過(guò)程的分子之間的化學(xué)模式,但是建立這些模型的數據是有限的,因為實(shí)驗成本很高,并且不清楚哪種化學(xué)模式在統計上是有意義的。
劍橋卡文迪什實(shí)驗室的阿爾法·李博士認為機器學(xué)習在計算機視覺(jué)等數據豐富的領(lǐng)域取得了重大進(jìn)展,下一個(gè)前沿領(lǐng)域就是科學(xué)應用,例如藥物發(fā)現。雖然研究人員對這個(gè)問(wèn)題有著(zhù)物理上的洞察力,但最大的問(wèn)題是如何將數據與基礎化學(xué)和物理學(xué)結合起來(lái)。
該算法由Lee和他的同事與生物制藥公司輝瑞合作開(kāi)發(fā),利用數學(xué)將與藥物相關(guān)的化學(xué)模式分離出來(lái)。重要的是,該算法研究已知活性分子和已知不活躍的分子,并識別分子中哪些部分對藥物作用很重要,哪些部分不重要。
一種被稱(chēng)為“數學(xué)原理”的隨機矩陣理論給出了數據集,然后將其與活性和非活性分子的化學(xué)特征的統計數據進(jìn)行比較,得出哪些化學(xué)模式對結合是重要的,而不是產(chǎn)生于偶然?;钚苑肿舆€能計算出另外六百萬(wàn)個(gè)分子。研究人員購買(mǎi)并篩選了100個(gè)最相關(guān)的分子。由此,他們發(fā)現了四個(gè)激活CHRM 1受體的新分子,這是一種可能與阿爾茨海默病和精神分裂癥相關(guān)的蛋白質(zhì)。
從六百萬(wàn)分子中提取出四個(gè)活性分子,就像在干草堆中找到一根針,但是利用機器學(xué)習算法,事情會(huì )變得容易很多。
劍橋大學(xué)的研究人員目前正在開(kāi)發(fā)算法,來(lái)預測合成復雜有機分子的方法,以及擴展機器學(xué)習的新算法。這項研究得到了溫頓可持續性物理方案的支持。
評論