揭秘GPU在生物科學(xué)方面的應用
隨著(zhù)科學(xué)技術(shù)的快速發(fā)展,人類(lèi)在生命科學(xué)中不斷研究和探索,從分子結構到原子結構,再到納米結構。為了更加了解生命過(guò)程中細胞的物理過(guò)程,我們的手段從傳統的顯微鏡,到電子顯微鏡,再到現在的計算顯微鏡,以方便人類(lèi)更加直觀(guān)地觀(guān)察和模擬細胞的物理過(guò)程?;趶姶蟮挠嬎隳芰χ系挠嬎闵锟茖W(xué),將給我們帶來(lái)生命科學(xué)的新契機。
本文引用地址:http://dyxdggzs.com/article/199711.htm目前,顯微鏡被廣泛應用到生物科學(xué)中,科學(xué)家利用計算顯微鏡來(lái)觀(guān)察生物細胞,模擬細胞的物理化學(xué)過(guò)程。這需要具備強大并行計算能力的計算機輔助,因此,計算機的并行計算能力直接影響了生物科學(xué)中的研究能力。目前,GPU被廣泛應用到各行各業(yè)中,這也包括生物科學(xué)研究領(lǐng)域。
模擬病毒感染的過(guò)程
1.模擬脊髓灰質(zhì)炎病毒感染過(guò)程(Polioriurs infection)
脊髓灰質(zhì)炎病毒(Poliovirus,或稱(chēng)為脊髓灰白質(zhì)炎病毒)是脊髓灰質(zhì)炎(小兒麻痹)的病原,又稱(chēng)小兒麻痹病毒,是一個(gè)沒(méi)有外殼的病毒,由一條單股RNA組成。人類(lèi)和猴子都容易受這種病毒的感染。病毒在感染后的細胞內復制成熟后,就會(huì )在短期內一次釋放大量的病毒,使得被感染的細胞死亡,釋放出來(lái)的病毒又會(huì )感染其他細胞,又開(kāi)始新一輪的感染周期,直到所有容易感染的細胞都被感染并死亡。如果要弄清楚整個(gè)復雜的物理過(guò)程,就需要構建一億量級的單位物理模型,并經(jīng)過(guò)長(cháng)時(shí)間的模擬運行,才能真正得到這個(gè)物理過(guò)程。這個(gè)模擬過(guò)程的計算量是大得驚人的,無(wú)疑這適合并行計算能力強大的GPU去運行。
2.病毒衣殼力學(xué)
乙型肝炎病毒(Hepatitis B virus)又被稱(chēng)作乙肝病毒(HBV),屬于DNA病毒。就目前科學(xué)研究的成果來(lái)看,HBV只對人類(lèi)和猩猩有易感性,容易引發(fā)乙型病毒性肝炎疾病。完整的乙肝病毒成顆粒狀,分為外殼和核心兩部分,直徑約為42納米?;疑庑螢椴捎迷恿︼@微鏡得到的物理實(shí)驗結果,綠色圓形為計算機模擬下的結果。這里通過(guò)計算機模擬的方式得到的結果幾乎和原子力顯微鏡實(shí)驗中得到的結果完全吻合。在這種情況下就可以通過(guò)模擬的方式對病毒進(jìn)行分析,從而更加清晰地了解整個(gè)病毒物理作用的過(guò)程。采用GPU加速的模擬過(guò)程可以提高25.5倍的速度,可以節省10倍的能源。
光合作用過(guò)程
這里展示的紫色光合作用細菌,原理是光轉化為電,ADP(二磷酸腺苷)轉化為ATP(三磷酸腺苷)。需要采用靜電場(chǎng)計算并且使用多級求和法,這要求具備千萬(wàn)量級計算能力的單位進(jìn)行模擬,需要進(jìn)行大規模并行計算,原子越多,模擬的過(guò)程和時(shí)間越長(cháng)。在目前主流的CPU上計算大約需要1小時(shí)10分鐘。而如果利用具備并行處理計算能力強悍的GPU進(jìn)行運算的話(huà),時(shí)間會(huì )大大縮小。而且整個(gè)三維模型可以很好地跟GPU的三維架構的線(xiàn)程模型進(jìn)行匹配,能最大限度利用GPU計算的能力。采用基于G80架構的3塊GPU就可以在大約90秒鐘內模擬完成,并可以達到擁有線(xiàn)性時(shí)間復雜度,且比其他方法的有更高的靈活性。利用GPU進(jìn)行運算的話(huà),效率會(huì )大大提升。
通過(guò)基因藍圖制造蛋白質(zhì)
制造過(guò)程
科學(xué)家通過(guò)核糖體從mRNA中解碼基因信息并產(chǎn)生出新的蛋白質(zhì),這是蛋白質(zhì)的制造過(guò)程。實(shí)現這個(gè)過(guò)程也是研究抗生素的重要目標。其中重要的環(huán)節就是弄清楚核糖體的結構,模擬整個(gè)制造過(guò)程。2009年的諾貝爾化學(xué)獎就給了揭開(kāi)蛋白質(zhì)制造過(guò)程的三位科學(xué)家。這樣的生物物理過(guò)程的研究可以比喻成足球比賽,期望的不只是足球比賽的結果,而是整個(gè)足球比賽的過(guò)程。了解生物的物理過(guò)程才能更好地了解其中的物理原因,找到問(wèn)題的根本。傳統的低分辨率的圖像只能得到足球比賽的結果,而不知道比賽的過(guò)程。對于現在基于高性能計算的高分辨率結構圖,可以清晰地看到新生的蛋白質(zhì)。
分子動(dòng)力學(xué)模擬
通過(guò)分子動(dòng)力學(xué)的方式可以模擬整個(gè)新蛋白產(chǎn)生的過(guò)程,具體方法是使用計算機來(lái)模擬蛋白質(zhì)產(chǎn)生的過(guò)程,這差不多需要模擬100萬(wàn)個(gè)單元??梢钥吹较聢D,隨著(zhù)GPU數量的逐漸增多,單步的模擬過(guò)程時(shí)間越來(lái)越短,可以達到很高的性能。通過(guò)GPU的加速,整個(gè)模擬的過(guò)程從以前的兩個(gè)月縮短到了兩周。隨著(zhù)GPU數量的逐漸增多,計算機的性能也越來(lái)越強。
納米孔傳感器
新型納米孔是通過(guò)電力場(chǎng)作用驅動(dòng)單個(gè)分子逐一通過(guò)納米孔來(lái)實(shí)現測序的。由于納米孔的直徑非常細小,可以偵測通過(guò)的單個(gè)核酸聚合物,能保持良好的持續性和高精度地測量基因信息。對于長(cháng)達1000個(gè)堿基的單鏈DNA分子、RNA分子或者更短的核酸分子而言,也并不需要進(jìn)行擴增或標記就可以直接使用納米孔來(lái)進(jìn)行測試,這使得快速地進(jìn)行DNA測序成為可能。
對于基因的了解,通常情況下大家知道A、T、G、C四種堿基,其實(shí)還有第五種堿基——甲基化胞嘧啶。單分子納米孔測序儀能直接分辨出未修飾的胞嘧啶和甲基化胞嘧啶。當單鏈DNA通過(guò)納米孔的時(shí)候,單個(gè)堿基落入孔中,它們跟納米孔內特定物質(zhì)相互作用,阻礙了穿過(guò)孔中的電流同道。A、T、C、G以及甲基胞嘧啶都會(huì )有自己特有的電流振幅,因此很容易把這些電流振幅轉化成DNA序列。這樣就可以通過(guò)納米孔技術(shù)就能直接讀出這第五種堿基。
但是現在的納米孔材料還有很多問(wèn)題需要解決,例如可以通過(guò)模擬的方式來(lái)選擇生產(chǎn)更好的高分子納米材料。但現在還沒(méi)有一種生物納米孔或者人工合成的納米孔能有一個(gè)非常合適的幾何結構,并通過(guò)模擬的方式分析合成出適合的高分子材料,在這個(gè)過(guò)程中通常采用徑向分布函數的方法來(lái)進(jìn)行分析沉淀物和流體的情況。下圖模擬了4700萬(wàn)個(gè)單元,如果利用4核心的英特爾Xeon X5550 CPU,需要15個(gè)小時(shí),如果利用4臺NVIDIA的Tesla C2050 GPU,只需要10分鐘就可以完成。這里還有一個(gè)數據,利用Fermi架構的GPU的性能是采用上一代GT200架構GPU性能的3倍以上。
評論