<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>
"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > AI 與合成生物學(xué)「聯(lián)姻」的五大挑戰:技術(shù)、數據、算法、評估與社會(huì )學(xué)

AI 與合成生物學(xué)「聯(lián)姻」的五大挑戰:技術(shù)、數據、算法、評估與社會(huì )學(xué)

發(fā)布人:大數據文摘 時(shí)間:2022-05-23 來(lái)源:工程師 發(fā)布文章
大數據文摘轉載自AI科技評論

來(lái)源:ACM通訊編譯:王玥編輯:陳彩嫻
在過(guò)去的二十年里,生物學(xué)發(fā)生了翻天覆地的變化,建立在生物系統上的工程成為了可能。賦予了我們細胞遺傳密碼(DNA)排序能力的基因組革命是這一巨大變化的主要推手。而基因組革命帶來(lái)的最新發(fā)現之一,正是使用CRISPR在體內精確編輯DNA的能力。
遺傳密碼的高級表現,如蛋白質(zhì)的合成,被稱(chēng)為「表型」(phenotype)。高通量表型數據與DNA的精確編輯結合到一起,將底層代碼的變化與外部表型聯(lián)系了起來(lái)。
圖片

圖注:Wacomka


圖片圖注:本圖體現了細胞遺傳密碼(DNA)的高層次表現
圖片圖注:生物學(xué)中經(jīng)常使用的數據集/數據類(lèi)型(本列表收錄不全)


合成生物學(xué)的潛力

合成生物學(xué)將對食品、能源、氣候、醫****和材料……以至于世界上每個(gè)領(lǐng)域都產(chǎn)生變革性的影響。
圖片圖注:合成生物學(xué)可能會(huì )影響世界上的每一個(gè)領(lǐng)域
合成生物學(xué)已經(jīng)為世人帶來(lái)了不用犧牲豬就能獲得豬的胰島素(在之前的基因工程階段就能做到)、合成皮革、壓根不是蜘蛛吐的蛛絲做的大衣、抗瘧疾和抗癌****物、嘗起來(lái)像肉的無(wú)肉漢堡、可再生生物燃料、沒(méi)有啤酒花的啤酒花味啤酒,已滅絕了的花朵的香味,用于化妝品的人造膠原蛋白,消除攜帶登革熱蚊子的基因。許多人認為這只是冰山一角,因為設計生物的能力帶來(lái)了改造世界的無(wú)限可能性,而且在這一領(lǐng)域,公共和私人投資水平都在不斷增長(cháng)。
圖片圖注:學(xué)術(shù)(a)和商業(yè)(b)領(lǐng)域的顯著(zhù)增長(cháng)為 AI 在合成生物領(lǐng)域的應用提供了豐富的信息、數據和環(huán)境資源。
此外,進(jìn)入AI 第三次浪潮后,AI 專(zhuān)注于將環(huán)境融入模型,其影響合成生物學(xué)的潛力大大增加。
眾所周知,生物體的基因型與其說(shuō)是其表型的藍圖,不如說(shuō)是一個(gè)復雜的、相互關(guān)聯(lián)的、動(dòng)態(tài)系統的初始條件。生物學(xué)家們花了幾十年的時(shí)間來(lái)構建和管理一套大型包含調節、關(guān)聯(lián)、變化速度和功能在內的屬性,用來(lái)描述這個(gè)復雜的、動(dòng)態(tài)的系統。其他資源如基因網(wǎng)絡(luò )、已知功能關(guān)聯(lián)、蛋白質(zhì)與蛋白質(zhì)的相互作用、蛋白質(zhì)與代謝物的相互作用以及轉錄、翻譯和交互的知識驅動(dòng)的動(dòng)態(tài)模型則為人工智能模型提供了豐富的資源。
模型的可解釋性對于揭示新的設計原則也是至關(guān)重要的。這些模型給了生物學(xué)家去解決關(guān)于生物系統的更復雜的問(wèn)題的能力,并且建立綜合的、可解釋的模型去加速發(fā)現與研究。我們可以從合成生物學(xué)出版物的數量以及合成生物學(xué)的商業(yè)機會(huì )中明顯看出該領(lǐng)域知識和資源的增長(cháng)。


AI 及其對合成生物學(xué)的影響

與AI在合成生物領(lǐng)域的潛力相比,它在合成生物領(lǐng)域的影響有限。
我們已經(jīng)看到了AI的成功應用,但仍然局限于特定的數據集和研究問(wèn)題。AI在該領(lǐng)域目前面對的挑戰,仍然是對更廣泛的應用程序和其他數據集來(lái)說(shuō)有多大的通用性。
數據挖掘、統計和機械建模目前是該領(lǐng)域計算生物學(xué)和生物信息學(xué)的主要驅動(dòng)因素,但這些技術(shù)與人工智能/機器學(xué)習之間的界限往往是模糊的。例如,聚類(lèi)是一種數據挖掘技術(shù),可以識別基因表達數據中的模式和結構,這些模式可以表明工程修改是否會(huì )導致細胞的毒性結果。這些聚類(lèi)技術(shù)還可以作為無(wú)監督學(xué)習模型,在未標記的數據集中找到結構。這些正在開(kāi)發(fā)中的經(jīng)典技術(shù)和新的AI/ML(機器學(xué)習)方法將在未來(lái)的領(lǐng)域合成生物中發(fā)揮更大的作用和影響,因為屆時(shí)人們對于更大的數據集將習以為常。轉錄組數據量每7個(gè)月翻一番,蛋白質(zhì)組學(xué)和代謝組學(xué)的高通量工作流程越來(lái)越可用。
此外,實(shí)驗室工作微流控芯片的逐步自動(dòng)化和小型化預示著(zhù)未來(lái)數據處理和分析將使得合成生物學(xué)的生產(chǎn)力倍增。DARPA的協(xié)同發(fā)現和設計(SD2, 2018–2021) 計劃專(zhuān)注于構建人工智能模型,旨在拉近AI與合成生物學(xué)需求的差距。這一點(diǎn)在一些采用該領(lǐng)域SoTA技術(shù)的公司中也很明顯(例如Amyris、Zymergen或Ginkgo Bioworks)。
AI和合成生物學(xué)在一些方面存在重疊,比如將現有AI/ML應用于現有數據集;生成新的數據集(例如即將到來(lái)的NIH Bridge2AI);并創(chuàng )造新的AI/ML技術(shù)來(lái)應用于新的或現有的數據。雖然SD2在最后一項中有所貢獻,但其仍有一定潛力,未來(lái)也有較長(cháng)的路要走。
人工智能可以幫助合成生物學(xué)克服一個(gè)大挑戰,即預測生物工程方法對生物主體和環(huán)境的影響。由于無(wú)法預測生物工程的結果,合成生物學(xué)的細胞工程目標(即逆設計)只能通過(guò)大量的試錯來(lái)實(shí)現。人工智能提供了一個(gè)利用公開(kāi)數據和實(shí)驗數據來(lái)預測對生物主體和環(huán)境影響的機會(huì )。
為細胞編程設計遺傳結構。 許多合成生物學(xué)領(lǐng)域的研究都集中在基因結構/基因線(xiàn)路的工程上,這與設計電子電路面臨著(zhù)的挑戰大相徑庭。
人工智能技術(shù)結合了已知的生物物理、機器學(xué)習和強化學(xué)習模型,能夠有效預測結構對主體的影響,反之亦然,雖然已經(jīng)頗為強大,但仍然有改進(jìn)空間。而在機器輔助基因線(xiàn)路設計方面,已有各種人工智能技術(shù)投入應用,其中包括專(zhuān)家系統、多智能體系統、約束推理、啟發(fā)式搜索、優(yōu)化和機器學(xué)習。
基于序列的模型和圖卷積網(wǎng)絡(luò )在工程生物系統領(lǐng)域也得到了關(guān)注。因子-圖神經(jīng)網(wǎng)絡(luò )已被用于將生物知識納入深度學(xué)習模型。圖卷積網(wǎng)絡(luò )已被用于從蛋白質(zhì)與蛋白質(zhì)相互作用網(wǎng)絡(luò )中預測蛋白質(zhì)的功能?;谛蛄械木矸e和遞歸神經(jīng)網(wǎng)絡(luò )模型已被用于識別蛋白質(zhì)的潛在結合位點(diǎn)、基因的表達和新的生物結構的設計。人工智能最有用之處是應用于開(kāi)發(fā)綜合模型,而這將減少需要進(jìn)行的實(shí)驗或設計的數量。
代謝工程。在代謝工程中,人工智能已經(jīng)應用到生物工程過(guò)程的幾乎所有階段,例如人工神經(jīng)網(wǎng)絡(luò )已被用于預測翻譯起始位點(diǎn),注釋蛋白質(zhì)功能,預測合成途徑,優(yōu)化多個(gè)外源基因的表達水平,預測調控元件的強度,預測質(zhì)粒表達,優(yōu)化營(yíng)養濃度和發(fā)酵條件,預測酶動(dòng)力學(xué)參數,了解基因型與表型的關(guān)聯(lián),預測CRISPR的指導效果等階段。聚類(lèi)已被用于發(fā)現次生代謝物生物合成基因聚類(lèi)和識別催化特定反應的酶。集合方法已被用于預測途徑動(dòng)態(tài)、最優(yōu)生長(cháng)溫度,并在定向進(jìn)化方法中找到賦予更高適應度的蛋白質(zhì)。支持向量機已被用于優(yōu)化核糖體結合位點(diǎn)序列和預測CRISPR引導RNA的行為。在代謝工程的各階段中,人工智能最有希望被應用于流程放大,這是該領(lǐng)域的一個(gè)重大瓶頸,以及下游處理(例如從發(fā)酵液中系統提取所產(chǎn)生的分子)。
實(shí)驗自動(dòng)化。在幫助自動(dòng)化實(shí)驗室工作和推薦實(shí)驗設計方面,人工智能的影響已經(jīng)遠遠超出了DBTL周期的“學(xué)習”階段。自動(dòng)化正逐漸在實(shí)踐中變得十分重要,因為自動(dòng)化是獲得訓練人工智能算法所需的高質(zhì)量、大容量、低偏差數據的最可靠的方式,自動(dòng)化還使得可預測的生物工程成為可能。自動(dòng)化提供了將復雜協(xié)議快速轉移和擴展到其他實(shí)驗室的機會(huì )。例如,液體處理機器人站構成了生物鑄造廠(chǎng)和云實(shí)驗室的支柱。這些鑄造廠(chǎng)已經(jīng)能夠看到在未來(lái)自身會(huì )被機器人和規劃算法顛覆,從而獲得快速迭代通過(guò)DBTL周期的能力。語(yǔ)義網(wǎng)絡(luò )、本體和模式徹底改變了設計和協(xié)議的表示、通信和交換。這些工具支持快速實(shí)驗,并以結構化、可查詢(xún)的格式生成更多的數據。在一個(gè)大多數內容要么丟失,要么被人工記錄在實(shí)驗室筆記中的領(lǐng)域,人工智能的前景推動(dòng)領(lǐng)域發(fā)生重大變化,從而減少生成數據的障礙。
微流體是宏觀(guān)液體處理的替代品,具有更高的通量、更少的試劑消耗和更便宜的結垢。事實(shí)上,微流體可能是實(shí)現自動(dòng)駕駛實(shí)驗室的關(guān)鍵技術(shù),它有望通過(guò)使用人工智能增強自動(dòng)化實(shí)驗平臺,大大加快研發(fā)過(guò)程。自動(dòng)駕駛實(shí)驗室涉及完全自動(dòng)化的DBTL周期,其中人工智能算法會(huì )根據之前的實(shí)驗結果進(jìn)行假設,積極尋找有前景的實(shí)驗程序。因此這可能是合成生物領(lǐng)域人工智能研究人員的最大機會(huì )。雖然自動(dòng)DBTL回路已經(jīng)在液體處理機器人工作站中得到了證明,但微流控芯片提供的可擴展性、高通量能力和制造靈活性可能會(huì )提供最終的技術(shù)飛躍,使人工智能成為現實(shí)。


用AI研究合成生物學(xué)所面臨的挑戰

人工智能已經(jīng)開(kāi)始進(jìn)入各種合成生物應用領(lǐng)域,但仍然存在的技術(shù)和社會(huì )問(wèn)題成為了這兩個(gè)領(lǐng)域之間的障礙。
技術(shù)挑戰。將人工智能應用于合成生物學(xué)的技術(shù)挑戰是:數據分散在不同的模式中,難以組合,非結構化,往往缺乏收集數據的背景;模型需要的數據比通常在單個(gè)實(shí)驗中收集的數據多得多,而且缺乏可解釋性和不確定性量化;并且在更大的設計任務(wù)中,沒(méi)有度量標準或標準來(lái)有效地評估模型的性能。此外,實(shí)驗往往設計為只探索積極的結果,這使得模型的評估變得復雜化或偏倚。
圖片圖注:將人工智能技術(shù)應用于合成生物學(xué)領(lǐng)域的挑戰。
數據挑戰。缺乏合適的數據集仍然是人工智能與合成生物學(xué)結合的首要障礙。將人工智能應用于合成生物學(xué)需要從個(gè)體實(shí)驗中獲得大量標記過(guò)的、精選的、高質(zhì)量、情境豐富的數據。盡管該社區在建立包含各種生物序列(甚至全基因組)和表型的數據庫方面取得了進(jìn)展,但標記數據仍然很匱乏。此處所說(shuō)的“標記數據”指的是映射到捕捉它們的生物功能或細胞反應的測量的表型數據。正是這種測量和標簽的存在讓AI/ML和合成生物學(xué)解決方案日趨成熟,和其他領(lǐng)域一樣讓AI與人類(lèi)的能力相互競爭。
缺乏對數據工程的投資是缺乏適用數據集的部分原因。在人工智能技術(shù)進(jìn)步的光芒掩蓋下,人們往往看不到支持和確保其成功的計算基礎設施需求。AI社區將其稱(chēng)為需求金字塔,數據工程是其中一個(gè)重要的組成部分。數據工程中包括了實(shí)驗規劃、數據收集、結構化、訪(fǎng)問(wèn)和探索的步驟。成功的AI應用程序故事包含標準化、一致和可復制的數據工程步驟。雖然我們現在可以以前所未有的規模和細節收集生物數據,但這些數據往往不能立即適用于機器學(xué)習。目前在采用全社區標準來(lái)存儲和共享測量數據、實(shí)驗條件和使得數據更服從于A(yíng)I技術(shù)的其他元數據方面仍存在許多障礙。需要進(jìn)行嚴格的工作和達成高度共識才能使這些標準迅速被采用,同時(shí)促進(jìn)數據質(zhì)量評估的通用標準。簡(jiǎn)而言之,人工智能模型需要在所有實(shí)驗中進(jìn)行一致和可比的測量,這就會(huì )延長(cháng)實(shí)驗時(shí)間線(xiàn)。這一要求為已經(jīng)遵循復雜協(xié)議進(jìn)行科研實(shí)驗人員又增加了巨大的負擔。因此,為了趕近在眉睫的項目期限,收集數據的長(cháng)期需要往往會(huì )被犧牲掉。
圖片圖注:一個(gè)規范的AI/ML基礎設施可以支持合成生物學(xué)研究。雖然研究中期往往是人們關(guān)注的焦點(diǎn),但基礎才是至關(guān)重要的,需要大量的資源投資。
這種情況通常會(huì )造成稀疏的數據集合,稀疏的數據集合只表示構成組學(xué)數據棧的多個(gè)層的一小部分。在這種情況下,數據表示對集成這些孤立數據集進(jìn)行綜合建模的能力有重大影響。目前,業(yè)界在各個(gè)垂直領(lǐng)域都投入了大量工作,執行數據清理、模式對齊以及提取、轉換和加載操作(ETL),用這種方式收集難以控制的數字數據,并將其準備為適合分析的形式。這些任務(wù)占據了數據科學(xué)家近50%到80%的時(shí)間,限制了他們深入探索的能力。處理大量的數據類(lèi)型(數據多模態(tài))是合成生物學(xué)研究人員面臨的一個(gè)挑戰,與數據量相比,預處理活動(dòng)的復雜性隨著(zhù)數據多樣性的增加而急劇增加。
建模/算法的挑戰。許多推動(dòng)當前人工智能進(jìn)步的流行算法(例如計算機視覺(jué)和NLP領(lǐng)域的流行算法)在分析組學(xué)數據時(shí)都沒(méi)有魯棒性。當應用于特定實(shí)驗中收集的數據時(shí),這些模型的傳統應用常常遭受“維數災難”的困擾。在特定條件下,一個(gè)實(shí)驗人員可以就一個(gè)生物體產(chǎn)生超過(guò)12,000個(gè)測量值(維度)的基因組學(xué)、轉錄組學(xué)和蛋白質(zhì)組學(xué)數據。對于這樣一個(gè)實(shí)驗,標記實(shí)例的數量(例如,成功或失?。┩ǔW疃嘀挥袔资綆装賯€(gè)。對于這些高維數據類(lèi)型,很少捕捉到系統的動(dòng)態(tài)(時(shí)間分辨率)。這些測量誤差使得對復雜的動(dòng)態(tài)系統進(jìn)行推斷成為一個(gè)重大挑戰。
圖片圖注:維數災難
組學(xué)數據與其他數據模式(如順序數據、文本數據和基于網(wǎng)絡(luò )的數據)既有相似之處,也有不同之處,而經(jīng)典方法并不總是適用。這些數據相同的特征包括位置編碼和依賴(lài)關(guān)系,以及復雜的交互模式。然而這些數據之間也有一些基本的差異,如:它們的潛在表征,有意義分析所需的背景,以及跨模態(tài)的相關(guān)標準化以進(jìn)行生物學(xué)上有意義的比較。因此,很難找到有魯棒性的生成模型(類(lèi)似于高斯模型或隨機塊模型)可以準確地描述組學(xué)數據。
此外,生物序列和系統代表了復雜的生物功能編碼,但很少有系統的方法以類(lèi)似解釋語(yǔ)義或從書(shū)面文本上下文的方式來(lái)解釋這些編碼。這些不同的特征使得通過(guò)數據探索提取見(jiàn)解、生成和驗證假設具備挑戰性。工程生物學(xué)涉及到學(xué)習黑盒系統的挑戰,我們可以觀(guān)察輸入和輸出,但我們對系統內部工作的了解有限??紤]到這些生物系統運行在組合的大參數空間中,人工智能解決方案使用策略有效地設計實(shí)驗以探索生物系統,從而產(chǎn)生各種假設并進(jìn)行驗證,等于是在這個(gè)空間中提出了巨大的需求和機會(huì ) 。
最后,許多流行的AI算法解決方案沒(méi)有明確地考慮不確定性,也沒(méi)有顯示出在輸入擾動(dòng)下控制誤差的魯棒機制??紤]到我們正在嘗試設計的生物系統中固有的隨機性和噪聲,這種基本差距在合成生物空間中尤其重要。
指標/評估的挑戰?;陬A測和準確性的標準AI評價(jià)指標不足以應用在合成生物學(xué)領(lǐng)域中。像?這樣的回歸模型或基于分類(lèi)模型的準確性的度量標準不能解釋我們試圖建模的潛在生物系統的復雜性。在這個(gè)領(lǐng)域中,量化一個(gè)模型能夠闡明生物系統內部工作和獲取現有領(lǐng)域知識的其他指標也同樣重要。為此,包含可解釋性和透明度原則的人工智能解決方案是支持迭代和跨學(xué)科研究的關(guān)鍵。此外,對于恰當地量化不確定性的能力,我們需要創(chuàng )造性地開(kāi)發(fā)新的指標來(lái)衡量這些方法的有效性。
我們還需要適當的實(shí)驗設計指標。評估和驗證合成生物學(xué)中的模型有時(shí)需要額外的實(shí)驗和額外的資源。少量的分類(lèi)錯誤或小錯誤可能會(huì )對研究目標產(chǎn)生重大影響。這些成本應整合到人工智能模型的目標函數或評估中,以反映誤分類(lèi)對現實(shí)世界的影響。
社會(huì )學(xué)的挑戰。在利用人工智能與合成生物學(xué)結合的方面,社會(huì )學(xué)方面的問(wèn)題可能比技術(shù)障礙更具挑戰性(反之亦有可能)。我們的印象是,研究當中所涉及的完全不同的文化之間缺乏協(xié)調和理解,因此會(huì )導致一些社會(huì )學(xué)方面的障礙。雖然已經(jīng)已經(jīng)有些辦法能解決這種障礙,但有趣的是,學(xué)術(shù)界和工業(yè)界仍然存在一些曠日持久的社會(huì )學(xué)問(wèn)題。
之所以會(huì )出現社會(huì )問(wèn)題,是因為兩個(gè)非常不同群體的專(zhuān)家:計算科學(xué)家和實(shí)驗室科學(xué)家在工作中碰撞摩擦,產(chǎn)生了一定的分歧。
計算科學(xué)家和實(shí)驗室科學(xué)家接受的訓練不同之處太多。經(jīng)過(guò)訓練的計算科學(xué)家傾向于專(zhuān)注于抽象、熱衷于自動(dòng)化、計算效率和顛覆性方法。他們自然傾向于任務(wù)專(zhuān)門(mén)化,并想方設法將重復性任務(wù)丟給自動(dòng)化計算機系統去做。而實(shí)驗室科學(xué)家都很實(shí)際,他們接受過(guò)具體觀(guān)察的訓練,更喜歡通過(guò)可解釋的分析來(lái)準確描述實(shí)驗的具體結果。
圖片圖注:計算科學(xué)家和實(shí)驗室科學(xué)家來(lái)自不同的研究文化背景,他們必須學(xué)會(huì )共同協(xié)作,才能從人工智能和合成生物結合中充分受益。
這兩個(gè)世界有著(zhù)不同的文化,這不僅反映在這兩部分人如何解決問(wèn)題,也反映在他們認為哪些問(wèn)題值得解決。
例如,致力于建設支持通用研究的基礎設施,與致力于研究特定研究問(wèn)題的努力之間一直很緊張。計算科學(xué)家傾向于提供可用于各種項目的可靠基礎設施,而實(shí)驗科學(xué)家往往專(zhuān)注于最終目標。計算科學(xué)家喜歡開(kāi)發(fā)數學(xué)模型來(lái)解釋和預測生物系統的行為,而實(shí)驗室科學(xué)家喜歡產(chǎn)生定性的假設,并盡快通過(guò)實(shí)驗來(lái)檢驗這些假設(至少在研究微生物時(shí),因為這些實(shí)驗可以在3-5天內很快完成)。
此外,計算機科學(xué)家們往往只對一些虛高的目標感到興奮,比如生物工程生物對火星、生活寫(xiě)編譯器能夠創(chuàng )建DNA來(lái)滿(mǎn)足所需的規范,重建樹(shù)采取所需的形狀,生物工程龍在現實(shí)生活中,或者用人工智能取代科學(xué)家。實(shí)驗室的科學(xué)家們則認為這種目標純屬“炒作”,因為之前的案例中,計算類(lèi)型承諾了許多,卻沒(méi)有兌現,他們寧愿只考慮使用當前的技術(shù)狀態(tài)可以實(shí)現的目標。
解決社會(huì )的挑戰。解決這些社會(huì )學(xué)問(wèn)題的方法是去鼓勵跨學(xué)科的團隊和需求。雖然我們不能否認,在公司(團隊一榮俱榮一損俱損)中實(shí)現這種包容的環(huán)境可能比在學(xué)術(shù)環(huán)境中更容易,因為在學(xué)術(shù)環(huán)境中一個(gè)研究生或博士后往往是發(fā)表了幾篇第一作者論文就宣稱(chēng)成功了,而不需要與其他學(xué)科進(jìn)行整合。
實(shí)現這種整合的一種可能的方式是開(kāi)辦交叉培訓課程,讓實(shí)驗室科學(xué)家接受編程和機器學(xué)習的培訓,讓計算科學(xué)家接受實(shí)驗培訓。這樣就能給兩個(gè)社區都帶來(lái)一些有價(jià)值的、獨特的、必要的文化交流。大家越早發(fā)現這一點(diǎn),合成生物學(xué)就能發(fā)展得越快。
從長(cháng)遠來(lái)看,我們需要將生物和生物工程的教學(xué)與自動(dòng)化和數學(xué)相結合的大學(xué)課程。雖然目前有一些學(xué)校正在開(kāi)辦這樣的課程,但目前只是杯水車(chē)薪而已。


觀(guān)點(diǎn)和機會(huì )

人工智能可以從根本上增強合成生物學(xué),還能通過(guò)為工程階段空間增加第三個(gè)軸,比如物理、化學(xué)或者生物,從而使其充分發(fā)揮影響力。最明顯的是,人工智能可以在生物工程結果中產(chǎn)生準確的預測,從而實(shí)現有效的逆向設計。
此外,人工智能還可以支持科學(xué)家設計實(shí)驗,并選擇何時(shí)何地采樣,而目前這一問(wèn)題需要訓練有素的專(zhuān)家來(lái)解決。人工智能還可以支持自動(dòng)搜索、高吞吐量分析和基于大數據源的假設生成,這些數據源包括歷史實(shí)驗數據、在線(xiàn)數據庫、本體和其他技術(shù)材料。
人工智能可以允許合成生物學(xué)領(lǐng)域專(zhuān)家更快地探索大型設計空間,并提出一些有趣的“跳出框框”的假設,從而增加專(zhuān)家們的知識。合成生物學(xué)為當前的人工智能解決方案提出了一些獨特的挑戰,如果這些挑戰得到解決,將使得合成生物學(xué)和人工智能領(lǐng)域得到根本性進(jìn)步。設計生物系統本質(zhì)上依賴(lài)于控制系統的能力,這是對系統基本規律理解的終極考驗。因此,能夠實(shí)現合成生物研究的人工智能解決方案必須能夠描述能夠做到最佳預測的機制。
盡管最近基于深度學(xué)習架構的人工智能技術(shù)已經(jīng)改變了我們對特征工程和模式發(fā)現的看法,但就推理和解釋其學(xué)習機制的能力而言,它們仍處于起步階段。
因此,結合因果推理、可解釋性、魯棒性和不確定性估計需求的人工智能解決方案在這一跨學(xué)科領(lǐng)域具有巨大的潛在影響。生物系統的復雜性使得純粹基于蠻力關(guān)聯(lián)發(fā)現的人工智能解決方案無(wú)法有效地描述系統的內在特征。將物理和機械模型與數據驅動(dòng)模型順利地結合起來(lái)的一類(lèi)新算法是一個(gè)令人興奮的新研究方向。目前我們在氣候科學(xué)和計算化學(xué)方面看到了一些初步的積極成果,希望在生物系統研究方面也能取得類(lèi)似的進(jìn)展。
由于人工智能提供了修改生物系統的工具,合成生物學(xué)還可以反過(guò)來(lái)激發(fā)新的人工智能方法。生物學(xué)啟發(fā)了諸如神經(jīng)網(wǎng)絡(luò )、遺傳算法、強化學(xué)習、計算機視覺(jué)和群體機器人等人工智能的基本要素。事實(shí)上,有許多生物現象可以用也值得用數字技術(shù)來(lái)模擬的。例如,基因調控涉及到一個(gè)精巧的相互作用網(wǎng)絡(luò ),它不僅允許細胞感知環(huán)境并對環(huán)境作出反應,而且還保持細胞的存活和穩定。保持體內平衡(由生命系統維持的穩定的內部、物理和化學(xué)條件的狀態(tài))涉及到在適當的時(shí)間、適當的數量產(chǎn)生適當的細胞成分,感知內部梯度,并小心地調節細胞與環(huán)境的交換。我們能不能理解并利用這種能力來(lái)生產(chǎn)真正自我調節的人工智能或機器人呢?
另一個(gè)例子涉及緊急屬性(即,由系統顯示但不由其組成部分顯示的屬性)。例如,蟻群的行為和反應是一個(gè)單一的有機體,不僅僅是單個(gè)螞蟻的總和。類(lèi)似地,意識(即,對內部或外部存在的感知或意識)是一種來(lái)自物理基礎(比如神經(jīng)元)的定性特征。自組織和集體建造結構的群機器人已經(jīng)存在。我們能不能用涌現的一般理論來(lái)創(chuàng )造機器人和生物系統的混合體呢?我們能從一個(gè)完全不同的物理基質(zhì),比如晶體管中創(chuàng )造意識嗎?最后一個(gè)可能的例子涉及自我修復和復制:即使是最簡(jiǎn)單的生命例子也顯示出自我修復和復制的能力。我們能理解這種現象產(chǎn)生自我修復和復制的人工智能的困境嗎?
雖然這種生物模擬以前就有人考慮過(guò),但“合成生物”的美妙之處在于,它為我們提供了“修補”生物系統的能力,以測試生物模擬的模型和基本原理。例如,我們現在可以在基因組規模上修補細胞基因調控,對其進(jìn)行修改,并測試到底是什么導致了其非凡的韌性和適應性?;蛘呶覀兛梢詫ξ浵佭M(jìn)行生物工程,測試隨后會(huì )發(fā)生什么樣的蟻群行為,以及這種行為如何影響螞蟻的存活率?;蛘呶覀兛梢愿淖兗毎淖晕倚迯秃妥晕覐椭茩C制,測試長(cháng)期進(jìn)化對其競爭能力的影響。
此外,在細胞建模中,我們能夠很好地理解所涉及的生物機制。就算了解了神經(jīng)網(wǎng)絡(luò )如何檢測眼睛的形狀,也不太可能就明白大腦是怎么做同樣的事情的,但合成生物學(xué)的研究不一樣。機械模型的預測并不完美,但產(chǎn)生了質(zhì)量上可以接受的結果。將這些機制模型與ML的預測能力相結合,可以幫助彌合兩者之間的差距,并提供生物學(xué)上的見(jiàn)解,解釋為什么某些ML模型在預測生物行為方面比其他模型更有效。這種見(jiàn)解可以引導我們研究新的ML體系結構和方法。
人工智能可以幫助合成生物,合成生物也可以反過(guò)來(lái)幫助人工智能,這兩個(gè)學(xué)科在持續反饋循環(huán)中的相互作用,將創(chuàng )造我們現在不能想象的未來(lái),就像本杰明·富蘭克林也無(wú)法想象他對電的發(fā)現,在未來(lái)有一天會(huì )使互聯(lián)網(wǎng)成為可能。
原文鏈接:https://cacm.acm.org/magazines/2022/5/260341-artificial-intelligence-for-synthetic-biology/fulltext#R2

*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>