清華學(xué)者主導干濕結合“下一代細胞工廠(chǎng)”開(kāi)源使能平臺問(wèn)世!數據驅動(dòng)全基因組基因型-工業(yè)表型關(guān)聯(lián)技術(shù),賦能合成生物學(xué)高效底盤(pán)細胞設計
1976 年 1 月的一天,一位年輕的風(fēng)險投資人和一位微生物學(xué)教授走進(jìn)了加州大學(xué)舊金山分校(UCSF)附近的酒吧,原定十分鐘的會(huì )面時(shí)間延長(cháng)到了三個(gè)小時(shí)。從那一刻起,一家改變生物技術(shù)史的公司就此誕生。他們使用 GENetic ENgineering TECHnology 的縮寫(xiě)命名了這家公司——Gen-en-tech(基因泰克)。

圖丨Genentech 的聯(lián)合創(chuàng )始人赫伯特·博耶(Herbert Boyer)博士(左)和風(fēng)險投資人羅伯特·斯萬(wàn)森(Robert A.Swanson)先生(右)(來(lái)源:資料圖)
Genentech 公司首次成功地將人胰島素的 DNA 重組到大腸桿菌細胞內的質(zhì)粒上,讓大腸桿菌作為細胞工廠(chǎng)生產(chǎn)出重組人胰島素,并將其產(chǎn)品化。從此,正式拉開(kāi)了基因工程的序幕。
然而,四十多年過(guò)去了,人們在技術(shù)層面上重組表達胰島素,幾乎只做了一件事——把外源的 DNA 放進(jìn)細胞,讓這個(gè)基因轉錄成 RNA,翻譯成蛋白質(zhì),然后再?lài)@著(zhù)該外源 DNA 的表達翻譯效率做些工程化改造。
蛋白要在宿主細胞中高效表達,其實(shí)不僅是信息傳遞。原料供應、肽鏈延長(cháng)、翻譯后修飾,折疊、分泌乃至應急修復等,諸多環(huán)節都有可能影響到蛋白表達的效率。
“要讓細胞這臺精巧的蛋白質(zhì)‘3D 打印機’高效率運轉,在全基因組層面有大量的基因發(fā)揮著(zhù)不可或缺作用。然而,盡管我們在基礎研究的層面認識到這件事,但是,到工程層面上,還很難做到全基因組層面的工程化以提升細胞的蛋白表達效率,我們目前的認識還很淺?!鼻迦A大學(xué)張翀教授表示。
張翀是清華大學(xué)長(cháng)聘副教授,國家級青年人才計劃獲得者,主要研究方向為微生物智能制造,開(kāi)展高通量基因型-表型關(guān)聯(lián)原創(chuàng )技術(shù)與裝備的研究,包括微生物工業(yè)表型高通量表征與連續進(jìn)化,全基因組規?;蚣拔稽c(diǎn)功能挖掘,基因型與工業(yè)表型關(guān)聯(lián)研究裝備等。

圖丨張翀(來(lái)源:張翀)
迄今為止,細胞工廠(chǎng)已能夠生產(chǎn)抗生素、氨基酸、重組蛋白、生物能源、生物塑料乃至“人造肉”,被廣泛地應用在生物制造、制****、食品、能源和農業(yè)等領(lǐng)域。
但是,與重組胰島素合成的案例一樣,目前人們對外源途徑改造較多,但對全基因組層面底盤(pán)細胞本身了解較少,進(jìn)而制約了對其系統化工程改造的能力,細胞底盤(pán)自身的潛能還沒(méi)有被系統地挖掘。
如果把外源途徑的基因序列比作圖紙,把細胞比作車(chē)間,那么,現有的努力大多是在“圖紙”上下功夫,但是仍然十分缺乏對“車(chē)間”全局的系統認知和工程化改造的能力。
從隨機誘變到全基因組定制,多項技術(shù)催生底盤(pán)細胞“發(fā)現新大陸”

合成生物學(xué)細胞工廠(chǎng)構建的核心是如何通過(guò)設計合適的基因型,從而得到人們想要的工業(yè)表型。張翀教授認為,在基因組時(shí)代,科學(xué)家可通過(guò)各類(lèi)公開(kāi)生物學(xué)數據庫得到大量的基因型相關(guān)的測試數據,但是,真正有價(jià)值的是能得到與工業(yè)表型關(guān)聯(lián)的基因型數據。

圖丨合成生物學(xué)常關(guān)注的工業(yè)表型(來(lái)源:該團隊)
隨著(zhù)分子生物學(xué)和基因工程研究方法的不斷發(fā)展,細胞工廠(chǎng)的構建策略經(jīng)歷了不同的歷史階段。相較于早期主要通過(guò)非理性誘變育種技術(shù)獲得目標產(chǎn)物高產(chǎn)菌株的方式,20 世紀 90 年代以來(lái),隨著(zhù)分子生物學(xué)、基因工程技術(shù)的逐步引入,代謝工程學(xué)科正式創(chuàng )立。
代謝工程利用重組 DNA 技術(shù)對生物體中已知的代謝途徑進(jìn)行有目的的設計,并對細胞內的基因網(wǎng)絡(luò )進(jìn)行調控和優(yōu)化,構建具有特定功能的細胞工廠(chǎng),例如提高目的產(chǎn)物的產(chǎn)率。
然而,代謝工程指導的設計方法大多都基于已知的生物學(xué)知識,由于微生物代謝網(wǎng)絡(luò )中存在諸多可能對目標產(chǎn)物工業(yè)表型產(chǎn)生影響的未知因素,或稱(chēng)為“生命暗物質(zhì)”。這一手段獲取新知識的效率不高,細胞工廠(chǎng)改造過(guò)程仍然需要耗費大量的時(shí)間和精力。

圖丨細胞工廠(chǎng)設計和構建發(fā)展歷程與展望 (來(lái)源:該團隊)
那么,為了讓讓細胞工廠(chǎng)的設計更高效,如何去解析這些“生命暗物質(zhì)”呢?
“通過(guò)自有的技術(shù)平臺從全基因組層次并行研究微生物特定工業(yè)表型與基因型的關(guān)系,從而獲得大規模的基因型-工業(yè)表型關(guān)聯(lián)(genotype phenotype associations,GPA)數據集?!睆埩埍硎?。
“近年來(lái),高通量 DNA 合成成本的降低、基因編輯技術(shù)和二代測序技術(shù)的飛躍、高通量檢測技術(shù)的成熟等多項技術(shù)的發(fā)展讓大規模的 GPA 數據集的挖掘成為可能。這些新挖掘的數據將成為基因組層面的‘新大陸’?!彼f(shuō)。
“新大陸”指的是新發(fā)現的跟目的工業(yè)表型相關(guān)聯(lián)的基因位點(diǎn),例如他們發(fā)現很多意外的、和蛋白質(zhì)合成有關(guān)系的位點(diǎn),比如氧化應激(Oxidative Stress)對蛋白質(zhì)合成有積極的幫助等。
“基于全基因組規模關(guān)聯(lián)圖譜獲取新知識并驗證其工業(yè)價(jià)值后,再在底盤(pán)上進(jìn)行系統工程改造,將為系統提升細胞工廠(chǎng)效率提供一條‘發(fā)現-工程’相結合的全新路徑。”張翀說(shuō)。
通過(guò)超高通量、快速、低成本的技術(shù)“三部曲”、實(shí)現全基因組規?;蛐?工業(yè)表型關(guān)聯(lián)位點(diǎn)挖掘

張翀團隊已經(jīng)成熟打造了一套技術(shù)平臺,通過(guò)該平臺,可進(jìn)行超高通量、快速、低成本地對全基因組規模進(jìn)行 GPA 數據集的挖掘。
該平臺的背后有三個(gè)核心技術(shù)的支撐,分別為:CRISPR 全基因組編輯技術(shù)、超高通量液滴微流控單克隆培養篩選一體化技術(shù)和合成生物傳感技術(shù)。

圖丨全基因組規模 CRISPR 基因干擾文庫(來(lái)源:該團隊)
第一,CRISPR 全基因組編輯技術(shù)。該團隊針對典型的工業(yè)宿主建立了細胞全基因組規??蛇_百萬(wàn)量級 CRISPR 基因干擾文庫。這里的“干擾”,指的是把底盤(pán)細胞的基因敲低或激活,甚至進(jìn)行基因編輯[1,2,3]。
張翀表示,在該平臺通過(guò) CRISPR 編輯技術(shù)實(shí)現了“高版本”的基因型突變。這里的“高版本”是因其具備可定制、可追蹤兩大特點(diǎn)。也就是說(shuō),科學(xué)家可在任意位點(diǎn)設計 sgRNA 的干擾或編輯,并且,在表型變化后,不用測全基因組即可追蹤 sgRNA 的具體位置。
據悉,目前該團隊已有多種成熟工業(yè)底盤(pán)細胞全基因組編輯細胞文庫,并獨立開(kāi)發(fā)了全基因組 sgRNA 文庫設計軟件與 web 應用程序。

圖丨全基因組 sRNA 文庫設計軟件工具開(kāi)發(fā)流程(來(lái)源:該團隊)
第二,自主研發(fā)具有百萬(wàn)通量級篩選能力的液滴微流控細胞培養及篩選一體化技術(shù)。張翀團隊結合微流控技術(shù)和光電傳感與控制及自動(dòng)化技術(shù)開(kāi)發(fā)的“微生物微液滴培養技術(shù) ”,可實(shí)現皮升、納升、微升級多種體積規模下的微生物液滴平行培養、生長(cháng)曲線(xiàn)測定和適應性進(jìn)化。
該平臺采用集成式單克隆培養,單次單克隆數量可超 106 個(gè),與傳統方法相比,培養成本降低約 1000 倍 。并且,該平臺可自動(dòng)換液,細胞生長(cháng)狀態(tài)高度均一 ,適宜多種成熟工業(yè)微生物生長(cháng)[4]。
張翀指出,通過(guò)環(huán)境條件的控制,液滴內微生物可能實(shí)現“工業(yè)相似性”培養?!斑@相當于實(shí)現了文庫獨立的基因型轉變?yōu)楠毩⒌姆磻?,讓它生長(cháng)出可獲取的目標表型?!?/span>

圖丨超高通量液滴微流控單克隆培養篩選一體化平臺(來(lái)源:該團隊)
第三,自主研發(fā)的高靈敏、毫秒級響應合成生物傳感器。通常,對百萬(wàn)個(gè)皮升級液滴的表型進(jìn)行測試,會(huì )采用定向的光學(xué)技術(shù),尤其是熒光技術(shù)。為此,該團隊建立了一系列針對蛋白質(zhì)、小分子濃度定量測試的合成生物熒光傳感技術(shù)[5,6,7]。
通過(guò)該技術(shù),可將目標分子濃度定量地轉化成熒光信號,其靈敏度高、響應速度快,與百萬(wàn)量級通量的液滴微流控系統完全兼容,為目的代謝物表型-基因型關(guān)聯(lián)圖譜的繪制奠定基礎。

圖丨蛋白產(chǎn)量與折疊生物傳感器模型(來(lái)源:該團隊)
干濕結合的中心化實(shí)驗室,整合數據孤島,打造國內首個(gè)合成生物學(xué)數據開(kāi)源使能平臺

目前,生物科學(xué)領(lǐng)域所使用的數據庫,例如 NCBI、KEGG、PDB 等,都是靠科學(xué)家團隊供應離散式數據集成形成的,其主要還是科學(xué)屬性的數據庫?!?strong style=";padding: 0px;outline: 0px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important">設想如果我們手頭擁有海量工業(yè)需求驅動(dòng)的 GPA 數據庫,這樣就掌握著(zhù)設計高效細胞工廠(chǎng)的核心原始數據。”張翀說(shuō)。
他指出,從行業(yè)內部來(lái)看,合成生物學(xué)雖然潛力巨大,但是技術(shù)發(fā)展得很早期,還有很多問(wèn)題需要解決。合成生物學(xué)是個(gè)兼具科學(xué)屬性與工程屬性的交叉學(xué)科,但是現階段,科學(xué)屬性仍然較重,工程化較弱。尤其是學(xué)術(shù)界,很多研發(fā)的方式還停留在“手工作坊”階段。
張翀認為,通過(guò)自動(dòng)化和高通量技術(shù)讓科學(xué)家做實(shí)驗的過(guò)程變成中心平臺化的形式,以此來(lái)促進(jìn)合成生物學(xué)從科學(xué)屬性向工程屬性轉移。一旦把這個(gè)鏈條打通,未來(lái)合成生物學(xué)就變成了純粹的信息科學(xué)和數據科學(xué)的問(wèn)題。
從生物制造領(lǐng)域來(lái)看,細胞工廠(chǎng)設計是未來(lái)的發(fā)展趨勢,從現在離散式的個(gè)人實(shí)驗室變成中心化實(shí)驗室平臺,從分布式的數據向集成的大規模數據生產(chǎn),這種高度標準化、高質(zhì)量的數據為最后演變?yōu)锳I驅動(dòng)的設計提供了極大的可能性。
如果能夠利用大規模 GPA 數據集,基于數據科學(xué)手段從全基因組范圍深度挖掘傳統分子生物學(xué)手段無(wú)法發(fā)現的未知關(guān)聯(lián)基因及其位點(diǎn),將有可能從數據學(xué)習的角度繞開(kāi)理性設計的知識瓶頸,為提高細胞工廠(chǎng)設計和創(chuàng )建效率提供全新的研究范式。
此外,由于大規模 GPA 數據集搜索范圍更寬(全基因組),不依賴(lài)于現有知識,將有可能探索之前理性/半理性所無(wú)法達到的表型“高地”,獲得生產(chǎn)效率更為高效、生產(chǎn)性能更加優(yōu)越的下一代定制化細胞工廠(chǎng)。
對于該平臺,張翀團隊對其規劃不僅限于對科學(xué)家的單點(diǎn)服務(wù),還計劃逐漸實(shí)行學(xué)術(shù)端開(kāi)源,助力多維度合成生物學(xué)的數據標準化。以高通量基因型-工業(yè)表型關(guān)聯(lián)圖譜數據驅動(dòng) AI 解析細胞工廠(chǎng),打造合成生物數據使能平臺。
該平臺用工程手段推進(jìn)科學(xué)研究升級,將輔助科學(xué)家實(shí)現技術(shù)轉化,并銜接行業(yè)上下游。當平臺發(fā)展到一定程度,便會(huì )積累較高的產(chǎn)業(yè)化勢能,將來(lái)會(huì )有多種產(chǎn)業(yè)化的可能性。
“科學(xué)家通過(guò)提需求,確認想要做的菌株以及表型后,我們來(lái)幫他做實(shí)驗,再將結果反饋給科學(xué)家。同時(shí),我們希望把數據沉淀到平臺,同時(shí)開(kāi)放地讓學(xué)術(shù)貢獻共同獲取,并驗證它的應用價(jià)值。未來(lái),這會(huì )成為若干工業(yè)表型圖設計的核心驅動(dòng)力?!睆埩堈f(shuō)。
據悉,該團隊已與國內重點(diǎn)高校相關(guān)實(shí)驗室建立廣泛合作,如清華大學(xué)、天津大學(xué)、華東理工大學(xué)、上海交通大學(xué)、江南大學(xué)、中科院上海植生所等。同時(shí),張翀正在為該平臺進(jìn)行技術(shù)授權及產(chǎn)業(yè)化落地,目前已在籌備成立相關(guān)公司并組建技術(shù)研發(fā)團隊,張翀教授出任首席科學(xué)家。
對該平臺的未來(lái)發(fā)展,張翀充滿(mǎn)期待,他稱(chēng):“我相信擁有數據的核心資源,也就掌握了細胞工廠(chǎng)設計的核心信息,我們希望這類(lèi)關(guān)鍵數據庫生根在中國,并服務(wù)于中國本土的科研與產(chǎn)業(yè)?!?/span>
-End-

*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。
linux操作系統文章專(zhuān)題:linux操作系統詳解(linux不再難懂)