天津2023年3月28日 /美通社/ -- 2023年3月28日,中國科學(xué)院天津工業(yè)生物技術(shù)研究所(以下簡稱天津工業(yè)生物所)與亞馬遜云科技聯(lián)合在天津舉辦"生物計算設(shè)計"溝通會,就BT+IT結(jié)合助力合成生物學(xué)發(fā)展的現(xiàn)狀和未來進行溝通交流。
天津工業(yè)生物所是中國合成生物學(xué)領(lǐng)域的核心力量,由中國科學(xué)院和天津市人民政府共建,牽頭組織承擔(dān)了多項合成生物學(xué)、綠色生物制造等重點研發(fā)計劃任務(wù)。2019年,天津工業(yè)生物所成立了生物設(shè)計中心平臺實驗室,并圍繞生物計算設(shè)計,開始與亞馬遜云科技共同探索生物技術(shù)和信息技術(shù)相結(jié)合(BT+IT)技術(shù)體系,以進一步推動合成生物學(xué)發(fā)展,以期能夠為在健康、能源、農(nóng)業(yè)和環(huán)境等領(lǐng)域的重大突破提供技術(shù)支撐。至今已推出了全球首個基于圖數(shù)據(jù)庫的大腸桿菌調(diào)控代謝關(guān)系知識圖譜ERMer和全流程高通量編輯序列設(shè)計云平臺AutoESD等20多項生物計算設(shè)計工具和軟件應(yīng)用。云原生的開發(fā)方式較傳統(tǒng)方式大幅縮短開發(fā)時間,總體運行成本大幅降低,使得團隊可以專注于業(yè)務(wù)代碼和創(chuàng)新。
圖數(shù)據(jù)庫助力構(gòu)建專業(yè)大腸桿菌調(diào)控代謝知識圖譜,提升科研效率
細胞中的代謝調(diào)控非常復(fù)雜,一個特定的細胞功能往往由一系列不同類型的代謝途徑調(diào)控相互作用決定。通常不同類型的調(diào)控數(shù)據(jù)散落在各個不同的數(shù)據(jù)庫,生物學(xué)家很難通過僅關(guān)注與所研究的代謝物/蛋白質(zhì)密切相關(guān)的一兩類相互作用來識別這種復(fù)雜調(diào)控級聯(lián)關(guān)系。因此,將這些不同類型的調(diào)控相互作用匯集在一起,并提供方便的交互方式,將極大的方便生物學(xué)家挖掘和理解生物體內(nèi)的復(fù)雜調(diào)控關(guān)系。天津工業(yè)生物所生物設(shè)計中心團隊聯(lián)合亞馬遜云科技團隊在計算生物學(xué)國際期刊Nucleic Acids Research上發(fā)表文章,發(fā)布了全球首個基于圖數(shù)據(jù)庫Amazon Neptune的大腸桿菌調(diào)控代謝關(guān)系知識圖譜ERMer,首次提供了全局的代謝調(diào)控圖譜,并通過可視化框架實現(xiàn)了豐富的搜索功能,如多步查詢、最短路徑查詢等。ERMer采用專門為高度關(guān)聯(lián)的復(fù)雜數(shù)據(jù)集的高效存儲和查詢設(shè)計圖數(shù)據(jù)庫架構(gòu),這打破了傳統(tǒng)的低效數(shù)據(jù)檢索方式,有效增強用戶和圖譜的人機交互,大大降低了使用門檻。
為充分發(fā)揮知識圖譜的價值,生物設(shè)計中心團隊還進一步采用基于圖神經(jīng)網(wǎng)絡(luò)技術(shù)進行推理,成功實現(xiàn)了轉(zhuǎn)錄因子預(yù)測和轉(zhuǎn)錄因子靶點預(yù)測等功能,這將有助于挖掘潛在的關(guān)鍵調(diào)控因子和調(diào)控靶點,構(gòu)建新的調(diào)控代謝網(wǎng)絡(luò),能夠為研究人員提供新的思路和方向。
云原生Serverless應(yīng)用架構(gòu)加速生物計算設(shè)計工具研發(fā)
模塊化、標準化,是所有工程學(xué)科的基礎(chǔ),也是合成生物學(xué)區(qū)別于傳統(tǒng)發(fā)酵行業(yè)的革命。工程學(xué)的可控性,意味著其將能夠與各種軟硬件進行結(jié)合,從而走向自動化與高通量,擺脫過往勞動密集型的研究模式,獲得更高的技術(shù)迭代能力。而對于這個過程,除了針對元件工具以外,將合成生物學(xué)的相關(guān)實驗流程進行模塊化、標準化,也是自動化研究當中不可或缺的一環(huán)。面向微生物遺傳操作,天津工業(yè)生物所生物設(shè)計中心團隊開發(fā)得到了第一個能夠在所有操作類型、任何基因組位點和跨物種上進行精確、自動化和高通量編輯序列設(shè)計的云平臺AutoESD。AutoESD 的開發(fā)采用了基于云端的無服務(wù)器架構(gòu),確保了高可靠性、穩(wěn)健性和可擴展性,能夠在幾分鐘內(nèi)并行處理包含上千個編輯序列設(shè)計目標的數(shù)百個設(shè)計任務(wù)。開發(fā)人員利用Amazon Step Functions實現(xiàn)可視化的工作流管理,實現(xiàn)了編輯序列設(shè)計工作流的串聯(lián),從而實現(xiàn)應(yīng)用的快速構(gòu)建和更新,同時快速查詢處理異常任務(wù);利用Amazon Lambda無服務(wù)計算將不同的引物設(shè)計、同源臂設(shè)計等編輯序列設(shè)計模塊封裝打包,滿足了具體功能的模塊化開發(fā)要求,并方便地對功能模塊進行管理和共享;利用Amazon DynamoDB提供毫秒級的動態(tài)資源響應(yīng)性能,并自動擴展所需資源以應(yīng)對增加的業(yè)務(wù)需求。這些Serverless服務(wù)幫助天津工業(yè)生物所團隊進一步簡化運維,使得開發(fā)人員可以專注于業(yè)務(wù)代碼和創(chuàng)新,與傳統(tǒng)開發(fā)方式相比,開發(fā)時間縮短了75%,總體擁有成本降低高達50%。
未來,天津工業(yè)生物所團隊希望基于亞馬遜云科技先進的服務(wù)技術(shù)和能力,開展更多"BT+IT"的研發(fā)工作,進一步助力研究所在合成生物領(lǐng)域的科研探索。此外,也期望通過亞馬遜云科技的全球科研領(lǐng)域輻射能力,提升天津工業(yè)生物所生物計算設(shè)計方面的國際影響力,為世界各國的合成生物學(xué)科研工作者提供優(yōu)質(zhì)服務(wù)。
天津工業(yè)生物所生物設(shè)計中心主任馬紅武表示:"中國科學(xué)院天津工業(yè)生物技術(shù)研究所肩負著國家工業(yè)生物技術(shù)發(fā)展的重任,并正在加速利用云計算推動相關(guān)技術(shù)的研發(fā)和成果落地。亞馬遜云科技提供的圖數(shù)據(jù)庫和Serverless服務(wù),突破傳統(tǒng)的開發(fā)模式、提升研發(fā)效率、不斷優(yōu)化云上成本,生物技術(shù)和信息技術(shù)相結(jié)合的技術(shù)體系將進一步推動合成生物領(lǐng)域的發(fā)展和創(chuàng)新。"
亞馬遜云科技中國區(qū)商用與公共市場事業(yè)部總經(jīng)理李曉芒表示:"亞馬遜云科技為全球數(shù)千家生命科學(xué)領(lǐng)域客戶提供云服務(wù)和行業(yè)解決方案,助力從實驗室到真實世界,全面加速生命科學(xué)數(shù)字化創(chuàng)新。我們很高興能夠與天津工業(yè)生物所一道,通過云技術(shù)和深厚的行業(yè)實踐推動合成生物學(xué)領(lǐng)域的技術(shù)進步,開拓生物制造產(chǎn)業(yè)的數(shù)字化創(chuàng)新路徑。"