大分子結構預測與計算迎來新“利器”。
9月20日,上海智峪生物科技有限公司(簡稱“智峪生科”)宣布,公司正式推出高通量、高精度、全生態(tài)、全流程生物計算平臺“峪云ZCloud”,以解決大分子結構計算、分子結構模擬、藥物設計、酶工程、大分子設計(包括蛋白、核酸、以及其復合物)等領域內(nèi)計算問題。
此前智峪生科已推出了包括FastAF2、PointSite、Docking、Virtual screening等在內(nèi)的多個服務模塊,累計服務了超過50多家生物科技企業(yè)及學術機構。此次峪云ZCloud的推出則是將公司積累的各類服務模塊進行了一站式生態(tài)整合,實現(xiàn)計算精度和速度工業(yè)數(shù)量級跨越。
對于此次峪云ZCloud發(fā)布,智峪生科首席執(zhí)行官王晟博士表示,“智峪生科在大分子結構計算和設計方面具備專業(yè)性及創(chuàng)新性。我們致力于打造智能化的合成生物設計系統(tǒng),為客戶在復雜、有挑戰(zhàn)性的藥物研發(fā)項目上提供低成本、高效率的一站式解決方案。最終,基于AI的高精度計算服務不止可以輔助新藥分子發(fā)現(xiàn),而且可以部分代替臨床前試驗,讓人工智能真正從研究實驗走向工業(yè)化應用與生產(chǎn)?!?/p>
“目前,中外在AI輔助制藥與合成生物領域基本處于同一起跑線,智峪生科希望將ZCloud打造成為生物科技的‘EDA(集成電路設計軟件)’,自主研發(fā)核心技術,讓當前半導體領域面臨的‘卡脖子’風險不在生物科技領域重現(xiàn)!”王晟表示。
“全生態(tài)、全流程、全好用”
根據(jù)Anfinsen法則,蛋白質(zhì)的氨基酸序列決定其三維結構,同時三維結構又是蛋白質(zhì)行使其生物學功能的基礎,直接關系到人類對疾病成因及治療手段的探索。但由于蛋白質(zhì)的多級結構和復雜的相互作用,使得精確預測三維結構充滿挑戰(zhàn)。
2020年,由DeepMind研發(fā)的AlphaFold2橫空出世,在多數(shù)蛋白質(zhì)單體結構預測中首次達到與實驗誤差接近的準確性,深刻影響了蛋白結構預測以及相關領域。但由于AlphaFold2并未公布訓練代碼,且代碼基于JAX框架與TPU硬件實現(xiàn),高度依賴Google內(nèi)部生態(tài)系統(tǒng),因而對于絕大多數(shù)生物科技企業(yè)及研究者而言,AlphaFold2在使用上具有較大的限制。另一方面,AlphaFold2龐大復雜的模型,致使其數(shù)據(jù)處理與訓練代價高昂,對大多數(shù)研究者來說較難承受。
智峪生科則選擇在AlphaFold2的基礎上進一步全新迭代升級,在保證預測精度的前提下,對各模塊的計算效率做出了大幅度的工業(yè)級別的提升和改進,同時進行全新生態(tài)范式整合,實現(xiàn)蛋白質(zhì)開發(fā)工作與合成生物學的全流程自動化。
始于結構建模,并不意味著止于結構建模。
目前,除了蛋白質(zhì)結構計算外,峪云ZCloud平臺上還提供了多套生物計算領域最前沿算法,涵蓋了大分子設計、分子模擬、自由能計算、藥物分子發(fā)現(xiàn)、序列與結構檢索等諸多領域,以滿足藥物研發(fā)或合成生物學元件設計過程中的序列優(yōu)化、高通量結構預測、結合位點預測、虛擬篩選、自由能微擾等多種應用場景。
這一切并非簡單的堆砌,智峪生科在打造峪云ZCloud平臺的過程中,更專注于打通不同算法之間的使用壁壘,將各個子模塊串聯(lián)為一個完整的、彼此支撐的生態(tài),實現(xiàn)1 1大于2的效果。針對不同的問題,各個模塊可以創(chuàng)造性地任意組合搭配,極大豐富可應用場景。
ZCloud全生態(tài)平臺,來源:智峪生科
在聚合成為生物科技領域“瑞士軍刀”的同時,峪云ZCloud平臺計算的高精度也得到保證。
從高效率高精度的蛋白質(zhì)結構建模fastAF2,到自研的獨樹一幟的高精度大分子(包括蛋白質(zhì)與核酸)設計算法SWORD,再到高精度絕對自由能計算(autoFEP)、高精度結合口袋尋找(PointSite)、和高精度分子對接和篩選(autoLigand)等,ZCloud的多個自研算法在學術機構和制藥企業(yè)的合作項目上已經(jīng)展現(xiàn)出卓越性能。
高精度策略,來源:智峪生科
更貼近研發(fā)者需求的是,峪云ZCloud平臺還著重在操作使用層面進行了優(yōu)化,提供簡易操作的界面與可視化的視圖工具,方便用戶使用。此外,借助“私有云 公有云”的模式,峪云ZCloud平臺打造了從結構出發(fā)、高通量篩選再到先導物優(yōu)化、分子評估推薦以及合成生物學相關模塊的全產(chǎn)業(yè)鏈條,具備面提供安全隱私且大規(guī)模、高通量計算服務的能力。
峪云ZCloud應用效果及模塊效果展示
“全生態(tài)、全流程、全好用,這是我們設計峪云ZCloud時著重想達到的效果,現(xiàn)今基于與藥物研發(fā)相關的合作項目成果來看,基本都得到較好地實現(xiàn)。”王晟博士指出,作為更底層的通用平臺,目前峪云ZCloud已涵蓋了藥物研發(fā)的各個環(huán)節(jié),助力生物醫(yī)藥企業(yè)一鍵完成新藥研發(fā)前的研究工作?!昂罄m(xù)藥企只用參照計算結果,即可順暢完成藥物發(fā)現(xiàn)的工作?!?/p>
值得一提的是,配合智峪生科自研的ZPod一體化”微型“數(shù)據(jù)中心使用,峪云ZCloud的性能還能如虎添翼更上一個臺階。
用戶可以通過采購多個 ZPod 來實現(xiàn)線性擴展以獲取更強大的計算能力,而多個 ZPod 存儲和計算算力的彈性擴容可確保用戶無感知提速。除了軟硬件協(xié)同優(yōu)化的生物化學計算以外,ZPod本身也是一個專業(yè)的HPC 異構集群,它通過使用當前最新的CPU、GPU、網(wǎng)絡和存儲硬件,確保集群的聚合IO、計算、通訊以及線性擴展能力得到最大優(yōu)化。
在智峪生科首席執(zhí)行官王晟博士看來,在峪云ZCloud問世后,通過“AI 大分子建模 高性能計算”的新一代分子設計技術,智峪生科可實現(xiàn)藥物分子設計中精度、效率和成本的大幅度優(yōu)化,為大分子(包括蛋白質(zhì)與核酸)工作與合成生物從學術研究走向工業(yè)化落地奠定堅實的基礎。
基于大分子結構預測引爆生物科技革命
基于優(yōu)異的性能,峪云ZCloud平臺成為生物科技企業(yè)及研發(fā)者一站式實現(xiàn)化合物分子發(fā)現(xiàn)與設計的重要工具。
目前,峪云ZCloud平臺各模塊已被廣泛使用。上線12個月,已經(jīng)有50多家生物科技企業(yè)及學術機構通過峪云ZCloud模塊完成了50多萬個蛋白與核酸結構的預測,并挖掘出了之前未被發(fā)現(xiàn)的新酶,有力的推動了諸如人體健康、猴痘候選疫苗、動物免疫、生物合成制品等現(xiàn)實世界問題研究。
其中,據(jù)公開信息顯示,基于蛋白質(zhì)結構預測,上半年智峪生科就與某知名生物科技公司合作主要聚焦在高端困難蛋白原料和輔助試劑的開發(fā)和生產(chǎn)、與某知名CRO公司則在高通量輔助藥物設計和新藥分子發(fā)現(xiàn)方向展開合作。此前,王晟博士也曾表示,希望通過與產(chǎn)業(yè)方和學術機構的各類合作,基于智峪生科在大分子結構計算和設計方面具備專業(yè)性及創(chuàng)新性,讓“AI 分子設計”落地到實際項目中。
“研究某微生物重要靶點,治療該微生物感染的潛在藥物分子;為ADC藥物尋找最合適的短肽linker;為藥物研發(fā)平臺進行機理解釋和分子優(yōu)化設計……”實際上,峪云ZCloud所蘊藏的潛力還不僅于此。
今年6月,世界衛(wèi)生組織將猴痘的全球公共衛(wèi)生風險評估為中等。短短數(shù)日后,智峪生科即基于峪云ZCloud平臺,發(fā)布了600多個猴痘蛋白質(zhì)組的全蛋白質(zhì)結構預測,并進行了詳實而清晰的蛋白質(zhì)功能注釋,助力世界各地的科學家開展基于蛋白質(zhì)結構的猴痘病毒疫苗和藥物設計工作。該研究結果后續(xù)還被中國工程院院士、傳染病學專家李蘭娟引用。
值得一提的是,基于峪云ZCloud所提供的蛋白質(zhì)結構預測結果,智峪生科已形成了集大分子結構預測、設計和生產(chǎn)的全產(chǎn)業(yè)價值鏈閉環(huán)服務,開始不斷探索和拓寬合成生物學邊界。
一般而言,合成生物學多采用工程學“自下而上”的理念,從系統(tǒng)表征自然界具有催化調(diào)控等功能的生物大分子,使其成為標準化“元件”,到創(chuàng)建“模塊”、“線路”等全新生物部件與細胞“底盤”,構建有各類用途的人造生命系統(tǒng)。
而從基礎來看,合成生物學需要設計和實現(xiàn)各類底層元件,比如催化元件、調(diào)控元件、感應元件和結構元件等。在此方面,智峪生科從未停止探索。除了在核心催化元件(例如酶)的設計與改造上取得了重大突破,ZCloud平臺上的一系列算法已打通了單體核酸(如:RNA)以及蛋白-核酸復合物的結構計算,實現(xiàn)了調(diào)控元件的精準設計。并基于RNA的調(diào)控元件許多重要功能特性,在合成生物學領域進行廣泛探索。此外,通過其標準化和自動化設計,ZCloud平臺也在一定程度上實現(xiàn)合成生物學所許諾的工程設計理念。
按照智峪生科的設想,上游端,依靠強悍的大分子結構預測和設計能力,公司可以根據(jù)客戶的需求解決成藥過程中的痛點難題,也為公司自身合成生物學產(chǎn)品打造繪制了精準的“藍圖”;下游端,公司掌握了包括放大、工藝研發(fā)、菌種設計、代謝工程在內(nèi)的種種生產(chǎn)工藝,依照上游產(chǎn)出的預測及設計結果開啟合成生物學領域布局。
“這些設想都可以基于峪云ZCloud強悍的蛋白質(zhì)結構預測能力得以實現(xiàn),縱覽峪云平臺全生態(tài)循環(huán)加速模式,我們看到,它已經(jīng)將AI帶入了一個工業(yè)化級的落地時代?!睋?jù)王晟透露,面對一個長度為655的蛋白,AlphaFold模型需要耗時11個小時才能完成預測。現(xiàn)在ZCloud平臺下的fastAF2模型僅需6分鐘就能將目標蛋白篩選出來,加速了110倍。
來源:智峪生科ZCloud平臺 fastAF2在線預測(https://cloud.zelixir.com/fastaf2/#/fast-af2)
“這是AI作用于生物學工業(yè)時代的曙光,是一個令人振奮的大分子工業(yè)化突破。相信在未來,智峪生科可以利用ZCloud系統(tǒng)通過新藥發(fā)現(xiàn)與合成生物來改善醫(yī)學、能源、環(huán)境等相關領域,為生物科技,尤其是合成生物學帶來一場看得見的革命!”王晟表示。雷峰網(wǎng) 雷峰網(wǎng)
版權聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 舉報,一經(jīng)查實,本站將立刻刪除。