編輯:桃子 袁榭 拉燕
【新智元導(dǎo)讀】近日,斯坦福大學(xué)研究團隊把人類DNA測序的時間縮短至5小時2分鐘,重新定義了人類基因組測序速度!
DNA測序時間減半,還創(chuàng)下了最新吉尼斯世界紀(jì)錄!
近日,斯坦福大學(xué)研究團隊完成了利用人工智能計算加速工作流程的「DNA巨量測序」技術(shù)。
最新研究已于1月12發(fā)表在《新英格蘭醫(yī)學(xué)雜志》上。
論文地址:https://www.nejm.org/doi/full/10.1056/NEJMc2112090
此研究中處理速度最快的病例樣本僅用了5小時2分鐘就完成測序,從樣本送達(dá)實驗室到診斷的時間是7小時18分鐘。
此前的基因診斷速度世界記錄是14小時。
最快DNA測序:用時5h
為什么說這是一項重大突破?
這么說吧,基因組測序是為了讓醫(yī)生能夠看到病人完整的DNA組成。
從眼睛顏色到遺傳性疾病的這些關(guān)鍵信息對于病人疾病的診斷非常重要。一旦醫(yī)生知道了特定的基因突變,他們就可以制定精準(zhǔn)的治療計劃。
因此,為了加速患者治療進(jìn)程,醫(yī)生就得選擇和時間賽跑。
如果測序基因組的速度越快,患者離開ICU的速度就越快。
與之同時,患者需要的測試次數(shù)減少,康復(fù)的速度變快,還有花在昂貴醫(yī)療上的費用也會縮減。
要知道,之前的DNA測序診斷時間最快的記錄是雷迪兒童醫(yī)院創(chuàng)下的14小時,已堪稱神速。而斯坦福大學(xué)此次的紀(jì)錄又較之快了近倍。
研究項目負(fù)責(zé)人尤安·阿什利教授稱,「當(dāng)下大多數(shù)醫(yī)師提到給患者基因測序、拿到結(jié)果,數(shù)周內(nèi)就算快了?!?/span>
這項研究由斯坦福大學(xué)醫(yī)學(xué)院醫(yī)學(xué)、遺傳學(xué)和生物醫(yī)學(xué)數(shù)據(jù)科學(xué)教授尤安·阿什利博士領(lǐng)導(dǎo),與 英偉達(dá)、谷歌等機構(gòu)合作。
在這項研究中,研究小組在斯坦福大學(xué)醫(yī)院的重癥監(jiān)護(hù)病房中對未確診的患者進(jìn)行了加速基因組測序技術(shù)的測試。
從2020年12月—2021年5月,共招募了12名患者參加測試。其基因組測序流程如下:
超快速基因組測序流程
在12個提供基因樣本的病患中,有5個是當(dāng)天拿到結(jié)果,其他的都是病因非基因性質(zhì)。斯坦福研究團隊42%的確診率高于病因難以發(fā)現(xiàn)的30%疑難病確證率。
最初,研究人員在5名患者中獲得了初步的基因診斷,從血樣送到實驗室到最初診斷的最短時間是7小時18分鐘。
同時,5名患者在基因診斷治療后得到了迅速的恢復(fù)。
上端深色塊區(qū)域代表5名最先診斷出結(jié)果的患者,患者11用時最短
測試對象中包括一名3個月大的癲癇新生兒,病因在例行的醫(yī)院儀器檢測中無法發(fā)現(xiàn)。研究團隊在接到樣本的8小時25分鐘之內(nèi)發(fā)現(xiàn)了致病的基因異常,而同時送交普通基因測序機構(gòu)的結(jié)果是在兩周后才能得出。
還有一名13歲的心衰竭患者,其癥狀曾被誤診為新冠肺炎。研究團隊也在數(shù)小時內(nèi)標(biāo)定了導(dǎo)致其心肌異常的基因變異,讓他在21天內(nèi)換上了健康的移植心臟。
論文作者之一、博士后約翰·果津斯基在個人推特上說,「這將完全改變危重病人確診遺傳病的現(xiàn)有方式,為醫(yī)護(hù)業(yè)帶來以前只有夢見的新標(biāo)準(zhǔn)?!?/span>
成本低至3萬
在確定患者1的診斷之后,科學(xué)家便更新了生物信息學(xué)框架,將原始信號數(shù)據(jù)實時傳輸?shù)皆拼鎯χ?,并將?shù)據(jù)分布到多臺云計算機上,以實現(xiàn)接近實時的樣本呼叫和對齊。
這一步將測序后運行時間減少了93% 。
在有的病例樣本處理過程中,研究團隊的平均基因測序速度達(dá)到了每分鐘1.8G數(shù)據(jù)的速度,也就是1分鐘45秒內(nèi)測完一個人體基因組,這是前所未有的速度。
12名患者診斷過程每個階段花費的時間
提速需要更新硬件。斯坦福大學(xué)的測序小組使用了牛津納米孔技術(shù)公司制造的一種新機器,該機器帶48個測序單元,也稱為流動槽。
斯坦福研究團隊的新方法是在使用新分析機時,用所有流動槽同時處理同一個病患的樣本。
這種極限運行方法獲得了大成效。老實說成效差點太大。每小時173-236G的數(shù)據(jù)量、94%的比對認(rèn)定率、最高超過60倍的顯子組覆蓋度(對顯性常染色體數(shù)據(jù)的讀取次數(shù)),增強到讓處理數(shù)據(jù)的電腦不堪負(fù)荷。
斯坦福大學(xué)研究生 Sneha Goenka 為此找到了一個快速的解決方案。這個方案放棄傳統(tǒng)的全用本地測序芯片處理數(shù)據(jù)的辦法,直接將編譯好的數(shù)據(jù)存入基于英偉達(dá) Tensor Core GPU與谷歌云的存儲系統(tǒng)。
利用云計算系統(tǒng),算力可以被放大,并在數(shù)據(jù)中進(jìn)行實時篩選。
然后研究者使用英偉達(dá)的Clara Parabricks架構(gòu),獨立運行為此定制的特殊決策樹算法,以掃描輸入的樣本基因代碼中,是否有病原體特征、可能導(dǎo)致疾病的遺傳異常特征,并為之標(biāo)出權(quán)重。
英偉達(dá)的Clara Parabricks架構(gòu)是以GPU加速運行的谷歌PEPPER-Margin-DeepVariant管線版本。PEPPER-Margin-DeepVariant管線由谷歌與加州大學(xué)桑塔克魯茲分校聯(lián)合開發(fā),利用遞歸神經(jīng)網(wǎng)絡(luò)算法分析基因測序數(shù)據(jù)。
決策樹算法過程
最后研究者將病患樣本的基因異常對照致病基因的公開數(shù)據(jù)庫,得出診斷。
因為軟硬件的增強,研究團隊還選用了以前更花錢且更艱難的長讀測序法。
傳統(tǒng)的基因測序?qū)颖净蚍智谐尚《?,然后再測定每段里的DNA堿基對。如此方式可以在舊技術(shù)限制下降低成本與工時,但容易誤測或漏測在長段DNA序列中才能完整呈現(xiàn)的變異。
長讀測序不需要過分切割DNA,同時測定1萬到10萬個堿基對之間的DNA長序列,能在提高測序準(zhǔn)確度的同時,提供更多基因變異的細(xì)節(jié)數(shù)據(jù)。
在之前的舊技術(shù)限制下,長讀測序的成本遠(yuǎn)高于傳統(tǒng)測序。
現(xiàn)在速度提升了,精度增加了,那么這次測試究竟花了多少錢呢?
科學(xué)家估計了使用方法的成本,包括DNA提取、文庫制備、測序和計算,發(fā)現(xiàn)這些成本在4971美元—7318美元之間(約3萬—4.6萬人民幣),遠(yuǎn)低于之前的預(yù)期。
隨著基因組測序技術(shù)不斷進(jìn)步,測序成本以「超摩爾速度」直線下降。
斯坦福研究者稱,此技術(shù)將能在試點的斯坦福醫(yī)院與斯坦福大學(xué)露西爾·帕卡德兒童醫(yī)院達(dá)到加護(hù)病房周轉(zhuǎn)率提高到10小時以下的成果。若達(dá)到預(yù)期將試圖更廣泛鋪開應(yīng)用。
4代基因測序技術(shù)
基因組測序技術(shù)的發(fā)展,最早可以追溯到1977年,此后經(jīng)過了40多年的發(fā)展。
基因組測序技術(shù)發(fā)展史|圖源:網(wǎng)絡(luò)
提到DNA測序,就不得不提到影響力巨大的「人類基因組計劃」。
關(guān)注我們往期文章的讀者應(yīng)該有印象,僅在職一年的美國科學(xué)顧問蘭德,他的最大成就可能就是繪制了人類基因組圖譜,推動了人類基因組計劃的發(fā)展。
其實,從上世紀(jì)90年代初起,學(xué)界就開始涉足「人類基因組計劃」。
人類基因組計劃可謂是世界范圍內(nèi)規(guī)模最大的科學(xué)巨型工程之一了。
其宗旨就是測定組成人類染色體中所包含的六十億對組成的核苷酸序列,從而繪制人類基因組圖譜,并且辨識其載有的基因及其序列,達(dá)到破譯人類遺傳信息的最終目的。
1990年,人類基因組計劃由美國能源部和國家衛(wèi)生研究院投資,預(yù)期在15年內(nèi)完成。
而后,為了協(xié)調(diào)各國人類基因組研究,1988年在維克多·馬克庫斯克等科學(xué)家的倡導(dǎo)下,國際人類基因組組織宣告成立。
DNA測序技術(shù)的發(fā)展經(jīng)歷了4次比較重大的飛躍。
第一代:鏈終止法
1975年,弗雷德里克·桑格(Frederick Sanger)等人提出了鏈終止法,標(biāo)志學(xué)者第一代測序技術(shù)誕生。
他們測定了第一個基因組序列,全長5375個堿基的噬菌體X174。自此,人類獲得了窺探生命遺傳密碼的能力。
第一代測序技術(shù)的優(yōu)勢在于測序讀長可達(dá)1000bp,準(zhǔn)確性高達(dá)99.999%,但因測序成本高、時間久和通量低等缺點,嚴(yán)重影響了其真正大規(guī)模的應(yīng)用。
第二代:高通量測序
第二代高通量測序是對上一代桑格測序的革命性變革,一次可以對幾十萬到幾百萬條DNA分子進(jìn)行序列測定,在有一些文獻(xiàn)中將高通量測稱為「下一代的測序技術(shù)」。
第二代測序技術(shù)除了大大降低測序成本以外,還大幅提高了測序速度,并且保持了高準(zhǔn)確性。
第一代測序技術(shù)完成一個人類基因組的測序需要3年時間,而使用二代測序技術(shù)則僅僅需要1周時間。
DNA之父詹姆斯·沃森(James Watson)在不到兩年、花費僅200萬美元的情況下,獲得了世界上首份個人基因組圖譜。
在之后,科學(xué)家看到在此方向上發(fā)展基因測序技術(shù)大有可為,于是繼續(xù)進(jìn)行創(chuàng)新,發(fā)明了第三代單分子測序技術(shù)。
第三代:單分子實時DNA測序
以PacBio公司的SMRT技術(shù)和Oxford Nanopore Technologies公司的「納米孔單分子技術(shù)」為代表的新一代測序技術(shù)被稱為第三代測序技術(shù)。
PacBio公司儀器
單分子測序技術(shù),不需要經(jīng)過PCR擴增,實現(xiàn)了對每一條DNA分子的單獨測序。第三代測序技術(shù)也叫從頭測序技術(shù),即單分子實時DNA測序。
第四代:核苷酸測序
第四代測序技術(shù)的基本標(biāo)志是不經(jīng)過cDNA (以RNA為模版合成的互補DNA),無PCR擴增,而直接測定單分子RNA序列,以及確定單分子RNA上的修飾核苷酸位點。
第一代測序技術(shù)的出現(xiàn)讓人類獲得了探索生命遺傳本質(zhì)的能力,讓生命科學(xué)的研究進(jìn)入了基因組研究時代。
到至今為止的40多年的時間,基因測序技術(shù)從第一代到第四代的已經(jīng)得到了非常大的發(fā)展。
未來,解碼DNA時間的序列的嘗試還會繼續(xù)…
參考資料:
https://www.zdnet.com/article/stanford-uni-nvidia-use-ai-computing-to-cut-dna-sequencing-down-to-five-hours/
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點僅代表作者本人。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 舉報,一經(jīng)查實,本站將立刻刪除。