超級計算是基因組學(xué)研究的未來_第1頁
超級計算是基因組學(xué)研究的未來_第2頁
超級計算是基因組學(xué)研究的未來_第3頁
超級計算是基因組學(xué)研究的未來_第4頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、.#:第5頁超級計算是基因組學(xué)研究的將來目前,基因組學(xué)正處于這樣一個拐點:人類基因組測序的本錢已經(jīng)低于1000美元,預(yù)計仍將繼續(xù)下降相比2019年的30億美元。隨著測序本錢降低,基因檢測變得越來越普遍,相應(yīng)的基因組數(shù)據(jù)也不斷上升。僅單個人的基因組“運行就會產(chǎn)生0.5TB1TB=1024GB的原始數(shù)據(jù)圖像文件,這些文件都很復(fù)雜,包含了分散的、非構(gòu)造化的科學(xué)數(shù)據(jù),難以管理和分析。隨著測序技術(shù)的開展,研究人員面臨的挑戰(zhàn)是如何管理和分析這些大量的、非構(gòu)造化的基因組數(shù)據(jù)。通常,這些數(shù)據(jù)產(chǎn)生于全球各地的學(xué)術(shù)研究、臨床試驗和制藥研究。如今許多組織機構(gòu)都需要更高級的數(shù)據(jù)分析和管理,應(yīng)用于藥物研發(fā)、疾病基因檢測

2、以及在臨床應(yīng)用中創(chuàng)立個性化治療等。但基因組測序是一個復(fù)雜多步的過程,包括了DNA序列讀取、基因組序列拼接、變異區(qū)序列分析和重測序?,F(xiàn)實就是:過去十年間,我們使用的技術(shù)不夠強大,無法分析這些關(guān)鍵數(shù)據(jù)。這樣的技術(shù)在將來注定要被新技術(shù)取代,因為隨著基因測序公司的不斷創(chuàng)新開展,他們對數(shù)據(jù)分析的需求在更快地增長中。同時,人們的對基因組測序的需求也越來越高。因此,技術(shù)專家要做的就是讓這些數(shù)據(jù)可以通過復(fù)雜的高性能計算HPC或超級計算機和大數(shù)據(jù)技術(shù)來分析,從而使基因組數(shù)據(jù)的管理和分析更便捷有效。大數(shù)據(jù)自身的問題追求個性化醫(yī)療的同時產(chǎn)生了爆炸性的數(shù)據(jù)增長,因為醫(yī)生和研究人員希望通過基因測序的手段,基于患者的疾病

3、表現(xiàn)和對藥物的耐受性等,對不同的患者進展最正確的個性化治療。與此同時,隨著基因組學(xué)研究的資金不斷增加,基因測序越來越商業(yè)化,也進一步推動了個性化醫(yī)療的開展。相關(guān)的案例就是,Kaiser Permanente在全美搜集超過210000名患者的DNA樣本、醫(yī)療記錄等,隨后創(chuàng)立了全球最大、最全面的精準(zhǔn)醫(yī)療數(shù)據(jù)庫。在此根底上,研究人員希望從中找到影響各類遺傳疾病的特定基因,以此在臨床應(yīng)用中改善疾病的診斷、治療和預(yù)防。當(dāng)然,要想成功梳理這些復(fù)雜、散點化、非構(gòu)造化的科學(xué)數(shù)據(jù),研究人員需要能大量計算和高速分析數(shù)據(jù)以及具有靈敏性的計算系統(tǒng),但是傳統(tǒng)的計算系統(tǒng)跟不上數(shù)據(jù)需求的開展腳步??上驳氖?,隨著現(xiàn)代超級計算

4、技術(shù)的到位,研究機構(gòu)可以不斷增加數(shù)據(jù)量,并分析出有價值的科學(xué)見解。管理和共享新數(shù)據(jù)要想在數(shù)據(jù)密集的時代里實現(xiàn)重大科學(xué)打破,研究團隊需要更快、更便捷地對大型數(shù)據(jù)集進展分析。2019年,美國著名安康系統(tǒng)INOVA的轉(zhuǎn)化醫(yī)學(xué)研究所ITMI購置了HPC系統(tǒng),使得研究人員能借助基因組數(shù)據(jù)庫,更加準(zhǔn)確、快速地診斷患者,并提供更高程度地治療和護理。ITMI的系統(tǒng)用于25000個基因組的數(shù)據(jù)密集型工作負(fù)載,研究人員通過開發(fā)和使用自己的代碼簡化數(shù)據(jù)管理。有了這種靈敏性,ITMI管理IT的負(fù)擔(dān)明顯降低,同時也增加了研究工作流的才能,使機構(gòu)能投入更多的資源用于更具挑戰(zhàn)性的慢性疾病領(lǐng)域。隨著科研機構(gòu)處理數(shù)據(jù)越來越多,

5、將來資本還將青睞新的超級計算解決方案,以改善數(shù)據(jù)的管理和可訪問性。詳細(xì)來講,這些系統(tǒng)將提供更高速的工作流以及更快的組編和分析操作,為研究人員的研究進步效率。相對來講,HPC系統(tǒng)查詢海量數(shù)據(jù)庫的速度要快一個數(shù)量級,能探究更大的數(shù)據(jù)集,并能同時進展更多數(shù)據(jù)的調(diào)查。為什么數(shù)據(jù)存儲至關(guān)重要基因組學(xué)研究中最大的挑戰(zhàn)就是數(shù)據(jù)集往往需要被存儲、分析,然后再次存儲。舉例來說,美國基因檢測公司Human Longevity最近與制藥企業(yè)AstraZeneca合作,對來自臨床試驗的500000個DNA樣本進展測序分析。該方案預(yù)計將在2020年前生成一百萬種基因組、分子和臨床數(shù)據(jù)的綜合安康記錄。這將是一個驚人的數(shù)據(jù)

6、量,所有的數(shù)據(jù)都必須存儲在外部儲存器,以便將來通過網(wǎng)絡(luò)傳送到計算機,分析后再存儲回外部儲存器。這個過程給傳統(tǒng)的IT根底設(shè)施帶來了難以置信的負(fù)擔(dān)。大多數(shù)存儲管理器并不能承受這些工作負(fù)載帶來的壓力,因為其不具有當(dāng)今生物醫(yī)學(xué)應(yīng)用所需的可擴展性、持續(xù)性和長期性,超級計算機的現(xiàn)代基因組學(xué)研究的數(shù)據(jù)將繼續(xù)爆炸性增長。隨著技術(shù)人員提供千兆級和將來百萬兆級的解決方案,幾年前還讓人覺得高深莫測的數(shù)據(jù),如今都能快速便捷的管理和分析。此外值得快樂的是,超級計算系統(tǒng)已經(jīng)變得更加經(jīng)濟實惠,也沒有那么復(fù)雜了。超級計算機在基因組學(xué)中具有多種功能,包括協(xié)助組編和識別研究數(shù)據(jù)中的形式,以及將遺傳序列注釋到圖像建模中。對于研究機構(gòu)來說,尋找現(xiàn)代HPC的解決方案非常重要,因為它不僅可以分析數(shù)據(jù),而且能輕松存儲數(shù)據(jù),同時其他研究人員還能再次訪問。美國硅圖公司SGI提供的存儲系統(tǒng),可以輕松集成高性能計算和數(shù)據(jù)分析系統(tǒng)功能。現(xiàn)代HPC系統(tǒng)提供大規(guī)模的、存儲虛擬化的數(shù)據(jù)管理平臺,專門用于管理生命科學(xué)應(yīng)用程序產(chǎn)生的大量構(gòu)造化和非構(gòu)造化的內(nèi)容。在這場搜集、研究、鏈接和分析與個性化醫(yī)療環(huán)境相關(guān)的關(guān)鍵生物醫(yī)學(xué)研究數(shù)據(jù)的競賽中,SGI為研究機構(gòu)和實驗室的分析和創(chuàng)新提供了一條捷徑。結(jié)語:基因組學(xué)研究將促進疾病基因的識別,加速生物標(biāo)志物的鑒定,并為患者提供針對性更強的個性化治療。同時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論