生命科學(xué)高性能計(jì)算解決方案_第1頁(yè)
生命科學(xué)高性能計(jì)算解決方案_第2頁(yè)
生命科學(xué)高性能計(jì)算解決方案_第3頁(yè)
生命科學(xué)高性能計(jì)算解決方案_第4頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 生命科學(xué)高性能計(jì)算解決方案 摘要生物信息學(xué)(Bioinformatics)是在生命科學(xué)的研究中,以計(jì)算機(jī)為工具對(duì)生物信息進(jìn)行儲(chǔ)存、檢索和分析的科學(xué)。它是當(dāng)今生命科學(xué)和自然科學(xué)的重大前沿領(lǐng)域之一,同時(shí)也將是21世紀(jì)自然科學(xué)的核心領(lǐng)域之一。其研究重點(diǎn)主要體現(xiàn)在基因組學(xué)(Genomics)和蛋白質(zhì)組學(xué)(Proteomics)兩方面,具體說(shuō)就是從核酸和蛋白質(zhì)序列出發(fā),分析序列中表達(dá)的結(jié)構(gòu)功能的生物信息。背景介紹生物信息學(xué)在短短十幾年間,已經(jīng)形成了多個(gè)研究方向,其中與高性能計(jì)算相關(guān)的主要研究重點(diǎn)如下。序列比對(duì)序列比對(duì)(Sequence Alignment)的基本問(wèn)題是比較兩個(gè)或兩個(gè)以上符號(hào)序列的相似性

2、或不相似性。從生物學(xué)的初衷來(lái)看,這一問(wèn)題包含了以下幾個(gè)意義:從相互重疊的序列片斷中重構(gòu)DNA的完整序列。在各種試驗(yàn)條件下從探測(cè)數(shù)據(jù)(probe data)中決定物理和基因圖存貯,遍歷和比較數(shù)據(jù)庫(kù)中的DNA序列,比較兩個(gè)或多個(gè)序列的相似性,在數(shù)據(jù)庫(kù)中搜索相關(guān)序列和子序列,尋找核苷酸(nucleotides)的連續(xù)產(chǎn)生模式,找出蛋白質(zhì)和DNA序列中的信息成分。在序列對(duì)比的過(guò)程中將會(huì)產(chǎn)生巨量的數(shù)據(jù),這對(duì)我們的存儲(chǔ)系統(tǒng)帶來(lái)了較大規(guī)模的挑戰(zhàn)。現(xiàn)在用于存儲(chǔ)的硬盤容量每14個(gè)月會(huì)有一倍的增長(zhǎng),而基因序列的數(shù)據(jù)量則每5月左右會(huì)翻一番,例如:CeleraGenomics 和Sanger Centre 等主要基因

3、研究機(jī)構(gòu)都在管理數(shù)以萬(wàn)億字節(jié)計(jì)的數(shù)據(jù),其數(shù)據(jù)庫(kù)信息量超過(guò)了人類開(kāi)展生物學(xué)研究以來(lái)積累的數(shù)據(jù)量。序列拼接序列拼接是將測(cè)序生成的reads短片段拼接起來(lái),恢復(fù)出原始的序列。該問(wèn)題是序列分析的基本任務(wù),是基因組研究成功與失敗的關(guān)鍵,拼接結(jié)果直接影響到序列標(biāo)注,基因預(yù)測(cè)、基因組比較等后續(xù)任務(wù)。基因組序列的拼接也是基因組研究必須解決的首要難題。其困難不僅來(lái)自它的海量數(shù)據(jù)(以人類基因組序列為例,從數(shù)量為10兆級(jí)的片斷恢復(fù)出長(zhǎng)度為億級(jí)的原始序列),而且源于它含有高度重復(fù)的序列。從計(jì)算機(jī)方面來(lái)講,在拼接初期,會(huì)有大量的初始數(shù)據(jù)導(dǎo)入內(nèi)存,然后對(duì)這些數(shù)據(jù)進(jìn)行處理,因此,序列拼接對(duì)于計(jì)算機(jī)的內(nèi)存量和計(jì)算能力都有非常

4、大的需求。基于結(jié)構(gòu)的藥物設(shè)計(jì)人類基因工程的目的之一是要了解人體內(nèi)約10萬(wàn)種蛋白質(zhì)的結(jié)構(gòu),功能,相互作用以及與各種人類疾病之間的關(guān)系,尋求各種治療和預(yù)防方法,包括藥物治療?;谏锎蠓肿咏Y(jié)構(gòu)及小分子結(jié)構(gòu)的藥物設(shè)計(jì)是生物信息學(xué)中的極為重要的研究領(lǐng)域。為了抑制某些酶或蛋白質(zhì)的活性,在已知其蛋白質(zhì)3級(jí)結(jié)構(gòu)的基礎(chǔ)上,可以利用分子對(duì)齊算法,在計(jì)算機(jī)上設(shè)計(jì)抑制劑分子,作為候選藥物。然后在數(shù)據(jù)庫(kù)中進(jìn)行對(duì)比并且得到優(yōu)勢(shì)結(jié)構(gòu),選擇使用分子模擬的方法實(shí)現(xiàn)藥物分子的設(shè)計(jì)。解決方案介紹基于分析我們得出,生物信息學(xué)類計(jì)算的核心內(nèi)容是內(nèi)存密集型,存儲(chǔ)密集型,結(jié)合浪潮多年來(lái)的經(jīng)驗(yàn),我們?yōu)榭蛻籼峁┽槍?duì)化專業(yè)的解決方案。浪潮高性

5、能應(yīng)用集群主要解決了生物信息學(xué)中的四個(gè)主要問(wèn)題:高性能對(duì)于高性能計(jì)算而言,一方面是浮點(diǎn)處理性能,另一方面為CPU本身的綜合性能,浪潮結(jié)合生物信息學(xué)行業(yè)的特點(diǎn),推薦使用Intel處理器,不僅實(shí)現(xiàn)了較高的處理性能,并且在能效比,內(nèi)存支持,以及CPU本身的架構(gòu)上intel都有很大的優(yōu)勢(shì)。內(nèi)存問(wèn)題在生物信息學(xué)應(yīng)用中,先期數(shù)據(jù)的載入對(duì)于內(nèi)存容量的要求越來(lái)越高,浪潮采用大內(nèi)存服務(wù)器四路或者八路胖節(jié)點(diǎn),可以在單節(jié)點(diǎn)中配置高達(dá)2TB內(nèi)存,充分達(dá)到應(yīng)用的實(shí)際需求。存儲(chǔ)容量問(wèn)題海量存儲(chǔ)系統(tǒng)是生物信息學(xué)計(jì)算的先決條件。浪潮不僅可以提供了專業(yè)的直連存儲(chǔ),更有8Gb接口的光纖存儲(chǔ)系統(tǒng),通過(guò)專有的存儲(chǔ)節(jié)點(diǎn)構(gòu)建Lustre

6、并行文件系統(tǒng),接入以太網(wǎng),甚至40GB的Infiniband網(wǎng)絡(luò),總體容量可達(dá)到PB級(jí),除此之外還考慮到用戶的數(shù)據(jù)安全,數(shù)據(jù)備份等,從根本上解決了生物信息學(xué)的數(shù)據(jù)存儲(chǔ)難題。系統(tǒng)高穩(wěn)定性一套高穩(wěn)定性的系統(tǒng)能夠使我們的生物信息學(xué)應(yīng)用更加方便快捷,同時(shí)也能夠高效率的處理數(shù)據(jù),保證業(yè)務(wù)不中斷,浪潮通過(guò)統(tǒng)一的集群管理,作業(yè)調(diào)度,結(jié)合浪潮高性能的服務(wù)器,從各個(gè)方面保證了整套系統(tǒng)的穩(wěn)定性,大大提高了用戶的使用穩(wěn)定性和減少了故障率,為用戶提高生產(chǎn)力提供持續(xù)不間斷的支持??蛻羰找鎽?yīng)用分析浪潮擁有一支專業(yè)的HPC應(yīng)用分析團(tuán)隊(duì),可以針對(duì)客戶應(yīng)用,運(yùn)用測(cè)試工具得出具體的硬件平臺(tái)需求,從而幫助浪潮提為客戶提供針對(duì)性的高性價(jià)比HPC解決方案。應(yīng)用加速浪潮不僅為客戶提供硬件產(chǎn)品、解決方案,而且研究HPC技術(shù)發(fā)展,在異構(gòu)并行計(jì)算領(lǐng)域提前布局,建立一個(gè)優(yōu)秀的應(yīng)用開(kāi)發(fā)團(tuán)隊(duì),可以滿足客戶各種定制化開(kāi)發(fā)服務(wù),滿足用戶的特殊需求。在CPU技術(shù)方面,該團(tuán)隊(duì)成功與BGP合作完成單頻屬性提取、多時(shí)窗傾角掃描、體曲率提取、構(gòu)造導(dǎo)向?yàn)V波、特征值相干、紋理屬性提取、數(shù)據(jù)分離等石油勘探解釋與處理CPU多核并行算法開(kāi)發(fā)和優(yōu)化項(xiàng)目。在GPU技術(shù)方面,浪潮具備從算法級(jí)、桌面級(jí)、集群級(jí)開(kāi)發(fā)能力,與北京基因組所、西北工業(yè)大學(xué)、BGP合作完成Blastn、LES-LBM、PSTM、RNA等多款GPU軟件,較原有軟件獲得幾十倍性能提升。在

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論