生物數(shù)據(jù)庫(kù)課件_第1頁(yè)
生物數(shù)據(jù)庫(kù)課件_第2頁(yè)
生物數(shù)據(jù)庫(kù)課件_第3頁(yè)
生物數(shù)據(jù)庫(kù)課件_第4頁(yè)
生物數(shù)據(jù)庫(kù)課件_第5頁(yè)
已閱讀5頁(yè),還剩126頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

生物信息學(xué)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)介紹與數(shù)據(jù)檢索1生物信息學(xué)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)介紹與數(shù)據(jù)檢索1生物信息學(xué)與功能基因組學(xué)

2生物信息學(xué)與功能基因組學(xué)http://www.bioinfb面對(duì)堆積如山的生物學(xué)數(shù)據(jù)3面對(duì)堆積如山的生物學(xué)數(shù)據(jù)3主要內(nèi)容一、分子生物學(xué)數(shù)據(jù)庫(kù)簡(jiǎn)介二、NCBI(Entrez)簡(jiǎn)介子數(shù)據(jù)庫(kù),數(shù)據(jù)格式,數(shù)據(jù)檢索,工具軟件4主要內(nèi)容一、分子生物學(xué)數(shù)據(jù)庫(kù)簡(jiǎn)介4

思考題:根據(jù)自己的知識(shí)和經(jīng)驗(yàn),你認(rèn)為網(wǎng)上應(yīng)該會(huì)有哪些分子生物學(xué)的數(shù)據(jù)庫(kù)?數(shù)據(jù)庫(kù)中應(yīng)該存放哪些數(shù)據(jù)?應(yīng)該提供什么類(lèi)型的數(shù)據(jù)處理服務(wù)。以下是一些關(guān)鍵詞:DNA,RNA,Protein,Genome,物種,文獻(xiàn),疾病,結(jié)構(gòu),蛋白質(zhì)家族,Gene,染色體。。。5思考題:根據(jù)自己的知識(shí)和經(jīng)驗(yàn),你認(rèn)為網(wǎng)上應(yīng)該會(huì)有哪些分子生一、分子生物學(xué)數(shù)據(jù)庫(kù)分子生物學(xué)數(shù)據(jù)庫(kù)各自按照一定的目標(biāo)收集和整理實(shí)驗(yàn)數(shù)據(jù),并提供相關(guān)的數(shù)據(jù)查詢、數(shù)據(jù)處理的服務(wù),并大多提供網(wǎng)絡(luò)服務(wù)。建立生物分子數(shù)據(jù)庫(kù)生物分子數(shù)據(jù)高速增長(zhǎng)(HGP)分子生物學(xué)及其相關(guān)領(lǐng)域研究人員需要迅速獲得最新實(shí)驗(yàn)數(shù)據(jù)6一、分子生物學(xué)數(shù)據(jù)庫(kù)分子生物學(xué)數(shù)據(jù)庫(kù)各自按照一定的目標(biāo)收集和生物數(shù)據(jù)分類(lèi)生物信息數(shù)據(jù)庫(kù)種類(lèi)繁多,就目前來(lái)看,大體可以分為四個(gè)大類(lèi):1.基因組數(shù)據(jù)庫(kù);2.核酸和蛋白質(zhì)一級(jí)結(jié)構(gòu)序列數(shù)據(jù)庫(kù);3.生物大分子(主要是蛋白質(zhì))

三維空間結(jié)構(gòu)數(shù)據(jù)庫(kù);4.根據(jù)以上三類(lèi)數(shù)據(jù)庫(kù)和文獻(xiàn)資料為基礎(chǔ)構(gòu)建的二次數(shù)據(jù)庫(kù)。也稱專門(mén)數(shù)據(jù)庫(kù)、專業(yè)數(shù)據(jù)庫(kù)或?qū)S脭?shù)據(jù)庫(kù)。一次數(shù)據(jù)庫(kù)7生物數(shù)據(jù)分類(lèi)生物信息數(shù)據(jù)庫(kù)種類(lèi)繁多,就目前來(lái)看,大體可以分生物分子信息生物分子結(jié)構(gòu)數(shù)據(jù)生物分子功能數(shù)據(jù)最基本直觀復(fù)雜核酸序列數(shù)據(jù)生物分子數(shù)據(jù)類(lèi)型蛋白質(zhì)序列數(shù)據(jù)8生生物分子結(jié)構(gòu)數(shù)據(jù)生物分子功能數(shù)據(jù)最基本直觀復(fù)雜核酸序列生物學(xué)數(shù)據(jù)庫(kù)統(tǒng)計(jì)《NucleicAcidsResearch》雜志每年的第一期中詳細(xì)介紹最新版本的各種數(shù)據(jù)庫(kù)。/

/nar/database/c/

9生物學(xué)數(shù)據(jù)庫(kù)統(tǒng)計(jì)《NucleicAcidsResearc1核酸序列數(shù)據(jù)庫(kù)2.RNA序列數(shù)據(jù)庫(kù)3.蛋白質(zhì)序列數(shù)據(jù)庫(kù)4.結(jié)構(gòu)數(shù)據(jù)庫(kù)5.基因組數(shù)據(jù)庫(kù)(非脊椎動(dòng)物)6.代謝酶相關(guān)產(chǎn)物7.人類(lèi)和其他脊椎動(dòng)物基因組8.人類(lèi)基因和疾病9.其他數(shù)據(jù)和其他基因表達(dá)數(shù)據(jù)庫(kù)10.蛋白組資源11.其他分子生物學(xué)數(shù)據(jù)庫(kù)12.細(xì)胞器官數(shù)據(jù)庫(kù)13.植物數(shù)據(jù)庫(kù)14.免疫學(xué)數(shù)據(jù)庫(kù)101核酸序列數(shù)據(jù)庫(kù)10核酸序列數(shù)據(jù)庫(kù)國(guó)際上著名的一級(jí)核酸數(shù)據(jù)庫(kù)(1)美國(guó)生物技術(shù)信息中心的GenBank/(2)歐洲分子生物學(xué)實(shí)驗(yàn)室的EMBL/(3)日本遺傳研究所的DDBJhttp://www.ddbj.nig.ac.jp/11核酸序列數(shù)據(jù)庫(kù)國(guó)際上著名的一級(jí)核酸數(shù)據(jù)庫(kù)11數(shù)據(jù)相同GenBank數(shù)據(jù)庫(kù)每天與歐洲分子生物學(xué)實(shí)驗(yàn)室的核酸序列數(shù)據(jù)庫(kù)(EuropeanMolecularBiologyLaboratoryNucleotideSequenceDatabase,EMBL)和日本的DNA數(shù)據(jù)庫(kù)(DNADataBankofJapanDDBJ)進(jìn)行數(shù)據(jù)交換,以保證數(shù)據(jù)庫(kù)內(nèi)容在全世界范圍的同步性。12數(shù)據(jù)相同GenBank數(shù)據(jù)庫(kù)每天與歐洲分子生物學(xué)實(shí)驗(yàn)室的核酸特殊類(lèi)型核酸序列數(shù)據(jù)庫(kù):非編碼RNA數(shù)據(jù)庫(kù)(ncRNA);表達(dá)序列標(biāo)簽數(shù)據(jù)庫(kù)(dbEST);序列標(biāo)簽位點(diǎn)數(shù)據(jù)庫(kù)(dbSTS);miRBase;tRNAdb等。13特殊類(lèi)型核酸序列數(shù)據(jù)庫(kù):非編碼RNA數(shù)據(jù)庫(kù)(ncRNA);1基因組相關(guān)數(shù)據(jù)庫(kù):人類(lèi)基因組數(shù)據(jù)庫(kù)(HGD);基因組序列數(shù)據(jù)庫(kù)(GSDB);基因組在線數(shù)據(jù)庫(kù)(GOLD)等。14基因組相關(guān)數(shù)據(jù)庫(kù):人類(lèi)基因組數(shù)據(jù)庫(kù)(HGD);14核酸三維結(jié)構(gòu)數(shù)據(jù)庫(kù):核苷酸三維結(jié)構(gòu)數(shù)據(jù)庫(kù)(NDB);普納大學(xué)核酸結(jié)構(gòu)數(shù)據(jù)庫(kù)(BNASDB)等。15核酸三維結(jié)構(gòu)數(shù)據(jù)庫(kù):核苷酸三維結(jié)構(gòu)數(shù)據(jù)庫(kù)(NDB);15基因表達(dá)數(shù)據(jù)庫(kù):基因表達(dá)庫(kù)(GEO);斯坦福微陣列數(shù)據(jù)庫(kù)(SMD);ArrayExpress;CGED;GXD;BodyMap等。16基因表達(dá)數(shù)據(jù)庫(kù):基因表達(dá)庫(kù)(GEO);16人類(lèi)基因突變及疾病相關(guān)數(shù)據(jù)庫(kù):人類(lèi)基因變異數(shù)據(jù)庫(kù)(HMGD)、人類(lèi)遺傳雙等位基因序列數(shù)據(jù)庫(kù)(HGBASE)、人類(lèi)孟德?tīng)栠z傳在線(OMIM)、國(guó)際單體型計(jì)劃(HapMap)、人類(lèi)單核苷酸多態(tài)性數(shù)據(jù)庫(kù)(dbSNP)、腫瘤基因數(shù)據(jù)庫(kù)(TGDB)、疾病關(guān)聯(lián)數(shù)據(jù)庫(kù)(GAD)、癌癥基因數(shù)據(jù)庫(kù)(CGAP)、人類(lèi)表觀遺傳數(shù)據(jù)庫(kù)(HEP)、人類(lèi)DNA甲基化與癌癥數(shù)據(jù)庫(kù)(MethylCancer)等。17人類(lèi)基因突變及疾病相關(guān)數(shù)據(jù)庫(kù):人類(lèi)基因變異數(shù)據(jù)庫(kù)(HMGD)蛋白質(zhì)序列數(shù)據(jù)庫(kù)隨著分子生物學(xué)的發(fā)展,人們獲得了越來(lái)越多關(guān)于蛋白質(zhì)序列、結(jié)構(gòu)和功能的信息。世界各國(guó)的生物學(xué)家和計(jì)算機(jī)科學(xué)家合作利用這些信息構(gòu)建了蛋白質(zhì)序列數(shù)據(jù)庫(kù)、蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫(kù)、蛋白質(zhì)組數(shù)據(jù)庫(kù)(二維凝膠電泳數(shù)據(jù)庫(kù))、信號(hào)傳導(dǎo)及蛋白質(zhì)-蛋白質(zhì)相互作用相關(guān)數(shù)據(jù)庫(kù)、DNA和蛋白質(zhì)相互作用數(shù)據(jù)庫(kù)等蛋白質(zhì)相關(guān)數(shù)據(jù)庫(kù)。18蛋白質(zhì)序列數(shù)據(jù)庫(kù)隨著分子生物學(xué)的發(fā)展,人們獲得了越來(lái)越多關(guān)于常用的蛋白質(zhì)序列數(shù)據(jù)庫(kù):PIRMIPSSwiss-ProtUniProt19常用的蛋白質(zhì)序列數(shù)據(jù)庫(kù):PIR19蛋白質(zhì)功能、結(jié)構(gòu)域和蛋白質(zhì)家族有關(guān)的數(shù)據(jù)庫(kù):PROSITEInterProPfamProDomSMART等20蛋白質(zhì)功能、結(jié)構(gòu)域和蛋白質(zhì)家族有關(guān)的數(shù)據(jù)庫(kù):PROSITE蛋白質(zhì)三維結(jié)構(gòu)相關(guān)數(shù)據(jù)庫(kù):PDBBioMagResBankSWISS-MODELRepositoryModBaseCATHSCOPReLiBaseTOPSSWISS-3DIMAGEBioImage等21蛋白質(zhì)三維結(jié)構(gòu)相關(guān)數(shù)據(jù)庫(kù):PDB21蛋白質(zhì)二維凝膠電泳數(shù)據(jù)庫(kù):WORLD-2DPAGEPhoretixlinks22蛋白質(zhì)二維凝膠電泳數(shù)據(jù)庫(kù):WORLD-2DPAGE22信號(hào)傳導(dǎo)及蛋白質(zhì)-蛋白質(zhì)相互作用相關(guān)數(shù)據(jù)庫(kù):DIPINTERACTProNetKEGGCANSITESPADCSNDB等23信號(hào)傳導(dǎo)及蛋白質(zhì)-蛋白質(zhì)相互作用相關(guān)數(shù)據(jù)庫(kù):DIP23DNA和蛋白質(zhì)相互作用數(shù)據(jù)庫(kù):DPInteract蛋白質(zhì)翻譯后修飾相關(guān)數(shù)據(jù)庫(kù):O-GlycBase、PhosphoBase、RES蛋白質(zhì)等蛋白質(zhì)24DNA和蛋白質(zhì)相互作用數(shù)據(jù)庫(kù):DPInteract24UniProt-通用蛋白質(zhì)資源庫(kù)(/)是存儲(chǔ)和鏈接其他蛋白質(zhì)數(shù)據(jù)庫(kù)的資源庫(kù),并且是蛋白質(zhì)序列和具有綜合功能注釋目錄的中心資源庫(kù)。使用UniprotKB可以檢索準(zhǔn)確、可靠的蛋白綜合信息。使用UniRef可以減少冗余,加速序列相似性搜索。使用UniParc可以檢索存檔序列和它們來(lái)源的數(shù)據(jù)庫(kù)。25UniProt-通用蛋白質(zhì)資源庫(kù)(http://www.un

(蛋白數(shù)據(jù)庫(kù))26(蛋白數(shù)據(jù)庫(kù))MIPS數(shù)據(jù)庫(kù)慕尼黑蛋白質(zhì)序列信息中心(MIPS)(http://www.helmholtz-muenchen.de/en/ibis),它的重點(diǎn)工作是基因組生物信息學(xué),特別注重基因組信息系統(tǒng)分析,包括應(yīng)用生物信息學(xué)方法注釋基因組、表達(dá)分析和蛋白質(zhì)組學(xué)方面研究。MIPS支持和維護(hù)一系列基因組數(shù)據(jù)庫(kù)以及系統(tǒng),可以提供細(xì)菌、真菌和植物基因組比較分析服務(wù)。在該站點(diǎn)提供基因組分析工具、數(shù)據(jù)庫(kù)檢索系統(tǒng)、表達(dá)分析、蛋白相互作用等網(wǎng)絡(luò)服務(wù)。27MIPS數(shù)據(jù)庫(kù)慕尼黑蛋白質(zhì)序列信息中心(MIPS)(httphttp://www.helmholtz-muenchen.de/en/ibis28http://www.helmholtz-muenchen.其他重要的蛋白質(zhì)序列數(shù)據(jù)庫(kù):PRINTSPfam29其他重要的蛋白質(zhì)序列數(shù)據(jù)庫(kù):PRINTS29PRINTSPRINTS(http://www.bioinf.manchester.ac.uk/dbbrowser/PRINTS/index.php)是蛋白基序指紋圖綜合數(shù)據(jù)庫(kù),每個(gè)指紋圖都是使用數(shù)據(jù)掃描程序ADSP或VISTAS序列分析軟件包反復(fù)優(yōu)化后定義的。數(shù)據(jù)庫(kù)中有兩種類(lèi)型指紋圖,根據(jù)指紋圖的復(fù)雜性分為簡(jiǎn)單和復(fù)合指紋圖:簡(jiǎn)單指紋圖基本上是單一的基序,而復(fù)合指紋圖包含多個(gè)基序。30PRINTS30Pfam蛋白質(zhì)一般是由一個(gè)或多個(gè)功能區(qū)域組成,這些功能區(qū)域通常稱作域(domain)。在不同的蛋白質(zhì)中不同的域以不同的組合出現(xiàn),導(dǎo)致在自然界發(fā)現(xiàn)多種多樣組成成分的蛋白質(zhì)。識(shí)別出現(xiàn)在蛋白質(zhì)中的域可以了解蛋白質(zhì)的功能。Pfam數(shù)據(jù)庫(kù)(http://pfam.sanger.ac.uk/)是一個(gè)大的蛋白質(zhì)域家族集合,每個(gè)家族是用多序列比對(duì)和隱馬模型(HMMs)分析結(jié)果的代表。31Pfam蛋白質(zhì)一般是由一個(gè)或多個(gè)功能區(qū)域組成,這些功能區(qū)域通/

(結(jié)構(gòu)數(shù)據(jù)庫(kù))

32/(結(jié)構(gòu)數(shù)據(jù)庫(kù))3http://www.ensembl.org/index.html33/index.hENSEMBL簡(jiǎn)介ENSEMBL旨在開(kāi)發(fā)一種能夠?qū)φ婧松锘蚪M進(jìn)行自動(dòng)詮釋(automaticannotation)并加以維護(hù)的軟件。該計(jì)劃由英國(guó)Sanger研究所Wellcome基金會(huì)及歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)所屬分部歐洲生物信息學(xué)研究所(EBI)共同協(xié)作運(yùn)營(yíng)。該計(jì)劃開(kāi)放所有源信息,所有由該計(jì)劃所產(chǎn)生的數(shù)據(jù)及軟件都可以免費(fèi)及自由地從網(wǎng)絡(luò)上獲取并使用。該計(jì)劃所開(kāi)發(fā)并使用的大部分軟件是用Perl語(yǔ)言編寫(xiě)的,并基于BiopPerl的基礎(chǔ)框架。其他基因組計(jì)劃亦可輕易使用Perl語(yǔ)言的應(yīng)用程序接口(Applicationprogramminginterface,API)。34ENSEMBL簡(jiǎn)介ENSEMBL旨在開(kāi)發(fā)一種能夠?qū)φ婧松锘鵫ttp://www.geneo/biologicalprocess生物過(guò)程molecularfunction分子功能cellularcomponent細(xì)胞組分。35/biNationalCenterforBiotechnologyInformation(NCBI)二、NCBI子數(shù)據(jù)庫(kù),數(shù)據(jù)格式,數(shù)據(jù)檢索,工具軟件。36NationalCenterforBiotechnolNCBI美國(guó)國(guó)家生物技術(shù)信息中心(NationalCenterforBiotechnologyInformation,NCBI)

NCBI成立于1988年,其主要工作是開(kāi)發(fā)以GenBank為代表的數(shù)據(jù)庫(kù),進(jìn)行計(jì)算生物學(xué)研究,開(kāi)發(fā)用于分析基因組數(shù)據(jù)的軟件工具,發(fā)布生物醫(yī)學(xué)信息。Entrez是NCBI著名的用于提取序列信息的工具,它將科學(xué)文獻(xiàn)、DNA和蛋白質(zhì)序列數(shù)據(jù)庫(kù)、蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)、種群研究數(shù)據(jù)以及全基因組組裝數(shù)據(jù)整合成一個(gè)高度集成的系統(tǒng)。類(lèi)似于EBI的SRS,是一個(gè)查詢、提取和顯示系統(tǒng)。37NCBI美國(guó)國(guó)家首頁(yè)38首頁(yè)38學(xué)習(xí)利用NCBI/books/bv.fcgi?rid=handbook39學(xué)習(xí)利用NCBIhttp://www.ncbi.nlm.nisitemap【舊版本】40sitemap【舊版本】40第一個(gè)子數(shù)據(jù)庫(kù)GenBank介紹/genbank41第一個(gè)子數(shù)據(jù)庫(kù)GenBank介紹http://www.ncb簡(jiǎn)介GenBank

?

istheNIH(美國(guó)國(guó)立衛(wèi)生研究院)geneticsequencedatabase,anannotatedcollectionofallpubliclyavailableDNAsequences(

NucleicAcidsResearch,2011Jan;39(Databaseissue):D32-7

).Thereareapproximately126,551,501,141basesin135,440,924sequencerecordsinthetraditionalGenBankdivisionsand191,401,393,188basesin62,715,288sequencerecordsintheWGSdivisionasofApril2011.Thecomplete

releasenotes

forthecurrentversionofGenBankareavailableontheNCBIftpsite.Anewreleaseismadeeverytwomonths.GenBankispartofthe

InternationalNucleotideSequenceDatabaseCollaboration

,whichcomprisestheDNADataBankofJapan(DDBJ),theEuropeanMolecularBiologyLaboratory(EMBL),andGenBankatNCBI.Thesethreeorganizationsexchangedataonadailybasis.42簡(jiǎn)介GenBank

?

istheNIH(美國(guó)國(guó)立衛(wèi)生GenBank簡(jiǎn)介GenBank是一個(gè)綜合數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)中包含了已經(jīng)公開(kāi)的30萬(wàn)余種不同物種生物的核酸序列,這些數(shù)據(jù)主要來(lái)源于全世界不同實(shí)驗(yàn)室和大規(guī)模測(cè)序計(jì)劃項(xiàng)目。由美國(guó)國(guó)家醫(yī)學(xué)圖書(shū)館的國(guó)家生物技術(shù)信息中心構(gòu)建、維護(hù)和管理。該中心位于美國(guó)馬里蘭國(guó)家健康研究所(NIH)。GenBank數(shù)據(jù)庫(kù)的序列數(shù)據(jù)來(lái)源于序列發(fā)現(xiàn)者提交的序列、批量提交的表達(dá)序列標(biāo)簽(expressedsequencetag,EST)、基因組測(cè)序序列(genomesurveysequence,GSS)和其他測(cè)序中心提供的高通量數(shù)據(jù),還包括美國(guó)專利商標(biāo)局提供的已發(fā)表專利的序列數(shù)據(jù)。43GenBank簡(jiǎn)介GenBank是一個(gè)綜合數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)中統(tǒng)計(jì)(/genbank/statistics

)44統(tǒng)計(jì)(4545/genbank/gbrel.txt46/genbank數(shù)椐庫(kù)訪問(wèn)示例視黃醇結(jié)合蛋白R(shí)BP4(retinol-bindingprotein)一種大量分泌的、小體積的蛋白,能結(jié)合血液中的視黃醇(維生素A)。視黃醇可從胡羅卜中以維生素A的形式獲得,疏水程度大。RBP4幫助轉(zhuǎn)運(yùn)這個(gè)配體到眼睛為視覺(jué)系統(tǒng)所用。47數(shù)椐庫(kù)訪問(wèn)示例視黃醇結(jié)合蛋白R(shí)BP4(retinol-bin數(shù)據(jù)庫(kù)檢索工具集成檢索系統(tǒng):Entrez48數(shù)據(jù)庫(kù)檢索工具集成檢索系統(tǒng):Entrez48Entrez1991年由美國(guó)生物信息技術(shù)中心(NationalCenterforBiotechnologyInformation,NCBI)()開(kāi)發(fā)。EricW.Sayers.DatabaseresourcesoftheNationalCenterforBiotechnologyInformation.NucleicAcidsResearch,2010,Vol.38,DatabaseissueD5-D1649Entrez1991年由美國(guó)生物信息技術(shù)中心(Nationa5050http://www.ebi.ac.uk/Tools/51http://www.ebi.ac.uk/Tools/51SRSSRSisapowerfuldataintegrationplatform,providingrapid,easyanduserfriendlyaccesstothelargevolumesofdiverseandheterogeneousLifeSciencedatastoredinmorethan400internalandpublicdomaindatabases...more

52SRS52FromtheNCBIhomepage,type“rbp4”andhit“Search”53FromtheNCBIhomepage,type545455555656圖形顯示57圖形顯示57數(shù)據(jù)庫(kù)格式思考題:如果從數(shù)據(jù)庫(kù)里面得到一個(gè)序列,你希望能得到些什么樣的附加信息?以什么樣的格式提供?所謂格式是對(duì)信息描述的統(tǒng)一規(guī)范,規(guī)范的格式為數(shù)據(jù)的收集、整理、交流和應(yīng)用提供了方便。58數(shù)據(jù)庫(kù)格式思考題:如果從數(shù)據(jù)庫(kù)里面得到一個(gè)序列,你希望能得到1,F(xiàn)ASTA(pearson)式FASTA格式是記錄序列最簡(jiǎn)單的一種格式,將一個(gè)DNA或者蛋白質(zhì)序列表示為一個(gè)帶有一些標(biāo)記的核苷酸或氨基酸字符串。/blast/fasta.shtml591,F(xiàn)ASTA(pearson)式59FASTA格式的一個(gè)例子“>”開(kāi)始的單行:該序列的一些基本信息。后面是分行的序列數(shù)據(jù)特點(diǎn):具有極大的可讀性,F(xiàn)ASTA格式在許多分子生物學(xué)軟件包中得到了廣泛的應(yīng)用。60FASTA格式的一個(gè)例子“>”開(kāi)始的單行:該序列的一些基本信2,GBFF(GenBankflatfile)格式/Sitemap/samplerecord.html頭部:包含整個(gè)記錄的信息612,GBFF(GenBankflatfile)格式http/entrez/viewer.fcgi?db=nuccore&idenlocusname長(zhǎng)度分子類(lèi)型分類(lèi)碼修改時(shí)間63locusname長(zhǎng)度分子類(lèi)型分類(lèi)碼修改時(shí)間63GenBank分類(lèi)碼64GenBank分類(lèi)碼64DEFINITION行該行主要對(duì)GenBank記錄所包含的生物學(xué)意義作出總結(jié)。65DEFINITION行該行主要對(duì)GenBank記錄所包含的生檢索號(hào)登錄號(hào)或檢索號(hào)66檢索號(hào)登錄號(hào)或檢索號(hào)66/Sequin/acc.html

67/SeVERSION在數(shù)據(jù)庫(kù)中,如果某條序列數(shù)據(jù)發(fā)生了變化,即使是單堿基的改變,它的版本號(hào)也將增加,同時(shí)得到一個(gè)新的GI號(hào),而檢索號(hào)保持不變。68VERSION在數(shù)據(jù)庫(kù)中,如果某條序列數(shù)據(jù)發(fā)生了變化,即使是GISequenceidentificationnumber69GISequenceidentificationnumb關(guān)鍵詞70關(guān)鍵詞70SOURCE71SOURCE71Reference72Reference72

7373第二部分:FEATURES(特性表)它描述基因和基因產(chǎn)物以及與序列相關(guān)的生物學(xué)特性。74第二部分:FEATURES(特性表)它描述基因和基因產(chǎn)物以及FEATURES這一部分描述基因和基因產(chǎn)物以及與序列相關(guān)的生物學(xué)特性。特性表格式是按表單的方式設(shè)計(jì)的,包含3個(gè)主要部分。第一,特性關(guān)鍵詞;第二,特性位置;第三,限定詞,相關(guān)特性的輔助信息,限定詞使用一組標(biāo)準(zhǔn)化的對(duì)照詞匯表以利于計(jì)算機(jī)從中提取信息。75FEATURES這一部分描述基因和基因產(chǎn)物以及與序列相關(guān)的生FEATURESTheformatdesignisbasedonatabularapproachandconsistsofthefollowingitems:Featurekey

asinglewordorabbreviationindicatingfunctionalgroup

LocationinstructionsforfindingthefeatureQualifiersauxiliaryinformationaboutafeature76FEATURESTheformatdesignisb特性表/projects/collab/FT/index.htmlKey

Location/QualifiersCDS

join(544..589,688..>1032)

/product="T-cellreceptorbeta-chain”whichmightbereadas:Thisfeature,whichisapartialcodingsequence,

isformedbyjoiningelementsindicatedtoformonecontiguoussequenceencodingaproductcalledT-cellreceptorbeta-chain.77特性表

第三部分:序列78第三部分:序列78其他子數(shù)據(jù)庫(kù)介紹79其他子數(shù)據(jù)庫(kù)介紹79/RefSeq/80/Re參考序列數(shù)據(jù)庫(kù)NCBIReferenceSequencesTheReferenceSequence(RefSeq)collectionaimstoprovideacomprehensive,integrated,non-redundant,well-annotatedsetofsequences,includinggenomicDNA,transcripts,andproteins.RefSeqisafoundationformedical,functional,anddiversitystudies;theyprovideastablereferenceforgenomeannotation,geneidentificationandcharacterization,mutationandpolymorphismanalysis(especiallyRefSeqGenerecords),expressionstudies,andcomparativeanalyses.[more...]81參考序列數(shù)據(jù)庫(kù)NCBIReferenceSequence參考序列82參考序列82UniGene:uniquegenesviaESTsFindUniGeneatNCBI:/UniGeneUniGene(uniquegene)項(xiàng)目的目標(biāo)是為每一個(gè)基因創(chuàng)造一個(gè)唯一的條目,然后收集對(duì)應(yīng)于這個(gè)基因的所有EST(表達(dá)序列標(biāo)簽)。EST來(lái)源于一定環(huán)境下一個(gè)組織總mRNA所構(gòu)建的cDNA文庫(kù),一個(gè)EST代表一個(gè)完整基因的一小部分。83UniGene:uniquegenesviaESTsClustersizesinUniGeneThisisagenewith1ESTassociated;theclustersizeis184ClustersizesinUniGeneThisiClustersizesinUniGeneThisisagenewith10ESTsassociated;theclustersizeis1085ClustersizesinUniGeneThisiClustersizesinUniGene(human)Clustersize(ESTs)

Numberofclusters 1

42,800 2 6,500 3-4 6,500 5-8 5,400 9-16 4,100 17-32 3,300

500-1000 2,128

2000-4000 233

8000-16,000 21

16,000-30,000 886ClustersizesinUniGene(huma/unigene/statistics/87/un/unigene/statistics/88/unRBP4UniGeneNucleotideProteinPubMed視黃醇結(jié)合蛋白R(shí)BP4:retinolbindingprotein4。89RBP4UniGene視黃醇結(jié)合蛋白R(shí)BP4:retinol9090頂端部分91頂端部分91中間部分92中間部分92底端部分93底端部分9394949595969697979898檢索的一個(gè)例子(案例1)許多細(xì)菌在與抗生素的對(duì)抗中發(fā)展出多種能力從而使抗生素失效,其中一個(gè)例子就是結(jié)核桿菌(mycobacteriumtuberculosis),很多結(jié)核桿菌株都進(jìn)化出了青霉素抗性,那么具有青霉素抗性的結(jié)核桿菌編碼青霉素結(jié)合蛋白的基因在其基因組中是否發(fā)生了改變呢?99檢索的一個(gè)例子(案例1)許多細(xì)菌在與抗生素的對(duì)抗中發(fā)展出多種

選擇數(shù)據(jù)庫(kù)Penicillin-binding100選擇數(shù)據(jù)庫(kù)Penicillin-binding100Entrez101Entrez10120090601搜索結(jié)果10220090601搜索結(jié)果102103103網(wǎng)頁(yè)右邊部分104網(wǎng)頁(yè)右邊部分104限定物種中檢索Mycobacteriumtuberculosis105限定物種中檢索Mycobacteriumtuberculo結(jié)果106結(jié)果106107107交集108交集108舊數(shù)據(jù)109舊數(shù)據(jù)109組合檢索“Mycobacteriumtuberculosis”[ORGN]AND“penicillin-binding”110組合檢索“Mycobacteriumtuberculosi20090601搜索結(jié)果11120090601搜索結(jié)果111/sites/batchentrez112/si/genomes/FLU/FLU.html

113/ge114114115115116116

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論