版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
生物信息學(xué)(bioinformatics)
在生命科學(xué)研究中發(fā)展起來(lái)的一門由分子生物學(xué)與計(jì)算機(jī)信息處理技術(shù)相結(jié)合,以計(jì)算機(jī)為研究工具對(duì)生物信息進(jìn)行獲取、處理、儲(chǔ)存、傳播、分析、模擬和解釋的交叉學(xué)科。目前一頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)生物信息學(xué)研究?jī)?nèi)容它利用數(shù)據(jù)庫(kù)技術(shù)和軟件技術(shù)對(duì)大量積累的生物大分子序列數(shù)據(jù)進(jìn)行比較和分析,揭示出生物大分子的分子結(jié)構(gòu)、功能和進(jìn)化關(guān)系以及基因組構(gòu)成與基因表達(dá)等生物學(xué)事件對(duì)生命活動(dòng)的影響。
目前二頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)生物信息學(xué)研究重點(diǎn)主要體現(xiàn)在基因組學(xué)(genomics)和蛋白質(zhì)組學(xué)(proteomics)兩方面。它從核酸和蛋白質(zhì)序列出發(fā),分析序列中與結(jié)構(gòu)、功能相關(guān)的生物信息的表達(dá)。目前三頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)生物信息學(xué)數(shù)據(jù)庫(kù)生物信息學(xué)中的各類數(shù)據(jù)庫(kù)幾乎覆蓋了生命科學(xué)的各個(gè)領(lǐng)域,如核酸序列數(shù)據(jù)庫(kù),蛋白質(zhì)序列數(shù)據(jù)庫(kù),蛋白質(zhì)、核酸、多糖的三維結(jié)構(gòu)數(shù)據(jù)庫(kù),基因組數(shù)據(jù)庫(kù),文獻(xiàn)數(shù)據(jù)庫(kù)和其他種類數(shù)據(jù)庫(kù)。目前四頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)生物信息學(xué)數(shù)據(jù)庫(kù)分類
生物信息數(shù)據(jù)庫(kù)種類繁多,就目前來(lái)看,大體可以分為四個(gè)大類:
1.基因組數(shù)據(jù)庫(kù);
2.核酸和蛋白質(zhì)一級(jí)結(jié)構(gòu)序列數(shù)據(jù)庫(kù);
3.生物大分子(主要是蛋白質(zhì))三維空間結(jié)構(gòu)數(shù)據(jù)庫(kù);
4.根據(jù)以上三類數(shù)據(jù)庫(kù)和文獻(xiàn)資料為基礎(chǔ)構(gòu)建的二次數(shù)據(jù)庫(kù)。也稱專門數(shù)據(jù)庫(kù)、專業(yè)數(shù)據(jù)庫(kù)或?qū)S脭?shù)據(jù)庫(kù)。一次數(shù)據(jù)庫(kù)目前五頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)第二節(jié)核酸序列數(shù)據(jù)庫(kù)
Section2NucleicAcidsequenceDatabases自20世紀(jì)80年代第一個(gè)核酸數(shù)據(jù)庫(kù)建立以來(lái),核酸數(shù)據(jù)庫(kù)迅速發(fā)展。在互聯(lián)網(wǎng)上不僅有核酸序列數(shù)據(jù)庫(kù),還出現(xiàn)了基因組相關(guān)數(shù)據(jù)庫(kù)、核酸三維結(jié)構(gòu)數(shù)據(jù)庫(kù)、基因表達(dá)數(shù)據(jù)庫(kù)、人類基因突變及疾病相關(guān)數(shù)據(jù)庫(kù)、進(jìn)化相關(guān)數(shù)據(jù)庫(kù)及其他與核酸有關(guān)的數(shù)據(jù)庫(kù)。目前六頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)三大核酸序列數(shù)據(jù)庫(kù)GenBankEMBLDDBJ
目前七頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)特殊類型核酸序列數(shù)據(jù)庫(kù):非編碼RNA數(shù)據(jù)庫(kù)(ncRNA);表達(dá)序列標(biāo)簽數(shù)據(jù)庫(kù)(dbEST);序列標(biāo)簽位點(diǎn)數(shù)據(jù)庫(kù)(dbSTS);miRBase;tRNAdb等。目前八頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)基因組相關(guān)數(shù)據(jù)庫(kù):人類基因組數(shù)據(jù)庫(kù)(HGD);基因組序列數(shù)據(jù)庫(kù)(GSDB);基因組在線數(shù)據(jù)庫(kù)(GOLD)等。目前九頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)核酸三維結(jié)構(gòu)數(shù)據(jù)庫(kù):核苷酸三維結(jié)構(gòu)數(shù)據(jù)庫(kù)(NDB);普納大學(xué)核酸結(jié)構(gòu)數(shù)據(jù)庫(kù)(BNASDB)等。目前十頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)基因表達(dá)數(shù)據(jù)庫(kù):基因表達(dá)庫(kù)(GEO);斯坦福微陣列數(shù)據(jù)庫(kù)(SMD);ArrayExpress;CGED;GXD;BodyMap等。目前十一頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)人類基因突變及疾病相關(guān)數(shù)據(jù)庫(kù):人類基因變異數(shù)據(jù)庫(kù)(HMGD)、人類遺傳雙等位基因序列數(shù)據(jù)庫(kù)(HGBASE)、人類孟德?tīng)栠z傳在線(OMIM)、國(guó)際單體型計(jì)劃(HapMap)、人類單核苷酸多態(tài)性數(shù)據(jù)庫(kù)(dbSNP)、腫瘤基因數(shù)據(jù)庫(kù)(TGDB)、疾病關(guān)聯(lián)數(shù)據(jù)庫(kù)(GAD)、癌癥基因數(shù)據(jù)庫(kù)(CGAP)、人類表觀遺傳數(shù)據(jù)庫(kù)(HEP)、人類DNA甲基化與癌癥數(shù)據(jù)庫(kù)(MethylCancer)等。目前十二頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)一、GenBank數(shù)據(jù)庫(kù)GenBank()是一個(gè)綜合數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)中包含了已經(jīng)公開(kāi)的30萬(wàn)余種不同物種生物的核酸序列,這些數(shù)據(jù)主要來(lái)源于全世界不同實(shí)驗(yàn)室和大規(guī)模測(cè)序計(jì)劃項(xiàng)目。
目前十三頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)GenBank是具有目錄和生物學(xué)注釋的核酸序列綜合數(shù)據(jù)庫(kù),由美國(guó)國(guó)家醫(yī)學(xué)圖書(shū)館的國(guó)家生物技術(shù)信息中心構(gòu)建、維護(hù)和管理。該中心位于美國(guó)馬里蘭國(guó)家健康研究所(NIH)。GenBank數(shù)據(jù)庫(kù)的序列數(shù)據(jù)來(lái)源于序列發(fā)現(xiàn)者提交的序列、批量提交的表達(dá)序列標(biāo)簽(expressedsequencetag,EST)、基因組測(cè)序序列(genomesurveysequence,GSS)和其他測(cè)序中心提供的高通量數(shù)據(jù),還包括美國(guó)專利商標(biāo)局提供的已發(fā)表專利的序列數(shù)據(jù)。目前十四頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)GenBank數(shù)據(jù)庫(kù)每天與歐洲分子生物學(xué)實(shí)驗(yàn)室的核酸序列數(shù)據(jù)庫(kù)(EuropeanMolecularBiologyLaboratoryNucleotideSequenceDatabase,EMBL)和日本的DNA數(shù)據(jù)庫(kù)(DNADataBankofJapanDDBJ)進(jìn)行數(shù)據(jù)交換,以保證數(shù)據(jù)庫(kù)內(nèi)容在全世界范圍的同步性。目前十五頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)在NCBI()的主頁(yè)上提供了進(jìn)入GenBank的路徑、相關(guān)檢索和分析服務(wù)。通過(guò)NCBI的檢索系統(tǒng)(Entrez)可以進(jìn)入GenBank。Entrez檢索程序整合了主要的DNA和蛋白序列數(shù)據(jù)的分類學(xué)、基因組、圖譜、蛋白結(jié)構(gòu)和結(jié)構(gòu)(功能)域信息,還包括相關(guān)的PubMed的生物醫(yī)學(xué)文獻(xiàn)信息。BLAST程序提供GenBank和其他序列數(shù)據(jù)庫(kù)中序列相似性搜索服務(wù)。
目前十六頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)(一)GenBank數(shù)據(jù)庫(kù)結(jié)構(gòu)1.依據(jù)序列的物種來(lái)源分類2.Genbank記錄和分類2.1表達(dá)序列標(biāo)簽(EST)2.2序列標(biāo)簽位點(diǎn)(STS)、基因組勘測(cè)序列(GSS)和環(huán)境樣品序列(ENV)2.3高通量基因組(HTG)和高通量cDNA(HTC)序列2.4全基因組鳥(niǎo)槍測(cè)序序列(WGS)2.5轉(zhuǎn)錄組鳥(niǎo)槍組合序列目前十七頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)(一)GenBank數(shù)據(jù)庫(kù)結(jié)構(gòu)3.特殊記錄類型3.1第三方注釋(TPA)3.2GenBankCON記錄較小記錄組合記錄目前十八頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)(二)構(gòu)建數(shù)據(jù)庫(kù)1.直接電子提交1.1使用BankIt提交1.2使用Sequin和tbl2asn提交1.3條形碼序列提交2.序列標(biāo)識(shí)符和記錄號(hào)目前十九頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)(三)檢索GenBank數(shù)據(jù)1.Entrez系統(tǒng)()2.與測(cè)序計(jì)劃?rùn)z索相關(guān)的序列記錄()3.BLAST序列相似性搜索()4.用FTP獲取GenBank()目前二十頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)二、EMBL數(shù)據(jù)庫(kù)EMBL建立于1980年,EMBL核苷序列數(shù)據(jù)庫(kù)()是歐洲主要的核苷序列收集單位,歐洲生物信息中心EBI(即EMBL在德國(guó)海德堡的站點(diǎn))維護(hù)這個(gè)數(shù)據(jù)庫(kù)。核苷數(shù)據(jù)來(lái)自基因組測(cè)序中心、世界各地的科學(xué)家、歐洲專利局、以及與合作伙伴DDBJ(Japan)和GenBank(USA)交換的數(shù)據(jù)。目前二十一頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)三、DDBJ數(shù)據(jù)庫(kù)日本DNA數(shù)據(jù)庫(kù)(DDBJ)是在亞洲唯一的核酸序列數(shù)據(jù)庫(kù),是搜集研究者公認(rèn)的測(cè)定核酸序列的數(shù)據(jù)庫(kù),并且發(fā)放給數(shù)據(jù)提交者國(guó)際認(rèn)證的核酸序列編號(hào)。由于DDBJ每天將搜集的數(shù)據(jù)與EMBL-Bank/EBI和GenBank/NCBI進(jìn)行交換,使得三個(gè)核酸數(shù)據(jù)庫(kù)幾乎在任何時(shí)候都享有相同數(shù)據(jù)。DDBJ主要收集來(lái)自日本研究者獲得的序列數(shù)據(jù),但也收集數(shù)據(jù)和發(fā)放編號(hào)給任何其他國(guó)家的研究者。目前二十二頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)四、其他重要的核酸序列數(shù)據(jù)庫(kù)dbEST:dbEST是GenBank中的一個(gè)子數(shù)據(jù)庫(kù),包含來(lái)源于不同物種的表達(dá)序列數(shù)據(jù)和表達(dá)序列標(biāo)簽序列的其他信息。ncRNAdb:非編碼RNA(non-codingRNAncRNA)數(shù)據(jù)庫(kù)旨在提供非編碼RNA的序列和功能信息。miRBase:miRBase序列數(shù)據(jù)庫(kù)主要存放已發(fā)表的微小RNA(microRNAmiRNA)序列和注釋的數(shù)據(jù)庫(kù)。目前二十三頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)第三節(jié)蛋白質(zhì)序列數(shù)據(jù)庫(kù)
Section3ProteinSequenceDatabase
隨著分子生物學(xué)的發(fā)展,人們獲得了越來(lái)越多關(guān)于蛋白質(zhì)序列、結(jié)構(gòu)和功能的信息。世界各國(guó)的生物學(xué)家和計(jì)算機(jī)科學(xué)家合作利用這些信息構(gòu)建了蛋白質(zhì)序列數(shù)據(jù)庫(kù)、蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫(kù)、蛋白質(zhì)組數(shù)據(jù)庫(kù)(二維凝膠電泳數(shù)據(jù)庫(kù))、信號(hào)傳導(dǎo)及蛋白質(zhì)-蛋白質(zhì)相互作用相關(guān)數(shù)據(jù)庫(kù)、DNA和蛋白質(zhì)相互作用數(shù)據(jù)庫(kù)等蛋白質(zhì)相關(guān)數(shù)據(jù)庫(kù)。
目前二十四頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)常用的蛋白質(zhì)序列數(shù)據(jù)庫(kù):PIRMIPSSwiss-Prot目前二十五頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)蛋白質(zhì)功能、結(jié)構(gòu)域和蛋白質(zhì)家族有關(guān)的數(shù)據(jù)庫(kù):PROSITEInterProPfamProDomSMART等目前二十六頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)蛋白質(zhì)三維結(jié)構(gòu)相關(guān)數(shù)據(jù)庫(kù):PDBBioMagResBankSWISS-MODELRepositoryModBaseCATHSCOPReLiBaseTOPSSWISS-3DIMAGEBioImage等目前二十七頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)蛋白質(zhì)二維凝膠電泳數(shù)據(jù)庫(kù):WORLD-2DPAGEPhoretixlinks目前二十八頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)信號(hào)傳導(dǎo)及蛋白質(zhì)-蛋白質(zhì)相互作用相關(guān)數(shù)據(jù)庫(kù):DIPINTERACTProNetKEGGCANSITESPADCSNDB等目前二十九頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)DNA和蛋白質(zhì)相互作用數(shù)據(jù)庫(kù):DPInteract蛋白質(zhì)翻譯后修飾相關(guān)數(shù)據(jù)庫(kù):O-GlycBase、PhosphoBase、RES蛋白質(zhì)等蛋白質(zhì)目前三十頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)一、PIR數(shù)據(jù)庫(kù)蛋白質(zhì)信息庫(kù)(PIR)()是一個(gè)支持基因組學(xué)、蛋白質(zhì)組學(xué)和系統(tǒng)生物學(xué)檢索和科學(xué)研究的綜合公共生物信息學(xué)資源。PIR是由美國(guó)國(guó)家生物醫(yī)學(xué)基金會(huì)(NBRF)于1984年建立,幫助研究者確認(rèn)和解釋蛋白序列信息的數(shù)據(jù)庫(kù)。PIR免費(fèi)為科學(xué)界提供包括蛋白序列數(shù)據(jù)庫(kù)(PSD)在內(nèi)的蛋白數(shù)據(jù)庫(kù)和分析工具。目前三十一頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)PIR信息庫(kù)資源目前三十二頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)PIR主要數(shù)據(jù)庫(kù):1.UniProt-通用蛋白質(zhì)資源庫(kù)2.iProClass-蛋白質(zhì)知識(shí)整合數(shù)據(jù)庫(kù)3.PIRSF-蛋白質(zhì)家族分類系統(tǒng)4.iProLINK-蛋白質(zhì)文獻(xiàn)、信息和知識(shí)整合數(shù)據(jù)庫(kù)目前三十三頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)1.UniProt-通用蛋白質(zhì)資源庫(kù)UniProt()是存儲(chǔ)和鏈接其他蛋白質(zhì)數(shù)據(jù)庫(kù)的資源庫(kù),并且是蛋白質(zhì)序列和具有綜合功能注釋目錄的中心資源庫(kù)。使用UniprotKB可以檢索準(zhǔn)確、可靠的蛋白綜合信息。使用UniRef可以減少冗余,加速序列相似性搜索。使用UniParc可以檢索存檔序列和它們來(lái)源的數(shù)據(jù)庫(kù)。目前三十四頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)2.iProClass-蛋白質(zhì)知識(shí)整合數(shù)據(jù)庫(kù)iProClass()提供來(lái)自90多個(gè)生物學(xué)數(shù)據(jù)庫(kù)的大量整合數(shù)據(jù),包括蛋白ID圖譜服務(wù)、UniProtKB編注蛋白質(zhì)摘要描述和篩選UnParc數(shù)據(jù)庫(kù)的蛋白質(zhì)序列。使用iProClass可以檢索最新的蛋白質(zhì)綜合信息,包括:功能、轉(zhuǎn)導(dǎo)通路、相互作用、家族分類、基因和基因組、功能注釋標(biāo)準(zhǔn)體系(ontology)、文獻(xiàn)和分類學(xué)信息。使用iProClass還可以檢索ID圖譜、蛋白質(zhì)詞典和相關(guān)序列。目前三十五頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)3.PIRSF-蛋白質(zhì)家族分類系統(tǒng)PIRSF()分類系統(tǒng)概要論述家族的特征,如家族名稱、分類分布、分級(jí)和功能域結(jié)構(gòu),以及家族成員,包括功能、結(jié)構(gòu)、傳導(dǎo)通路、功能注釋標(biāo)準(zhǔn)體系(ontology)和家族分類。利用這些信息可以獲得蛋白質(zhì)的準(zhǔn)確功能或預(yù)測(cè)的功能和該蛋白質(zhì)所屬家族成員共有的其他特征。目前三十六頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)4.iProLINK-蛋白質(zhì)文獻(xiàn)、信息和知識(shí)整合數(shù)據(jù)庫(kù)iProLINK()提供有關(guān)注釋內(nèi)容的文獻(xiàn)、蛋白質(zhì)名稱詞典和其他有助于文獻(xiàn)挖掘的人文語(yǔ)言處理技術(shù)開(kāi)發(fā)的信息、數(shù)據(jù)庫(kù)校正、蛋白質(zhì)名稱標(biāo)記和功能注釋標(biāo)準(zhǔn)體系(ontology)。使用iProLINK可以獲得描述蛋白質(zhì)記錄的文本文獻(xiàn)資源,在UniProtKB記錄(生物詞典)中加入蛋白質(zhì)或基因命名的圖譜,獲得用于開(kāi)發(fā)文本挖掘算法的注釋數(shù)據(jù)集、挖掘蛋白質(zhì)磷酸化(RLIMS-P)文獻(xiàn)和獲得蛋白質(zhì)功能注釋標(biāo)準(zhǔn)體系(ontology)(PRO)信息。目前三十七頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)二、MIPS數(shù)據(jù)庫(kù)慕尼黑蛋白質(zhì)序列信息中心(MIPS)(),它的重點(diǎn)工作是基因組生物信息學(xué),特別注重基因組信息系統(tǒng)分析,包括應(yīng)用生物信息學(xué)方法注釋基因組、表達(dá)分析和蛋白質(zhì)組學(xué)方面研究。MIPS支持和維護(hù)一系列基因組數(shù)據(jù)庫(kù)以及系統(tǒng),可以提供細(xì)菌、真菌和植物基因組比較分析服務(wù)。在該站點(diǎn)提供基因組分析工具、數(shù)據(jù)庫(kù)檢索系統(tǒng)、表達(dá)分析、蛋白相互作用等網(wǎng)絡(luò)服務(wù)。
目前三十八頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)三、其他重要的蛋白質(zhì)序列數(shù)據(jù)庫(kù):PRINTSPfam目前三十九頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)(一)PRINTSPRINTS()是蛋白基序指紋圖綜合數(shù)據(jù)庫(kù),每個(gè)指紋圖都是使用數(shù)據(jù)掃描程序ADSP或VISTAS序列分析軟件包反復(fù)優(yōu)化后定義的。數(shù)據(jù)庫(kù)中有兩種類型指紋圖,根據(jù)指紋圖的復(fù)雜性分為簡(jiǎn)單和復(fù)合指紋圖:簡(jiǎn)單指紋圖基本上是單一的基序,而復(fù)合指紋圖包含多個(gè)基序。
目前四十頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)(二)Pfam蛋白質(zhì)一般是由一個(gè)或多個(gè)功能區(qū)域組成,這些功能區(qū)域通常稱作域(domain)。在不同的蛋白質(zhì)中不同的域以不同的組合出現(xiàn),導(dǎo)致在自然界發(fā)現(xiàn)多種多樣組成成分的蛋白質(zhì)。識(shí)別出現(xiàn)在蛋白質(zhì)中的域可以了解蛋白質(zhì)的功能。Pfam數(shù)據(jù)庫(kù)()是一個(gè)大的蛋白質(zhì)域家族集合,每個(gè)家族是用多序列比對(duì)和隱馬模型(HMMs)分析結(jié)果的代表。目前四十一頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)第四節(jié)NCBI與EBI
Section4NCBIandEBI一、NCBI的簡(jiǎn)介二、EBI簡(jiǎn)介目前四十二頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)一、NCBI的簡(jiǎn)介作為一個(gè)國(guó)家分子生物學(xué)信息資源,NCBI的使命是開(kāi)發(fā)新的信息技術(shù),幫助理解控制健康和疾病的基本分子和遺傳過(guò)程。特別是,NCBI肩負(fù)建立存儲(chǔ)和分析分子生物學(xué)、生物化學(xué)和遺傳學(xué)知識(shí)的自動(dòng)系統(tǒng);提供研究和醫(yī)學(xué)界使用方便的數(shù)據(jù)庫(kù)和軟件;努力協(xié)調(diào)搜集國(guó)內(nèi)外生物技術(shù)信息;執(zhí)行分析生物學(xué)重要分子結(jié)構(gòu)和功能的先進(jìn)研究方法。目前四十三頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)二、EBI簡(jiǎn)介歐洲生物信息學(xué)研究所(EMBL-EBI),是歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)的一部分,EMBL-EBI維護(hù)世界上最廣泛的分子數(shù)據(jù)庫(kù)。EMBL-EBI是在全球范圍內(nèi),努力協(xié)調(diào)搜集和傳播生物學(xué)數(shù)據(jù)的歐洲節(jié)點(diǎn),EMBL-EBI的許多數(shù)據(jù)庫(kù)是生物學(xué)家們熟知的,包括:EMBL-Bank(DNA和RNA序列)、Ensemble(基因組)、ArrayExpress(基于微陣列的基因表達(dá)數(shù)據(jù))、UniProt(蛋白質(zhì)序列)、InterPro(蛋白家族、域和基序)、Reactome(傳導(dǎo)通路)和ChEBI(小分子),新的資源幫助研究者不僅了解構(gòu)成生物體的分子部件,還了解這些部件是如何組合構(gòu)成系統(tǒng)的。
目前四十四頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)三、通過(guò)EntrezGene從NCBI獲取序列信息Entrez主要是用于NCBI數(shù)據(jù)庫(kù)綜合的、基于文本的搜索和檢索系統(tǒng)。Entrez綜合了科學(xué)文獻(xiàn)、DNA和蛋白序列數(shù)據(jù)、3D蛋白質(zhì)結(jié)構(gòu)和蛋白質(zhì)域數(shù)據(jù)、種群研究數(shù)據(jù)集、表達(dá)數(shù)據(jù)、完整基因組組裝和分類學(xué)信息,形成一個(gè)緊密鏈接的系統(tǒng)。它用于搜索NCBI鏈接數(shù)據(jù)庫(kù)的檢索系統(tǒng)。目前四十五頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)Entrez檢索系統(tǒng)子數(shù)據(jù)庫(kù)目前四十六頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)(一)EntrezGene檢索EntrezGene檢索到的記錄提供關(guān)鍵鏈接,將圖譜、序列、表達(dá)、結(jié)構(gòu)、功能、索引文獻(xiàn)和同源數(shù)據(jù)鏈接在一起構(gòu)成關(guān)鍵鏈接。用定義序列、已知的圖譜定位和從表型信息推測(cè)的基因,為基因分配特有標(biāo)識(shí)符。這些標(biāo)識(shí)符在NCBI的數(shù)據(jù)庫(kù)中通用,可以用于注釋更新跟蹤和相關(guān)信息跟蹤。EntrezGene用NCBI參考序列(RefSeqs)覆蓋了基因組,還被整合到NCBI的Entrez和E-Utilities系統(tǒng)的索引、查詢和檢索中。
目前四十七頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)NCBI檢索首頁(yè)檢索窗口的數(shù)據(jù)庫(kù)
選項(xiàng)下拉菜單目前四十八頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)檢索欄(for)輸入“IL-2human”
目前四十九頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)(二)EntrezGene記錄顯示格式當(dāng)進(jìn)行檢索時(shí),檢索結(jié)果以摘要(summary)格式顯示,每頁(yè)可顯示多條記錄,摘要顯示的每條記錄前有一個(gè)選擇框,可以選擇哪些記錄需要顯示。顯示內(nèi)容還包括首選名稱標(biāo)志、完整全名、雙單詞的物種名稱(在方括號(hào)中)、基因組定位和基因編號(hào)。如果基因在已命名的質(zhì)粒上,那么作為基因定位將給出質(zhì)粒名稱。右側(cè)的Links可以關(guān)聯(lián)到顯示相關(guān)的Entrez記錄,核對(duì)希望顯示的記錄,選擇灰色查詢條目中的顯示選項(xiàng),可以顯示希望顯示的相關(guān)記錄。目前五十頁(yè)\總數(shù)六十二頁(yè)\編于十九點(diǎn)EntrezGene檢索結(jié)果摘要格式顯示頁(yè)面
目前五十一
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度建筑用鋼材料采購(gòu)合同范本
- 二零二五年度房地產(chǎn)項(xiàng)目普法合同執(zhí)行與消費(fèi)者權(quán)益保護(hù)合同3篇
- 2025版編劇聘用合同范本(原創(chuàng)劇本創(chuàng)作)3篇
- 2025年酒類團(tuán)購(gòu)服務(wù)及產(chǎn)品經(jīng)銷一體化合同
- 二零二五年度毛巾品牌授權(quán)及銷售合同
- 二零二五年度智慧社區(qū)土地租賃合同模板
- 2025年度個(gè)人交通事故損害賠償法律援助合同
- 課題申報(bào)參考:明清尺牘選本書(shū)畫文獻(xiàn)研究
- 2025年度個(gè)人信用保證保險(xiǎn)合同范本大全2篇
- 課題申報(bào)參考:寧海古戲臺(tái)建造技藝與匠作譜系研究
- 基因突變和基因重組(第1課時(shí))高一下學(xué)期生物人教版(2019)必修2
- 內(nèi)科學(xué)(醫(yī)學(xué)高級(jí)):風(fēng)濕性疾病試題及答案(強(qiáng)化練習(xí))
- 音樂(lè)劇好看智慧樹(shù)知到期末考試答案2024年
- 辦公設(shè)備(電腦、一體機(jī)、投影機(jī)等)采購(gòu) 投標(biāo)方案(技術(shù)方案)
- 查干淖爾一號(hào)井環(huán)評(píng)
- 案卷評(píng)查培訓(xùn)課件模板
- 2024年江蘇省樣卷五年級(jí)數(shù)學(xué)上冊(cè)期末試卷及答案
- 波浪理論要點(diǎn)圖解完美版
- 金融交易數(shù)據(jù)分析與風(fēng)險(xiǎn)評(píng)估項(xiàng)目環(huán)境敏感性分析
- 牛頓環(huán)與劈尖實(shí)驗(yàn)論文
- 移動(dòng)商務(wù)內(nèi)容運(yùn)營(yíng)(吳洪貴)任務(wù)四 其他平臺(tái)載體的運(yùn)營(yíng)方式
評(píng)論
0/150
提交評(píng)論