生物信息學(xué)序列分析核酸和蛋白質(zhì)數(shù)據(jù)庫_第1頁
生物信息學(xué)序列分析核酸和蛋白質(zhì)數(shù)據(jù)庫_第2頁
生物信息學(xué)序列分析核酸和蛋白質(zhì)數(shù)據(jù)庫_第3頁
生物信息學(xué)序列分析核酸和蛋白質(zhì)數(shù)據(jù)庫_第4頁
生物信息學(xué)序列分析核酸和蛋白質(zhì)數(shù)據(jù)庫_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

生物信息學(xué)序列分析核酸和蛋白質(zhì)數(shù)據(jù)庫第1頁,課件共31頁,創(chuàng)作于2023年2月課程安排:課堂多媒體講授:第一講核酸和蛋白質(zhì)數(shù)據(jù)庫第二講國內(nèi)外文獻(xiàn)數(shù)據(jù)庫第三講生物信息學(xué)常用軟件第四講序列的提交和序列分析

第2頁,課件共31頁,創(chuàng)作于2023年2月教材、參考書和學(xué)術(shù)期刊教材和參考書:1《生物信息學(xué)方法與實(shí)踐》,張成崗和賀福初編,科學(xué)出版社,2002年6月,第1版。2、《生物信息學(xué)》,趙國屏等編,科學(xué)出版社,2002年4月,第1版。3、《基礎(chǔ)生物信息學(xué)及應(yīng)用》,蔣彥等編,清華大學(xué)出版社,2003年11月,第1版4、《簡明生物信息學(xué)》,鐘楊等編,高等教育出版社,2001年12月,第1版。5、《生物信息學(xué)概論》(TKAttwood,DJParry-Smith著),羅靜初等譯,北京大學(xué)出版社,2002年4月,第1版。6、《生物信息學(xué)-基因和蛋白質(zhì)分析的實(shí)用指南》(AndreasDBaxevanis,BFFrancisOuelette著),李衍達(dá)、孫之榮等譯,清華大學(xué)出版社,2000年8月,第1版。學(xué)術(shù)期刊:

第3頁,課件共31頁,創(chuàng)作于2023年2月第一講、核酸和蛋白質(zhì)數(shù)據(jù)庫第4頁,課件共31頁,創(chuàng)作于2023年2月染色體基因組圖譜基因組數(shù)據(jù)庫核酸DNA序列核酸序列數(shù)據(jù)庫蛋白質(zhì)蛋白質(zhì)序列蛋白質(zhì)序列數(shù)據(jù)庫蛋白質(zhì)結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫基因組作圖序列測定結(jié)構(gòu)測定生物信息學(xué)數(shù)據(jù)庫工具生物信息學(xué)數(shù)據(jù)庫工具二次數(shù)據(jù)庫︿復(fù)合數(shù)據(jù)庫﹀分子生物信息數(shù)據(jù)庫概況X-衍射等物理技術(shù)第5頁,課件共31頁,創(chuàng)作于2023年2月一、核酸數(shù)據(jù)庫1、國際三大核酸數(shù)據(jù)庫數(shù)據(jù)庫(Database)網(wǎng)址(Address)GenBank/genbankEMBLwww.ebi.ac.uk/emblDDBJwww.ddbj.nig.ac.jp/index-e.html第6頁,課件共31頁,創(chuàng)作于2023年2月GenBank:由美國國家生物技術(shù)信息中心(NationalCenterforBiotechnologyInformation,NCBI)建立。該中心隸屬于美國國家醫(yī)學(xué)圖書館,位于美國國家衛(wèi)生研究院(NIH)內(nèi)。EMBL:歐洲分子生物學(xué)實(shí)驗(yàn)室(EuropeanMolecularBiologyLaboratory,其下有EuropeanBioinformaticsCentre),主要位于英國劍橋Cambridge和德國漢堡Hamburg。DDBJ:日本DNA數(shù)據(jù)庫(DNADataBankofJapan),由theNationalInstituteofGenetics,NIG主管。第7頁,課件共31頁,創(chuàng)作于2023年2月這3個(gè)大型數(shù)據(jù)庫于1988年達(dá)成協(xié)議,組成合作聯(lián)合體。它們每天交換信息,并對數(shù)據(jù)庫DNA序列記錄的統(tǒng)一標(biāo)準(zhǔn)達(dá)成一致。每個(gè)機(jī)構(gòu)負(fù)責(zé)收集來自不同地理分布的數(shù)據(jù)(EMBL負(fù)責(zé)歐洲,GenBank負(fù)責(zé)美洲,DDBJ負(fù)責(zé)亞洲等),然后來自各地的所有信息匯總在一起,3個(gè)數(shù)據(jù)庫的數(shù)據(jù)共享并向世界開放,故這3個(gè)數(shù)據(jù)庫又被稱為公共序列數(shù)據(jù)庫(PublicSequenceDatabase)。所以從理論上說,這3個(gè)數(shù)據(jù)庫所擁有的DNA序列數(shù)據(jù)是完全相同的。你可以從中選擇一個(gè)你喜歡的數(shù)據(jù)庫;但是如果你的研究需要實(shí)時(shí)(24小時(shí)以內(nèi))的,則要注意這些數(shù)據(jù)庫間的記錄是會有差異的。第8頁,課件共31頁,創(chuàng)作于2023年2月第9頁,課件共31頁,創(chuàng)作于2023年2月第10頁,課件共31頁,創(chuàng)作于2023年2月第11頁,課件共31頁,創(chuàng)作于2023年2月北京大學(xué)生物信息學(xué)中心(CentreofBioinformatics,PekingUniversity):北京華大基因研究中心(中國科學(xué)院北京基因組研究所):/bgi_new/index.htm清華大學(xué)生物系生物信息研究室:中國科學(xué)院上海生命科學(xué)研究院生物信息中心:2、我國主要生物信息學(xué)機(jī)構(gòu)第12頁,課件共31頁,創(chuàng)作于2023年2月第13頁,課件共31頁,創(chuàng)作于2023年2月3、基因組數(shù)據(jù)庫如:大腸桿菌基因組ECDC、酵母菌基因組CYGD、線蟲基因組AceDB、果蠅基因組FlyBase、老鼠基因組MGD、人類基因組GDB、擬南芥TAIR(AtDB)數(shù)據(jù)庫和水稻基因組RGP等。部分生物基因組計(jì)劃網(wǎng)址如下:第14頁,課件共31頁,創(chuàng)作于2023年2月大腸桿菌EColi——ECDC數(shù)據(jù)庫http://www.uni-giessen.de/~gx1052/ECDC/ecdc.htm酵母菌Yeast——CYGD數(shù)據(jù)庫

http://mips.gsf.de/genre/proj/yeast/index.jsp線蟲Caenorhabditiselegans

——AceDB數(shù)據(jù)庫/genome.shtml果蠅Drosophila

——FlyBase數(shù)據(jù)庫/

第15頁,課件共31頁,創(chuàng)作于2023年2月斑馬魚Zebrafish

人類Human——GDB數(shù)據(jù)庫/genome/guide/human第16頁,課件共31頁,創(chuàng)作于2023年2月擬南芥

Arabidopsis——TAIR(AtDB)數(shù)據(jù)庫/home.htmlhttp://www.kazusa.or.jp/kaos//tdb/e2k1/ath1//ResearchProjects/Arabidopsis/水稻Rice——RGP數(shù)據(jù)庫http://rgp.dna.affrc.go.jp(http://rgp.dna.affrc.go.jp/IRGSP)(/rice)/(/tdb/e2k1/osa1/)第17頁,課件共31頁,創(chuàng)作于2023年2月第18頁,課件共31頁,創(chuàng)作于2023年2月目前完成全基因組測序工作的物種有很多,并在隨時(shí)更新(update).可以進(jìn)入ncbi的基因組計(jì)劃二次數(shù)據(jù)庫查看,其網(wǎng)址:/Genomes第19頁,課件共31頁,創(chuàng)作于2023年2月第20頁,課件共31頁,創(chuàng)作于2023年2月Referenceto:方剛,陳蘊(yùn)佳,高歌,劉翟,何坤,吳昕,顧孝誠,羅靜初.基因組數(shù)據(jù)庫簡介.遺傳,2003,25(4):440-444第21頁,課件共31頁,創(chuàng)作于2023年2月4、學(xué)會查找和理解數(shù)據(jù)庫中的數(shù)據(jù)信息第22頁,課件共31頁,創(chuàng)作于2023年2月二、蛋白質(zhì)數(shù)據(jù)庫第23頁,課件共31頁,創(chuàng)作于2023年2月SWISS-PROT和PIR是國際上二個(gè)主要的蛋白質(zhì)序列數(shù)據(jù)庫,目前這二個(gè)數(shù)據(jù)庫在EMBL和GenBank數(shù)據(jù)庫上均建立了鏡像(mirror)站點(diǎn)。SWISS-PROT數(shù)據(jù)庫包括了從EMBL翻譯而來的蛋白質(zhì)序列,這些序列經(jīng)過檢驗(yàn)和注釋。該數(shù)據(jù)庫主要由日內(nèi)瓦大學(xué)醫(yī)學(xué)生物化學(xué)系和歐洲生物信息學(xué)研究所(EBI)合作維護(hù)。SWISS-PROT的序列數(shù)量呈直線增長。第24頁,課件共31頁,創(chuàng)作于2023年2月PIR數(shù)據(jù)庫的數(shù)據(jù)最初是由美國國家生物醫(yī)學(xué)研究基金會(NationalBiomedicalResearchFoundation,NBRF)收集的蛋白質(zhì)序列,主要翻譯自GenBank的DNA序列。1988年,美國的NBRF、日本的JIPID(theJapaneseInternationalProteinSequenceDatabase日本國家蛋白質(zhì)信息數(shù)據(jù)庫)、德國的MIPS(MunichInformationCentreforProteinSequences摹尼黑蛋白質(zhì)序列信息中心)合作,共同收集和維護(hù)PIR數(shù)據(jù)庫。PIR根據(jù)注釋程度(質(zhì)量)分為4個(gè)等級。第25頁,課件共31頁,創(chuàng)作于2023年2月TrEMBL(TranslatedEMBL)

數(shù)據(jù)庫也是一個(gè)蛋白質(zhì)數(shù)據(jù)庫,它包括了所有EMBL庫中的蛋白質(zhì)編碼區(qū)序列,提供了一個(gè)非常全面的蛋白質(zhì)序列數(shù)據(jù)源,但這勢必導(dǎo)致其注釋質(zhì)量的下降。第26頁,課件共31頁,創(chuàng)作于2023年2月實(shí)驗(yàn)獲得的三維蛋白質(zhì)結(jié)構(gòu)均貯存在蛋白質(zhì)數(shù)據(jù)庫PDB(ProteinDataBank)中。PDB是國際上主要的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫,雖然它沒有蛋白質(zhì)序列數(shù)據(jù)庫那么龐大,但其增長速度很快。PDB貯存有由X射線和核磁共振(NMR)確定的結(jié)構(gòu)數(shù)據(jù)。NRL-3D(NavalResearchLaboratory-3D)數(shù)據(jù)庫提供了貯存在PDB庫中蛋白質(zhì)的序列,它可以進(jìn)行與已知結(jié)構(gòu)的蛋白質(zhì)序列的比較。PDB和NRL-3D三維蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫第27頁,課件共31頁,創(chuàng)作于2023年2月對來自PDB中每個(gè)已知三維結(jié)構(gòu)的蛋白質(zhì)序列進(jìn)行多序列列線(multiplesequencealignment)同源性比較的結(jié)果,被貯存在HSSP(homology-derivedsecondstructuresofproteins)數(shù)據(jù)庫中。被列為同源的蛋白質(zhì)序列很有可能具有相同的三維結(jié)構(gòu),HSSP因此根據(jù)同源性給出了SWISS-PROT數(shù)據(jù)庫中所有蛋白質(zhì)序列最有可能的三維結(jié)構(gòu)。要想了解對已知結(jié)構(gòu)蛋白質(zhì)進(jìn)行等級分類的情況可利用SCOP(Structuralclassificationofproteins)數(shù)據(jù)庫,在該庫中可以比較某一蛋白質(zhì)與已知結(jié)構(gòu)蛋白的結(jié)構(gòu)相似性。CATH(Class,Architecture,TopologyandHomologoussuperfamily)是與SCOP類似的一個(gè)數(shù)據(jù)庫。

第28頁,課件共31頁,創(chuàng)作于2023年2月目前,瑞士生物信息學(xué)研究所(SwissInstituteofBioinformatics,SIB)創(chuàng)建了蛋白質(zhì)分析專家系統(tǒng)(Expertproteinanalysissystem,ExPASy,網(wǎng)址:)涵蓋了上述主要的數(shù)據(jù)庫。我國的北京大學(xué)生物信息中心()設(shè)立了ExPASy的鏡像(Mirror)。ExPASy蛋白質(zhì)分析專家系統(tǒng)第29頁,課件共31頁,創(chuàng)作于2023年2月ProteindatabaseinNCBI

/proteinTheProteindatabaseisacollectionofsequencesfromseveralsources,includingtranslationsfromannotatedcodingregionsinGenBank,RefSeqandTPA,aswellasrecordsfromSwissProt,PIR,PRF,andPDB.Proteinsequencesarethefundamentaldeterminantsofbiologicalstructureandfunction.第30頁,課件共31頁,創(chuàng)作于2023年2月蛋白質(zhì)序列中的一些符號含義蛋白質(zhì)基序(motif)中的x表示任意氨基酸,其中的數(shù)字表示任意幾個(gè)氨基酸;中括號[ST]表示氨基酸為SorT;大括號{P}表示除掉P之外的任意氨基酸。如:IDASN_GL

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論