版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
生物信息學序列分析核酸和蛋白質數(shù)據庫第一頁,共三十一頁,2022年,8月28日課程安排:課堂多媒體講授:第一講核酸和蛋白質數(shù)據庫第二講國內外文獻數(shù)據庫第三講生物信息學常用軟件第四講序列的提交和序列分析
第二頁,共三十一頁,2022年,8月28日教材、參考書和學術期刊教材和參考書:1《生物信息學方法與實踐》,張成崗和賀福初編,科學出版社,2002年6月,第1版。2、《生物信息學》,趙國屏等編,科學出版社,2002年4月,第1版。3、《基礎生物信息學及應用》,蔣彥等編,清華大學出版社,2003年11月,第1版4、《簡明生物信息學》,鐘楊等編,高等教育出版社,2001年12月,第1版。5、《生物信息學概論》(TKAttwood,DJParry-Smith著),羅靜初等譯,北京大學出版社,2002年4月,第1版。6、《生物信息學-基因和蛋白質分析的實用指南》(AndreasDBaxevanis,BFFrancisOuelette著),李衍達、孫之榮等譯,清華大學出版社,2000年8月,第1版。學術期刊:
第三頁,共三十一頁,2022年,8月28日第一講、核酸和蛋白質數(shù)據庫第四頁,共三十一頁,2022年,8月28日染色體基因組圖譜基因組數(shù)據庫核酸DNA序列核酸序列數(shù)據庫蛋白質蛋白質序列蛋白質序列數(shù)據庫蛋白質結構蛋白質結構數(shù)據庫基因組作圖序列測定結構測定生物信息學數(shù)據庫工具生物信息學數(shù)據庫工具二次數(shù)據庫︿復合數(shù)據庫﹀分子生物信息數(shù)據庫概況X-衍射等物理技術第五頁,共三十一頁,2022年,8月28日一、核酸數(shù)據庫1、國際三大核酸數(shù)據庫數(shù)據庫(Database)網址(Address)第六頁,共三十一頁,2022年,8月28日GenBank:由美國國家生物技術信息中心(NationalCenterforBiotechnologyInformation,NCBI)建立。該中心隸屬于美國國家醫(yī)學圖書館,位于美國國家衛(wèi)生研究院(NIH)內。EMBL:歐洲分子生物學實驗室(EuropeanMolecularBiologyLaboratory,其下有EuropeanBioinformaticsCentre),主要位于英國劍橋Cambridge和德國漢堡Hamburg。DDBJ:日本DNA數(shù)據庫(DNADataBankofJapan),由theNationalInstituteofGenetics,NIG主管。第七頁,共三十一頁,2022年,8月28日這3個大型數(shù)據庫于1988年達成協(xié)議,組成合作聯(lián)合體。它們每天交換信息,并對數(shù)據庫DNA序列記錄的統(tǒng)一標準達成一致。每個機構負責收集來自不同地理分布的數(shù)據(EMBL負責歐洲,GenBank負責美洲,DDBJ負責亞洲等),然后來自各地的所有信息匯總在一起,3個數(shù)據庫的數(shù)據共享并向世界開放,故這3個數(shù)據庫又被稱為公共序列數(shù)據庫(PublicSequenceDatabase)。所以從理論上說,這3個數(shù)據庫所擁有的DNA序列數(shù)據是完全相同的。你可以從中選擇一個你喜歡的數(shù)據庫;但是如果你的研究需要實時(24小時以內)的,則要注意這些數(shù)據庫間的記錄是會有差異的。第八頁,共三十一頁,2022年,8月28日第九頁,共三十一頁,2022年,8月28日第十頁,共三十一頁,2022年,8月28日第十一頁,共三十一頁,2022年,8月28日北京大學生物信息學中心(CentreofBioinformatics,PekingUniversity):北京華大基因研究中心(中國科學院北京基因組研究所):清華大學生物系生物信息研究室:中國科學院上海生命科學研究院生物信息中心:2、我國主要生物信息學機構第十二頁,共三十一頁,2022年,8月28日第十三頁,共三十一頁,2022年,8月28日3、基因組數(shù)據庫如:大腸桿菌基因組ECDC、酵母菌基因組CYGD、線蟲基因組AceDB、果蠅基因組FlyBase、老鼠基因組MGD、人類基因組GDB、擬南芥TAIR(AtDB)數(shù)據庫和水稻基因組RGP等。部分生物基因組計劃網址如下:第十四頁,共三十一頁,2022年,8月28日大腸桿菌EColi——ECDC數(shù)據庫http://www.uni-giessen.de/~gx1052/ECDC/ecdc.htm酵母菌Yeast——CYGD數(shù)據庫
線蟲Caenorhabditiselegans
——AceDB數(shù)據庫果蠅Drosophila
——FlyBase數(shù)據庫
第十五頁,共三十一頁,2022年,8月28日斑馬魚Zebrafish
人類Human——GDB數(shù)據庫第十六頁,共三十一頁,2022年,8月28日擬南芥
Arabidopsis——TAIR(AtDB)數(shù)據庫水稻Rice——RGP數(shù)據庫(http://rgp.dna.affrc.go.jp/IRGSP)(/rice)(/tdb/e2k1/osa1/)第十七頁,共三十一頁,2022年,8月28日第十八頁,共三十一頁,2022年,8月28日目前完成全基因組測序工作的物種有很多,并在隨時更新(update).可以進入ncbi的基因組計劃二次數(shù)據庫查看,其網址:第十九頁,共三十一頁,2022年,8月28日第二十頁,共三十一頁,2022年,8月28日Referenceto:方剛,陳蘊佳,高歌,劉翟,何坤,吳昕,顧孝誠,羅靜初.基因組數(shù)據庫簡介.遺傳,2003,25(4):440-444第二十一頁,共三十一頁,2022年,8月28日4、學會查找和理解數(shù)據庫中的數(shù)據信息第二十二頁,共三十一頁,2022年,8月28日二、蛋白質數(shù)據庫第二十三頁,共三十一頁,2022年,8月28日SWISS-PROT和PIR是國際上二個主要的蛋白質序列數(shù)據庫,目前這二個數(shù)據庫在EMBL和GenBank數(shù)據庫上均建立了鏡像(mirror)站點。SWISS-PROT數(shù)據庫包括了從EMBL翻譯而來的蛋白質序列,這些序列經過檢驗和注釋。該數(shù)據庫主要由日內瓦大學醫(yī)學生物化學系和歐洲生物信息學研究所(EBI)合作維護。SWISS-PROT的序列數(shù)量呈直線增長。第二十四頁,共三十一頁,2022年,8月28日PIR數(shù)據庫的數(shù)據最初是由美國國家生物醫(yī)學研究基金會(NationalBiomedicalResearchFoundation,NBRF)收集的蛋白質序列,主要翻譯自GenBank的DNA序列。1988年,美國的NBRF、日本的JIPID(theJapaneseInternationalProteinSequenceDatabase日本國家蛋白質信息數(shù)據庫)、德國的MIPS(MunichInformationCentreforProteinSequences摹尼黑蛋白質序列信息中心)合作,共同收集和維護PIR數(shù)據庫。PIR根據注釋程度(質量)分為4個等級。第二十五頁,共三十一頁,2022年,8月28日TrEMBL(TranslatedEMBL)
數(shù)據庫也是一個蛋白質數(shù)據庫,它包括了所有EMBL庫中的蛋白質編碼區(qū)序列,提供了一個非常全面的蛋白質序列數(shù)據源,但這勢必導致其注釋質量的下降。第二十六頁,共三十一頁,2022年,8月28日實驗獲得的三維蛋白質結構均貯存在蛋白質數(shù)據庫PDB(ProteinDataBank)中。PDB是國際上主要的蛋白質結構數(shù)據庫,雖然它沒有蛋白質序列數(shù)據庫那么龐大,但其增長速度很快。PDB貯存有由X射線和核磁共振(NMR)確定的結構數(shù)據。NRL-3D(NavalResearchLaboratory-3D)數(shù)據庫提供了貯存在PDB庫中蛋白質的序列,它可以進行與已知結構的蛋白質序列的比較。PDB和NRL-3D三維蛋白質結構數(shù)據庫第二十七頁,共三十一頁,2022年,8月28日對來自PDB中每個已知三維結構的蛋白質序列進行多序列列線(multiplesequencealignment)同源性比較的結果,被貯存在HSSP(homology-derivedsecondstructuresofproteins)數(shù)據庫中。被列為同源的蛋白質序列很有可能具有相同的三維結構,HSSP因此根據同源性給出了SWISS-PROT數(shù)據庫中所有蛋白質序列最有可能的三維結構。要想了解對已知結構蛋白質進行等級分類的情況可利用SCOP(Structuralclassificationofproteins)數(shù)據庫,在該庫中可以比較某一蛋白質與已知結構蛋白的結構相似性。CATH(Class,Architecture,TopologyandHomologoussuperfamily)是與SCOP類似的一個數(shù)據庫。
第二十八頁,共三十一頁,2022年,8月28日目前,瑞士生物信息學研究所(SwissInstituteofBioinformatics,SIB)創(chuàng)建了蛋白質分析專家系統(tǒng)(Expertproteinanalysissystem,ExPASy,網址:)涵蓋了上述主要的數(shù)據庫。我國的北京大學生物信息中心()設立了ExPASy的鏡像(Mirror)。ExPASy蛋白質分析專家系統(tǒng)第二十九頁,共三十一頁,2022年,8月28日ProteindatabaseinNCBITheProteindatabaseisacollectionofsequencesfromseveralsources,includingtranslationsfromannotatedcodingregionsinGenBank,RefSeqandTPA,aswellasrecordsfromSwissProt,PIR,PRF,andPDB.Proteinsequencesarethefundamentaldeterminantsofbiologicalstructureandfunction.第三十頁,共三十一頁,2022年,8月28日蛋白質序列中的一些符號含義蛋白質基序(motif)中的x表示任意氨基酸,其中的數(shù)字表示任意幾個氨基酸;中括號[ST]表示氨基酸為SorT;大括號{P}表示除掉P之外的任意氨基酸。如:IDASN_GLYCOSYLATION;PATTE
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版委托持股業(yè)務盡職調查與合規(guī)性管理合同3篇
- 2025版新能源車輛制造股東入股協(xié)議書3篇
- 2025年度綠色建筑暖通工程設計施工一體化合同4篇
- 二零二五年度采光節(jié)能門窗供應合同2篇
- 2025年度水利工程承包施工居間合同(二零二五年度)4篇
- 窗簾材質與節(jié)能環(huán)保的科技融合
- 二零二五年度塔吊租賃行業(yè)自律公約制定合同2篇
- 智能教育時代的家庭教育與發(fā)展新路徑
- 教育科技中嵌入式的交互式學習體驗優(yōu)化
- 二零二五年度白灰產業(yè)園區(qū)基礎設施建設項目合同3篇
- 醫(yī)院培訓課件:《如何撰寫護理科研標書》
- 員工宿舍用電安全培訓
- 家庭年度盤點模板
- 河南省鄭州市2023-2024學年高二上學期期末考試 數(shù)學 含答案
- 2024年北師大版八年級上冊全冊數(shù)學單元測試題含答案
- 江蘇省南京市第二十九中2025屆數(shù)學高二上期末學業(yè)質量監(jiān)測模擬試題含解析
- 八年級下學期期末考試語文試題(PDF版含答案)
- 2024年公需科目培訓考試題及答案
- (正式版)SH∕T 3541-2024 石油化工泵組施工及驗收規(guī)范
- 2024年江蘇鑫財國有資產運營有限公司招聘筆試沖刺題(帶答案解析)
- 2024年遼寧石化職業(yè)技術學院單招職業(yè)適應性測試題庫含答案
評論
0/150
提交評論