版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、關(guān)于獲取和蛋白質(zhì)序列信息第一張,PPT共三十七頁,創(chuàng)作于2022年6月生物信息學(xué)(Bioinformatics) 在生命科學(xué)研究中發(fā)展起來的一門由分子生物學(xué)和計算機信息處理技術(shù)相結(jié)合,以計算機為工具對生物信息進行儲存、檢索、傳播、模擬和分析的交叉學(xué)科,它利用數(shù)據(jù)庫技術(shù)和軟件技術(shù)對大量積累的生物大分子序列數(shù)據(jù)和實驗測定的序列進行比較和分析,揭示出生物大分子的分子結(jié)構(gòu)、功能和進化關(guān)系以及基因組構(gòu)成與基因表達等生物學(xué)事件對生命活動的影響。 第二張,PPT共三十七頁,創(chuàng)作于2022年6月生物信息數(shù)據(jù)庫種類 :基因組數(shù)據(jù)庫、核酸和蛋白質(zhì)一級結(jié)構(gòu)序列數(shù)據(jù)庫、生物大分子(主要是蛋白質(zhì))三維空間結(jié)構(gòu)數(shù)據(jù)庫、以
2、上述三類一次數(shù)據(jù)庫和文獻資料為基礎(chǔ)構(gòu)建的二次數(shù)據(jù)庫。 第三張,PPT共三十七頁,創(chuàng)作于2022年6月一次、二次數(shù)據(jù)庫特點一次數(shù)據(jù)庫的數(shù)據(jù)量大、更新速度快、用戶面廣,存在過多的甬余數(shù)據(jù)。 而二次數(shù)據(jù)庫的容量比較小,更新速度也沒有一次數(shù)據(jù)庫那樣快,經(jīng)過篩選后,避免了過多的甬余數(shù)據(jù)。 第四張,PPT共三十七頁,創(chuàng)作于2022年6月根據(jù)數(shù)據(jù)庫存儲的內(nèi)容可將生物信息學(xué)數(shù)據(jù)庫分為: 核酸、蛋白質(zhì)、基因圖譜、結(jié)構(gòu)、文獻等數(shù)據(jù)庫第五張,PPT共三十七頁,創(chuàng)作于2022年6月第二節(jié) 核酸序列數(shù)據(jù)庫 一、GenBank數(shù)據(jù)庫 GenBank 是一個綜合數(shù)據(jù)庫,該數(shù)據(jù)庫中包含了已經(jīng)公開的260000余種不同物種生物
3、的核酸序列,這些數(shù)據(jù)主要是由全世界不同實驗室和大規(guī)模測序計劃提交給GenBank的。 第六張,PPT共三十七頁,創(chuàng)作于2022年6月GenBank是具有目錄和生物學(xué)注釋的核酸序列綜合數(shù)據(jù)庫, 由美國國家醫(yī)學(xué)圖書館(NLM)的國家生物技術(shù)信息中心(NCBI)構(gòu)建、維護和管理。該中心位于美國馬里蘭國家健康研究所(NIH)。NCBI構(gòu)建GenBank數(shù)據(jù)庫的序列數(shù)據(jù)來至序列發(fā)現(xiàn)者提交的序列、批量提交的表達序列標(biāo)簽(EST)、基因組測序序列(GSS)和其它測序中心的高通量數(shù)據(jù),以及美國專利商標(biāo)局提供的已發(fā)表專利的序列數(shù)據(jù)。第七張,PPT共三十七頁,創(chuàng)作于2022年6月GenBank、EMBL、DDBJ
4、組成國際核酸序列數(shù)據(jù)庫合作組織(INSDC),該組織成員遠程合作,每天相互交換數(shù)據(jù)以保證序列信息的一致性和完整性。第八張,PPT共三十七頁,創(chuàng)作于2022年6月檢索GenBank數(shù)據(jù) Entrez檢索系統(tǒng) BLAST 序列相似性搜索程序用FTP獲取GenBank 數(shù)據(jù)庫第九張,PPT共三十七頁,創(chuàng)作于2022年6月Entrez系統(tǒng)使用Entrez(/sites/gquery)可以訪問GenBank中的序列記錄,Entrez是一個靈活的數(shù)據(jù)庫檢索系統(tǒng),可以檢索35個數(shù)據(jù)庫。Entrez數(shù)據(jù)庫包含來源于GenBank和其它資源的DNA和蛋白序列,還包括基因組圖譜、種群、進化和環(huán)境序列序列數(shù)據(jù)集、基
5、因表達數(shù)據(jù)、NCBI分類學(xué)、蛋白結(jié)構(gòu)域信息和來源于Molecular Modeling Database(MMDB)的蛋白結(jié)構(gòu)數(shù)據(jù)庫,每個數(shù)據(jù)庫經(jīng)由PubMed和PubMed Central與學(xué)術(shù)文獻關(guān)聯(lián)。 第十張,PPT共三十七頁,創(chuàng)作于2022年6月BLAST 序列相似性搜索序列相似性搜索是GenBank數(shù)據(jù)最基本和使用最多的分析方式。NCBI提供BLAST(/Blast.cgi)系列程序檢測一條查詢序列與數(shù)據(jù)庫所有序列的相似性。BLAST搜索可以在NCBI網(wǎng)站上運行,也可以在FTP站點下載獨立的程序集運行。 第十一張,PPT共三十七頁,創(chuàng)作于2022年6月用FTP獲取GenBankNCB
6、I以傳統(tǒng)的純文本文件格式發(fā)布GenBank,還以ASN.1格式用以內(nèi)部維護。通過NCBI匿名FTP ()站點可以獲得每兩個月的全文公告和每天與EMBL和DDBJ數(shù)據(jù)更新內(nèi)容,還可以從印第安納大學(xué)的鏡像站點(/biomirror/genbank/)下載。在“genbank”目錄中的“daily-nc”文件夾中可以獲得純文本的更新數(shù)據(jù)壓縮文件。在GenBank FTP站點的“tools”目錄中提供轉(zhuǎn)換每日更新數(shù)據(jù)集的腳本。第十二張,PPT共三十七頁,創(chuàng)作于2022年6月EMBL數(shù)據(jù)庫 EMBL核苷序列數(shù)據(jù)庫(http:/ www.edi.ac.uk/embl/)是歐洲主要的核苷序列收集單位。這個數(shù)
7、據(jù)庫是由歐洲生物信息中心EBI(歐洲分子生物學(xué)實驗室(EMBL)在德國海德堡的站點)維護的。 第十三張,PPT共三十七頁,創(chuàng)作于2022年6月EBI核苷數(shù)據(jù)來自基因組測序中心、個別科學(xué)家、歐洲專利局、以及與合作伙伴DDBJ (Japan)和GenBank (USA)交換的數(shù)據(jù)。為了達到最佳的同步性,每天DDBJ/EMBL/GenBank之間都要交換最新的數(shù)據(jù)。用戶只要進入三者中任意一個數(shù)據(jù)庫都能得到最新數(shù)據(jù)。這三個數(shù)據(jù)庫之間堅持統(tǒng)一的文件指導(dǎo)方針,規(guī)范了數(shù)據(jù)庫登錄的內(nèi)容和語法。這種指導(dǎo)方針確保了這些數(shù)據(jù)庫的信息以一種便捷的格式進行交換,它與當(dāng)今的生物信息學(xué)軟件兼容,反映了分子生物學(xué)領(lǐng)域的發(fā)展。
8、第十四張,PPT共三十七頁,創(chuàng)作于2022年6月DDBJ數(shù)據(jù)庫 日本DNA數(shù)據(jù)庫(DDBJ)是在亞洲唯一的核酸序列數(shù)據(jù)庫,是公認(rèn)搜集研究者獲得的核酸序列數(shù)據(jù)庫,并且,發(fā)放給數(shù)據(jù)提交者國際認(rèn)證的核酸序列編號。由于DDBJ每天將搜集的數(shù)據(jù)與EML-Bank/EBI和GenBank/NCBI進行交換,使得三個核酸數(shù)據(jù)庫幾乎在任何時候都享有相同數(shù)據(jù)。這種幾乎統(tǒng)一的數(shù)據(jù)庫被稱作“國際核酸序列數(shù)據(jù)庫(INSD)”。DDBJ主要收集來自日本研究者獲得的序列數(shù)據(jù),但也收集數(shù)據(jù)和發(fā)放編號給任何其它國家的研究者。 第十五張,PPT共三十七頁,創(chuàng)作于2022年6月其他重要的核酸序列數(shù)據(jù)庫:dbESTncRNAdbm
9、iRBase第十六張,PPT共三十七頁,創(chuàng)作于2022年6月dbEST是GenBank中的一個子數(shù)據(jù)庫,包含來源于不同物種的表達序列數(shù)據(jù)和表達序列標(biāo)簽序列的其它信息。 非編碼RNA(ncRNA)數(shù)據(jù)庫旨在提供非編碼RNA的序列和功能信息。非編碼轉(zhuǎn)錄物不編碼蛋白質(zhì),但在細胞中起調(diào)節(jié)作用。目前,該數(shù)據(jù)庫包含來源于99種細菌、古生菌和真核生物的30000多條單個序列。 miRBase序列數(shù)據(jù)庫是主要存放已發(fā)表的microRNA(miRNA)序列和注釋的數(shù)據(jù)庫。 第十七張,PPT共三十七頁,創(chuàng)作于2022年6月第二節(jié) 蛋白質(zhì)序列數(shù)據(jù)庫 PIR數(shù)據(jù)庫MIPS數(shù)據(jù)庫其他重要的蛋白質(zhì)序列數(shù)據(jù)庫:PRINTS
10、、Pfam 第十八張,PPT共三十七頁,創(chuàng)作于2022年6月PIR數(shù)據(jù)庫蛋白質(zhì)信息庫(PIR)是一個支持基因組學(xué)、蛋白質(zhì)組學(xué)和系統(tǒng)生物學(xué)檢索和科學(xué)研究的綜合公共生物信息學(xué)資源。PIR是由美國國家生物醫(yī)學(xué)基金會(NBRF)于1984年建立,幫助研究者確認(rèn)和解釋蛋白序列信息的數(shù)據(jù)庫。 第十九張,PPT共三十七頁,創(chuàng)作于2022年6月MIPS數(shù)據(jù)庫 生物信息學(xué)和系統(tǒng)生物學(xué)研究所(IBIS)是慕尼黑亥姆霍茲中心-德國環(huán)境衛(wèi)生研究中心的一部分,主辦慕尼黑蛋白序列信息中心(MIPS),它的重點工作是基因組生物信息學(xué),特別注重基因組信息系統(tǒng)分析,包括應(yīng)用生物信息學(xué)方法注釋基因組、表達分析和蛋白質(zhì)組學(xué)方面研究
11、。MIPS支持和維護一系列基因組數(shù)據(jù)庫以及系統(tǒng),可以提供比較分析細菌、真菌和植物基因組服務(wù)。在該站點提供基因組分析工具、數(shù)據(jù)庫檢索系統(tǒng)、表達分析、蛋白相互作用等網(wǎng)絡(luò)服務(wù)。 第二十張,PPT共三十七頁,創(chuàng)作于2022年6月PRINTS是蛋白基序指紋圖綜合數(shù)據(jù)庫,每個指紋圖都是使用數(shù)據(jù)掃描程序ADSP或VISTAS序列分析軟件包反復(fù)優(yōu)化后定義的。數(shù)據(jù)庫中有兩種類型指紋圖,根據(jù)指紋圖的復(fù)雜性分為簡單和復(fù)合指紋圖:簡單指紋圖基本上是單一的基序,而復(fù)合指紋圖包含多個基序。 第二十一張,PPT共三十七頁,創(chuàng)作于2022年6月Pfam數(shù)據(jù)庫是一個大的蛋白質(zhì)域家族集合; Pfam家族有兩個質(zhì)量等級:Pfam-
12、A和Pfam-B 。第二十二張,PPT共三十七頁,創(chuàng)作于2022年6月第三節(jié) NCBI與EBINCBI的簡介 NCBI的使命是開發(fā)新的信息技術(shù),幫助理解控制健康和疾病的基本分子和遺傳過程。特別是,NCBI肩負建立存儲和分析分子生物學(xué)、生物化學(xué)和遺傳學(xué)知識的自動系統(tǒng);提供研究和醫(yī)學(xué)界方便使用的數(shù)據(jù)庫和軟件;努力協(xié)調(diào)搜集國內(nèi)外生物技術(shù)信息;執(zhí)行分析生物學(xué)重要分子結(jié)構(gòu)和功能的先進方法研究。 第二十三張,PPT共三十七頁,創(chuàng)作于2022年6月EBI簡介 EMBL-EBI研究團隊旨在通過開發(fā)新方法解釋生物學(xué)數(shù)據(jù),了解生物學(xué)。研究領(lǐng)域包括:進化途徑的基因組分析(Paul Bertone);序列數(shù)據(jù)進化分析
13、(Nick Goldman);神經(jīng)信號計算系統(tǒng)生物學(xué)(Nicolas Le Novere);蛋白質(zhì)組學(xué):結(jié)構(gòu)、功能和進化(Janet Thorton);基因組規(guī)模調(diào)節(jié)系統(tǒng)分析(Nick Luscombe)和功能基因組學(xué)(Wolfgang Hubert)。第二十四張,PPT共三十七頁,創(chuàng)作于2022年6月第四節(jié) 通過Entrez Gene從NCBI獲取序列信息Entrez是用于NCBI主要數(shù)據(jù)庫的綜合的、基于文本的搜索和檢索系統(tǒng)。Entrez綜合了科學(xué)文獻、DNA和蛋白序列數(shù)據(jù)庫、3D蛋白質(zhì)結(jié)構(gòu)和蛋白質(zhì)域數(shù)據(jù)、種群研究數(shù)據(jù)集、表達數(shù)據(jù)、完整基因組組裝和分類學(xué)信息形成一個緊密鏈接的系統(tǒng)。它是被設(shè)計
14、用于搜索NCBI的鏈接數(shù)據(jù)庫的檢索系統(tǒng)??梢詧?zhí)行單個子數(shù)據(jù)庫檢索,還可以進行跨庫檢索。 第二十五張,PPT共三十七頁,創(chuàng)作于2022年6月Entrez Gene 檢索 Entrez Gene檢索到的記錄提供關(guān)鍵鏈接,將圖譜、序列、表達、結(jié)構(gòu)、功能、索引文獻和同源數(shù)據(jù)鏈接在一起構(gòu)成關(guān)鍵鏈接。檢索Entrez Gene最簡捷的方法是登錄到NCBI(/)的首頁 。第二十六張,PPT共三十七頁,創(chuàng)作于2022年6月第二十七張,PPT共三十七頁,創(chuàng)作于2022年6月第二十八張,PPT共三十七頁,創(chuàng)作于2022年6月第二十九張,PPT共三十七頁,創(chuàng)作于2022年6月第三十張,PPT共三十七頁,創(chuàng)作于2022年6月第三十一張,PPT共三十七頁,創(chuàng)作于2022年6月第五節(jié) 通過SRS從EBI中獲取蛋白序列信息SRS是世界上主要的生物信息學(xué)、基因組和相關(guān)數(shù)據(jù)綜合、分析和顯示工具。SRS檢索系統(tǒng)是個開放的系統(tǒng),可以根據(jù)不同的需要安裝不同的數(shù)據(jù)庫,現(xiàn)在,安裝在EBI的數(shù)據(jù)庫有200多個。SRS有三種檢索方式,快速檢索、標(biāo)準(zhǔn)檢索和批量檢索。 第三十二張,PPT共三十七頁,創(chuàng)作于2022年6月我們可以通過網(wǎng)址(http:/srs.ebi.ac.uk/srsbin/cgi-bin/wgetz?+quickSearch+-id+
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025秀嶼區(qū)文印中心企業(yè)宣傳冊制作承包經(jīng)營合同3篇
- 2025版外墻瓷磚購銷及質(zhì)量檢測認(rèn)證合同3篇
- 二零二五年度家暴受害者離婚財產(chǎn)合理分配與子女權(quán)益保護合同
- 臨時土地使用租賃合同(2024版)
- 2025年度智能化煤炭采購合同書4篇
- 二零二五年度農(nóng)民工社會保險委托代繳服務(wù)協(xié)議
- 2025年度美容院連鎖加盟經(jīng)營管理合同
- 2025年度綠色低碳產(chǎn)業(yè)發(fā)展項目招標(biāo)代理合同3篇
- 二零二五年駕駛員心理健康與職業(yè)規(guī)劃服務(wù)合同3篇
- 二零二五年度農(nóng)產(chǎn)品電商平臺運營與技術(shù)支持合同2篇
- 2024年正定縣國資產(chǎn)控股運營集團限公司面向社會公開招聘工作人員高頻考題難、易錯點模擬試題(共500題)附帶答案詳解
- 智能衣服方案
- 李克勤紅日標(biāo)準(zhǔn)粵語注音歌詞
- 教科版六年級下冊科學(xué)第一單元《小小工程師》教材分析及全部教案(定稿;共7課時)
- 中藥材產(chǎn)地加工技術(shù)規(guī)程 第1部分:黃草烏
- 危險化學(xué)品經(jīng)營單位安全生產(chǎn)考試題庫
- 案例分析:美國紐約高樓防火設(shè)計課件
- 老客戶維護方案
- 移動商務(wù)內(nèi)容運營(吳洪貴)任務(wù)一 用戶定位與選題
- 2021年高考化學(xué)真題和模擬題分類匯編專題20工業(yè)流程題含解析
- 工作證明模板下載免費
評論
0/150
提交評論