基因結(jié)構(gòu)預(yù)測ppt課件_第1頁
基因結(jié)構(gòu)預(yù)測ppt課件_第2頁
基因結(jié)構(gòu)預(yù)測ppt課件_第3頁
基因結(jié)構(gòu)預(yù)測ppt課件_第4頁
基因結(jié)構(gòu)預(yù)測ppt課件_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、真核生物基因構(gòu)造的預(yù)測分析真核生物基因構(gòu)造的預(yù)測分析 實(shí)習(xí)一實(shí)習(xí)一基因組數(shù)據(jù)注釋和功能分析基因組數(shù)據(jù)注釋和功能分析實(shí)習(xí)二實(shí)習(xí)二真核生物基因結(jié)構(gòu)的預(yù)測分析真核生物基因結(jié)構(gòu)的預(yù)測分析 實(shí)習(xí)三實(shí)習(xí)三芯片的基本數(shù)據(jù)處理和分析芯片的基本數(shù)據(jù)處理和分析實(shí)習(xí)四實(shí)習(xí)四蛋白質(zhì)結(jié)構(gòu)與功能分析蛋白質(zhì)結(jié)構(gòu)與功能分析實(shí)習(xí)五實(shí)習(xí)五蛋白質(zhì)組學(xué)數(shù)據(jù)分析蛋白質(zhì)組學(xué)數(shù)據(jù)分析實(shí)習(xí)六實(shí)習(xí)六系統(tǒng)生物學(xué)軟件實(shí)習(xí)系統(tǒng)生物學(xué)軟件實(shí)習(xí)課程內(nèi)容課程內(nèi)容基因組學(xué)基因組學(xué)轉(zhuǎn)錄物組學(xué)轉(zhuǎn)錄物組學(xué)蛋白質(zhì)組學(xué)蛋白質(zhì)組學(xué)系統(tǒng)生物學(xué)系統(tǒng)生物學(xué)編碼區(qū)預(yù)測編碼區(qū)預(yù)測Codon biasGC Content限制性酶切位點(diǎn)限制性酶切位點(diǎn)基因構(gòu)造分析基因構(gòu)造分析選擇性剪

2、切選擇性剪切轉(zhuǎn)錄調(diào)控因子轉(zhuǎn)錄調(diào)控因子序列比對序列比對功能注釋功能注釋KEGGGO系統(tǒng)發(fā)育樹系統(tǒng)發(fā)育樹蛋白質(zhì)序列蛋白質(zhì)序列翻翻譯譯蛋白質(zhì)理化性質(zhì)蛋白質(zhì)理化性質(zhì)二級構(gòu)造預(yù)測二級構(gòu)造預(yù)測構(gòu)造域分析構(gòu)造域分析重要信號位點(diǎn)分析重要信號位點(diǎn)分析三級構(gòu)造預(yù)測三級構(gòu)造預(yù)測基因組功能分析基因組功能分析真核生物基因的主要構(gòu)造真核生物基因的主要構(gòu)造基因結(jié)構(gòu)分基因結(jié)構(gòu)分析析開放讀碼框開放讀碼框GENSCANGENOMESCANCpG島島CpGPlot轉(zhuǎn)錄終止信號轉(zhuǎn)錄終止信號POLYAH啟動子啟動子/轉(zhuǎn)錄起始位點(diǎn)轉(zhuǎn)錄起始位點(diǎn)PromoterScanDBTSS databasemRNA剪切位點(diǎn)剪切位點(diǎn)NETGENE2Sp

3、idey選擇性剪切選擇性剪切ASTD基因構(gòu)造分析常用軟件基因構(gòu)造分析常用軟件開放讀碼框的識別開放讀碼框的識別 開放讀碼框open reading frame, ORF) 是一段起始密碼子和終止密碼子之間的堿基序列 ORF 是潛在的蛋白質(zhì)編碼區(qū)基因開放閱讀框基因開放閱讀框/ /基因結(jié)構(gòu)分析識別工具基因結(jié)構(gòu)分析識別工具ORF Finder /gorf/gorf.html NCBI通用BestORFlinux1.softberry/berry.phtml?topic=bestorf&group=programs&subgroup=gfindSoftbe

4、rry真核GENSCAN/GENSCAN.htmlMIT脊椎、擬南芥、玉米脊椎、擬南芥、玉米Gene F/tools/genefinder/Zhang lab人、小鼠、擬南芥、酵母FGENESHlinux1.softberry/berry.phtml?topic=fgenesh&group=programs&subgroup=gfindSoftberry真核(基因結(jié)構(gòu))GeneM/GeneMark/eukhmm.cgiGIT原核GLIMMERncbi.nlm.ni

5、/genomes/MICROBES/glimmer_3./software/glimmer Maryland原核Fgeneslinux1.softberry/berry.phtml?topic=fgenes&group=programs&subgroup=gfindSoftberry人(基因結(jié)構(gòu))FgeneSVlinux1.softberry/berry.phtml?topic=virus&group=programs&subgroup=gfindvSoftberry病毒Generation compbio.ornl.go

6、v/generation/ORNL原核FGENESBlinux1.softberry/berry.phtml?topic=fgenesb&group=programs&subgroup=gfindbSoftberry細(xì)菌(基因結(jié)構(gòu))GenomeScan /genomescan.html MIT脊椎、擬南芥、玉米脊椎、擬南芥、玉米GeneWise2ebi.ac.uk/Wise2/EBI人GRAIL/grailexp/ORNL人、小鼠、擬南芥、果蠅ORF識別:識別:GENSCAN/GENSCAN

7、.html結(jié)果前往到郵箱可選結(jié)果前往到郵箱可選提交序列提交序列提交序列文件提交序列文件運(yùn)轉(zhuǎn)運(yùn)轉(zhuǎn)GENSCAN顯示氨基酸或顯示氨基酸或CDS序列序列序列稱號可選序列稱號可選能否顯示非最優(yōu)外顯子能否顯示非最優(yōu)外顯子選擇物種類型選擇物種類型9GENSCAN輸出結(jié)果:文本輸出結(jié)果:文本10GENSCAN輸出結(jié)果:圖形輸出結(jié)果:圖形ORF識別:識別: GenomeScan提交待分析序列提交待分析序列提交同源蛋白質(zhì)序列提交同源蛋白質(zhì)序列運(yùn)轉(zhuǎn)運(yùn)轉(zhuǎn)GenomeS/genomescan.htmlGenomeScan輸出結(jié)果:文本輸出結(jié)果:文本預(yù)測外顯子位置、可預(yù)測外顯子位置、可信

8、度等信息信度等信息同源比同源比對信息對信息預(yù)測結(jié)果的氨基酸序列預(yù)測結(jié)果的氨基酸序列GenomeScan輸出結(jié)果:圖形輸出結(jié)果:圖形課堂練習(xí) 1運(yùn)用GENESCAN預(yù)測序列中能夠的ORF。 2運(yùn)用GENOMESCAN預(yù)測序列中能夠的ORF。 練慣用的序列文件在c:zcnishixi2文件下,名字為clone.fasta,運(yùn)用寫字板翻開查看。轉(zhuǎn)錄調(diào)控序列分析轉(zhuǎn)錄調(diào)控序列分析啟動子區(qū)構(gòu)造啟動子區(qū)構(gòu)造啟動子Promoter 位于構(gòu)造基因5端上游,能活化RNA聚合酶,使之與模板DNA結(jié)合并具有轉(zhuǎn)錄起始的特異性。轉(zhuǎn)錄起始位點(diǎn)(Transcription start site, TSS)PYCAPY嘧啶中心

9、啟動子元件(Core promoter element)TATA box,Pribnow box TATAA)上游啟動子元件(Upstream promoter element,UPE)CAAT box,GC box,SP1,Otc加強(qiáng)子(Enhancer)原核和真核生物基因轉(zhuǎn)錄起始位點(diǎn)上游區(qū)原核和真核生物基因轉(zhuǎn)錄起始位點(diǎn)上游區(qū)構(gòu)造構(gòu)造原核生物原核生物真核生物真核生物TTGACATATAATAmRNA11035PyAPyTATAATGC區(qū) CAAT區(qū)mRNA14025110加強(qiáng)子加強(qiáng)子上游啟動子元件,上游啟動子元件,UPE中心啟動子元件中心啟動子元件轉(zhuǎn)錄起始轉(zhuǎn)錄起始位點(diǎn)位點(diǎn)PromoterSc

10、:80/molbio/proscan/WebP/zlab/PromoSer/WebNeural Network Promoter P/seq_tools/promoter.htmlWebSoftberry: BPROM, TSSP, TSSG, TSSWsoftberry/berry.phtml?topic=index&group=programs&subgroup=promoterWebMatInspectorgene-regulation.de/Web

11、RSATrsat.ulb.ac.be/rsat/WebC/mfrith/cister.shtmlWeb 啟動子結(jié)合位點(diǎn)分析常用軟件啟動子結(jié)合位點(diǎn)分析常用軟件啟動子預(yù)測:PromoterS/molbio/proscan/ 提交序列提交序列PromoterScan輸出結(jié)果找到的TATA box和轉(zhuǎn)錄起始位點(diǎn)預(yù)測能夠的轉(zhuǎn)錄因子預(yù)測能夠的轉(zhuǎn)錄因子轉(zhuǎn)錄因子在提交序列中的位置轉(zhuǎn)錄因子在提交序列中的位置轉(zhuǎn)錄起始位點(diǎn)數(shù)據(jù)庫數(shù)據(jù)庫:DBTSSdbtss.hgc.jp/DBTSS搜索工具條搜索工具條限定物種限定物種“H. sapien

12、s搜索基因搜索基因“FXYD5限定搜索限定搜索“基因稱號基因稱號最新數(shù)據(jù)庫版本參與最新數(shù)據(jù)庫版本參與Solexa測序新數(shù)據(jù)支持測序新數(shù)據(jù)支持限定至少需求多少條限定至少需求多少條cDNA序列覆蓋序列覆蓋DBTSS搜索結(jié)果搜索結(jié)果FXYD5基因的啟動子區(qū)域顯示DBTSS圖例闡明轉(zhuǎn)錄起始位點(diǎn)轉(zhuǎn)錄起始位點(diǎn)TSS覆蓋的覆蓋的cDNA序列數(shù)目序列數(shù)目SNP位點(diǎn)位點(diǎn)ALB基因的啟動子區(qū)域顯示TF:轉(zhuǎn)錄:轉(zhuǎn)錄因子結(jié)合因子結(jié)合位點(diǎn)位點(diǎn)轉(zhuǎn)錄起始位點(diǎn)轉(zhuǎn)錄起始位點(diǎn)TSS覆蓋的覆蓋的cDNA序列數(shù)目序列數(shù)目下載啟動子序列設(shè)置下載序列的起點(diǎn)、終點(diǎn)設(shè)置下載序列的起點(diǎn)、終點(diǎn)需選擇轉(zhuǎn)錄起始位點(diǎn)需選擇轉(zhuǎn)錄起始位點(diǎn)下載啟動子區(qū)序列

13、下載啟動子區(qū)序列下載全長下載全長cDNA(包括啟動子包括啟動子區(qū)區(qū))序列序列課堂練習(xí) 1 運(yùn)用PromoterScan 預(yù)測clone.fasta里面的潛在外顯子。 2 利用DBTSS數(shù)據(jù)庫搜索基因的轉(zhuǎn)錄起始位點(diǎn)和能夠的上游調(diào)控序列。CpG島的預(yù)測 CpG島 常位于真核生物基因轉(zhuǎn)錄起始位點(diǎn),GC含50% ,長度200bpCpG Island 分析分析CpG Island uscnorris/cpgislands2/cpg.aspxWebCpGPlotebi.ac.uk/emboss/cpgplot/index.htmlWebCpG findersoftberry/berry.phtml?top

14、ic=cpgfinder&group=programs&subgroup=promoterWebCpGi130methycancer.psych.ac/CpG130.dowebCpGproDpbil.univ-lyon1.fr/software/cpgprod_query.htmlweb提交序列文件提交序列文件提交序列提交序列參數(shù)選項(xiàng)參數(shù)選項(xiàng)CpG島的預(yù)測:CpGPlotebi.ac.uk/emboss/cpgplot/index.htmlGENESCAN 預(yù)測結(jié)果起始為532bp 終止于51783bp轉(zhuǎn)錄終止信號轉(zhuǎn)錄終止信號 上游作用元件:AAUAAA 下游作用元件:GC r

15、ich二重對稱區(qū)、UUUUUUC-GC-GG-CG-CU-AG-CG-CC-GG-CUUUUUUUUURNA53AAUAAACAAAAAAAAAAAAA成熟mRNA53AAUAAACAGUmRNA前體53轉(zhuǎn)錄終止信號polyA預(yù)測:POLYAHsoftberry/berry.phtml?topic=polyah&group=programs&subgroup=promoter 提交序列文件提交序列文件提交序列提交序列polyA位置GENESCAN預(yù)測結(jié)果PolyA位點(diǎn)52398bpPOLYAH輸出結(jié)果課堂練習(xí) 運(yùn)用CpG plot預(yù)測clone.fasta中的CpG島。 運(yùn)用P

16、OLYAH預(yù)測clone.fasta中的POLYA剪切位點(diǎn)。內(nèi)含子內(nèi)含子/外顯子剪切位點(diǎn)識別外顯子剪切位點(diǎn)識別 如何分析mRNA/cDNA的外顯子組成? 經(jīng)過對特征序列(GT-AG)的分析進(jìn)展直接的預(yù)測基因預(yù)測軟件NetGene2 與相應(yīng)的基因組序列比對,分析比對片段的分布位置Spidey剪切位點(diǎn)識別:剪切位點(diǎn)識別:NetGene2cbs.dtu.dk/services/NetGene2/提交序列提交序列選擇物種選擇物種NetGene2輸出結(jié)果輸出結(jié)果供體位點(diǎn)供體位點(diǎn)受體位點(diǎn)受體位點(diǎn)可信度可信度 相位相位mRNA剪切位點(diǎn)識別:剪切位點(diǎn)識別:Spidey NCBI開發(fā)的在線預(yù)測程序 用于mRNA

17、序列同基因組序列比對分析 /spideySpidey同源序列的獲得:序列比對 經(jīng)過BLAST進(jìn)展序列比對,找到能夠同源的類似性好的一系列mRNA序列。BLAST比對到的三條mRNA序列Spidey序列提交頁面序列提交頁面輸入基因組序列或序輸入基因組序列或序列數(shù)據(jù)庫號列數(shù)據(jù)庫號輸入類似性序列輸入類似性序列判別用于分析的序列間的差別,判別用于分析的序列間的差別,并調(diào)整比對參數(shù)并調(diào)整比對參數(shù)不受默許內(nèi)含子長度限不受默許內(nèi)含子長度限制,制,默許長度:內(nèi)部內(nèi)含子默許長度:內(nèi)部內(nèi)含子為為35kb, 末端內(nèi)含子為末端內(nèi)含子為100kb比對閾值比對閾值選擇物種選擇物種輸出格式選擇輸出格

18、式選擇Spidey輸出結(jié)果輸出結(jié)果第一條藍(lán)色序列為第一條藍(lán)色序列為基因組序列,橘黃基因組序列,橘黃色為外顯子色為外顯子外顯子對應(yīng)于外顯子對應(yīng)于基因組上的基因組上的起始起始/ /終了位置終了位置外顯子對應(yīng)于外顯子對應(yīng)于mRNA/cDNA上的上的起始起始/終了位置終了位置供體、受體位點(diǎn)供體、受體位點(diǎn)外顯子外顯子長度長度一致性一致性百分比百分比錯(cuò)配和錯(cuò)配和gap外顯子外顯子序號序號序列聯(lián)配結(jié)果序列聯(lián)配結(jié)果GENSCAN與與Spidey結(jié)果比較結(jié)果比較能夠的選擇性剪切體課堂練習(xí) 練習(xí)兩種預(yù)測剪切位點(diǎn)的軟件的運(yùn)用,NetGene2和Spidey。 Spidey的同源序列文件保管在c:zcnishixi2文件下,名字為Spidey.txt,運(yùn)用寫字板翻開查看。選擇性剪切選擇性剪切Alternative splicing分分析析 選擇性剪接是調(diào)控基因表達(dá)的重要機(jī)制 了解不同物種、細(xì)胞、發(fā)育階段、環(huán)境壓力下基因的調(diào)控表達(dá)機(jī)制選擇性剪接的類型選擇性剪接的類型選擇性剪切的五種類型: 內(nèi)含子保管. 5端選擇性剪切位點(diǎn). 3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論