版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、1 實習二實習二 真核生物基因結(jié)構(gòu)的預真核生物基因結(jié)構(gòu)的預 測分析測分析 浙江加州國際納米技術(shù)研究院浙江加州國際納米技術(shù)研究院 2010年11月 蘇錕楷蘇錕楷 樓小燕樓小燕 韓韓 序序 蔣蔣 琰琰 2 實習一實習一基因組數(shù)據(jù)注釋和功能分析基因組數(shù)據(jù)注釋和功能分析 實習二實習二真核生物基因結(jié)構(gòu)的預測分析真核生物基因結(jié)構(gòu)的預測分析 實習三實習三芯片的基本數(shù)據(jù)處理和分析芯片的基本數(shù)據(jù)處理和分析 實習四實習四蛋白質(zhì)結(jié)構(gòu)與功能分析蛋白質(zhì)結(jié)構(gòu)與功能分析 實習五實習五蛋白質(zhì)組學數(shù)據(jù)分析蛋白質(zhì)組學數(shù)據(jù)分析 實習六實習六系統(tǒng)生物學軟件實習系統(tǒng)生物學軟件實習 課程內(nèi)容課程內(nèi)容 基因組學基因組學 轉(zhuǎn)錄物組學轉(zhuǎn)錄物組
2、學 蛋白質(zhì)組學蛋白質(zhì)組學 系統(tǒng)生物學系統(tǒng)生物學 3 編碼區(qū)預測編碼區(qū)預測 Codon bias GC Content 限制性酶切位點限制性酶切位點 基因結(jié)構(gòu)分析基因結(jié)構(gòu)分析 選擇性剪切選擇性剪切 轉(zhuǎn)錄調(diào)控因子轉(zhuǎn)錄調(diào)控因子 序列比對序列比對 功能注釋功能注釋 KEGG GO 系統(tǒng)發(fā)育樹系統(tǒng)發(fā)育樹 蛋白質(zhì)序列蛋白質(zhì)序列 翻翻 譯譯 蛋白質(zhì)理化性質(zhì)蛋白質(zhì)理化性質(zhì) 二級結(jié)構(gòu)預測二級結(jié)構(gòu)預測 結(jié)構(gòu)域分析結(jié)構(gòu)域分析 重要信號位點分析重要信號位點分析 三級結(jié)構(gòu)預測三級結(jié)構(gòu)預測 基因組功能分析基因組功能分析 4 真核生物基因的主要結(jié)構(gòu)真核生物基因的主要結(jié)構(gòu) 5 基因結(jié)構(gòu)分析基因結(jié)構(gòu)分析 開放讀碼框開放讀碼框
3、GENSCAN GENOMESCAN CpG島島CpGPlot 轉(zhuǎn)錄終止信號轉(zhuǎn)錄終止信號POLYAH 啟動子啟動子/轉(zhuǎn)錄起始位點轉(zhuǎn)錄起始位點PromoterScan 密碼子偏好分析密碼子偏好分析CodonW mRNA剪切位點剪切位點 NETGENE2 Spidey 選擇性剪切選擇性剪切ASTD 基因結(jié)構(gòu)分析常用軟件基因結(jié)構(gòu)分析常用軟件 6 開放讀碼框的識別開放讀碼框的識別 開放讀碼框(open reading frame, ORF) 是一段起始密碼子和終止密碼子之間的堿基序列 ORF 是潛在的蛋白質(zhì)編碼區(qū) 7 基因開放閱讀框基因開放閱讀框/ /基因結(jié)構(gòu)分析識別工具基因結(jié)構(gòu)分析識別工具 ORF
4、Finder /gorf/gorf.html NCBI通用 BestORFhttp:/ group=programs&subgroup=gfind Softberry真核 GENSCAN/GENSCAN.htmlMIT脊椎、擬南芥、玉米脊椎、擬南芥、玉米 Gene Finder/tools/genefinder/Zhang lab人、小鼠、擬南芥、酵母 FGENESHhttp:/ &group=programs&subgroup=gfind Softberry真核(
5、基因結(jié)構(gòu)) GeneMark/GeneMark/eukhmm.cgiGIT原核 GLIMMER/genomes/MICROBES/gli mmer_3.cgi /software/glimmer Maryland原核 Fgeneshttp:/ group=programs&subgroup=gfind Softberry人(基因結(jié)構(gòu)) FgeneSVhttp:/ oup=programs&subgroup=gfindv Softberry病毒
6、 Generation /generation/ORNL原核 FGENESBhttp:/ &group=programs&subgroup=gfindb Softberry細菌(基因結(jié)構(gòu)) GenomeScan /genomescan.html MIT脊椎、擬南芥、玉米脊椎、擬南芥、玉米 GeneWise2http:/www.ebi.ac.uk/Wise2/EBI人 GRAIL/grailexp/ORNL人、小鼠、擬南芥、果蠅 8 ORF識別識別:GENSCAN h
7、ttp://GENSCAN.html 結(jié)果返回到郵箱(可選)結(jié)果返回到郵箱(可選) 提交序列提交序列 提交序列文件提交序列文件 運行運行GENSCAN 顯示氨基酸或顯示氨基酸或CDS序列序列 序列名稱(可選)序列名稱(可選) 是否顯示非最優(yōu)外顯子是否顯示非最優(yōu)外顯子 選擇物種類型選擇物種類型 9 9 GENSCAN輸出結(jié)果:文本輸出結(jié)果:文本 1010 GENSCAN輸出結(jié)果:圖形輸出結(jié)果:圖形 11 ORF識別識別: GenomeScan 提交待分析序列提交待分析序列 提交同源蛋白質(zhì)序列提交同源蛋白質(zhì)序列 運行運行GenomeScan http:/genes.mit
8、.edu/genomescan.html 12 GenomeScan輸出結(jié)果輸出結(jié)果:文本:文本 預測外顯子位置、可預測外顯子位置、可 信度等信息信度等信息 同源比同源比 對信息對信息 預測結(jié)果的氨基酸序列預測結(jié)果的氨基酸序列 13 GenomeScan輸出結(jié)果輸出結(jié)果:圖形:圖形 14 課堂練習 1使用GENESCAN預測序列中可能的ORF。 2使用GENOMESCAN預測序列中可能的 ORF。 練習用的序列文件在c:zcnishixi2文件下, 名字為clone.fasta,使用寫字板打開查看。 15 轉(zhuǎn)錄調(diào)控序列分析轉(zhuǎn)錄調(diào)控序列分析 CpG島、轉(zhuǎn)錄終止信號和啟動子區(qū)域的預測 16 CpG
9、島的預測 CpG島 常位于真核生物基因轉(zhuǎn)錄起始位點,GC含50% , 長度200bp的一段DNA序列。 17 CpG Island 分析常用軟件分析常用軟件 CpG Island http:/ x Web CpGPlot http:/www.ebi.ac.uk/emboss/cpgplot/index. html Web CpG finder http:/ pgfinder&group=programs&subgroup=pro moter Web CpGi130http:/ CpGproD http:/pbil.univ- lyon1.fr/software/cpgprod_query.ht
10、ml web 提交序列文件提交序列文件 提交序列提交序列 參數(shù)選項參數(shù)選項 CpG島的預測:CpGPlot http:/www.ebi.ac.uk/emboss/cpgplot/index.html 19 GENESCAN 預測結(jié)果 起始為532bp 終止于51783bp 20 轉(zhuǎn)錄終止信號轉(zhuǎn)錄終止信號 上游作用元件:AAUAAA 下游作用元件:GC rich二重對稱區(qū)、UUUUUU C-G C-G G-C G-C U-A G-C G-C C-G G-C UUUUUUUUU RNA 53 AAUAAACAAAAAAAAAAAAA 成熟mRNA 53 AAUAAACAGUmRNA前體5 3 21
11、 轉(zhuǎn)錄終止信號預測:POLYAH http:/ &subgroup=promoter 提交序列文件提交序列文件 提交序列提交序列 22 polyA位置 GENESCAN預測結(jié)果 PolyA位點52490bp POLYAH輸出結(jié)果 23 啟動子區(qū)結(jié)構(gòu)啟動子區(qū)結(jié)構(gòu) 啟動子(Promoter) 位于結(jié)構(gòu)基因5端上游,能活化RNA聚合酶,使之與模板 DNA結(jié)合并具有轉(zhuǎn)錄起始的特異性。 轉(zhuǎn)錄起始位點(Transcription start site, TSS) PYCAPY(嘧啶) 核心啟動子元件(Core promoter element) TATA box,Pribnow box (TATAA) 上
12、游啟動子元件(Upstream promoter element,UPE) CAAT box,GC box,SP1,Otc 增強子(Enhancer) 24 原核和真核生物基因轉(zhuǎn)錄起始位點上游區(qū)原核和真核生物基因轉(zhuǎn)錄起始位點上游區(qū) 結(jié)構(gòu)結(jié)構(gòu) 原核生物原核生物 真核生物真核生物 TTGACATATAATA mRNA 11035 PyAPyTATAATGC區(qū) CAAT區(qū) mRNA 14025110 增強子增強子 上游啟動子元件,上游啟動子元件,UPE核心啟動子元件核心啟動子元件 轉(zhuǎn)錄起始轉(zhuǎn)錄起始 位點位點 25 PromoterScan:80/mol
13、bio/proscan/Web Promoser/zlab/PromoSer/Web Neural Network Promoter Prediction /seq_tools/promoter.htmlWeb Softberry: BPROM, TSSP, TSSG, TSSW http:/ ex&group=programs&subgroup=promoter Web MatInspectorhttp:/www.gene-regulation.de/Web RSAThttp:/rsat.ulb.ac.be/
14、rsat/Web Cister/mfrith/cister.shtmlWeb 啟動子結(jié)合位點分析常用軟件啟動子結(jié)合位點分析常用軟件 26 啟動子預測:PromoterScan /molbio/proscan/ 提交序列提交序列 27 PromoterScan輸出結(jié)果 找到的TATA box和轉(zhuǎn)錄起始位點 預測可能的轉(zhuǎn)錄因子預測可能的轉(zhuǎn)錄因子轉(zhuǎn)錄因子在提交序列中的位置轉(zhuǎn)錄因子在提交序列中的位置 28 課堂練習 1 使用CpG Plot預測基因的CpG island 位置。 2 使用PolyAH預測基因可能的轉(zhuǎn)
15、錄終止 的位置。 3 使用PromotorScan尋找基因上游序列 里可能的轉(zhuǎn)錄因子調(diào)控區(qū)域。 基因密碼子偏好性基因密碼子偏好性 29 1.研究研究蛋白質(zhì)結(jié)蛋白質(zhì)結(jié) 構(gòu)功能構(gòu)功能中的作用中的作用 2.在在表達外源基表達外源基 因因方面的作用方面的作用 3.在在生物信息學生物信息學 研究中的作用研究中的作用 基因密碼子偏好性基因密碼子偏好性: CodonW 30 粘帖目的序列粘帖目的序列 密碼子表的選擇密碼子表的選擇 如需計算如需計算FOP/CBIFOP/CBI 選擇相應物種選擇相應物種 如需計算如需計算CAICAI選擇選擇 相應物種相應物種 輸出格式輸出格式( (默認不選默認不選) ) 匯總所
16、有基因的信息匯總所有基因的信息 31 參 數(shù) 選 擇 計算所有指數(shù)計算所有指數(shù) 選擇導入對應物種選擇導入對應物種 CAICAI FOPFOP CBICBI數(shù)據(jù)數(shù)據(jù) 計算有效密碼子數(shù)計算有效密碼子數(shù) 計算計算GCGC含量含量 計算計算GC3sGC3s含量含量 計算同義密碼子數(shù)量計算同義密碼子數(shù)量 計算同義密碼子計算同義密碼子 第三位堿基組成第三位堿基組成 密碼子總數(shù)密碼子總數(shù) 32 各項指數(shù)輸出結(jié)果各項指數(shù)輸出結(jié)果 密碼子使用頻率密碼子使用頻率 CodonW結(jié)果界面 課堂練習 使用CodonW分析基因的密碼子使用偏好, 了解密碼子偏好分析中各指數(shù)的含義。 33 34 內(nèi)含子內(nèi)含子/外顯子剪切位點
17、識別外顯子剪切位點識別 如何分析核酸序列中的外顯子組成? 通過對特征序列(GT-AG)的分析進行直 接的預測基因預測軟件(NetGene2) 與相應的基因組序列比對,分析比對片 段的分布位置(Spidey) 35 36 剪切位點識別:剪切位點識別:NetGene2 http:/www.cbs.dtu.dk/services/NetGene2/ 提交序列提交序列 選擇物種選擇物種 37 NetGene2輸出結(jié)果輸出結(jié)果 供體位點供體位點 受體位點受體位點 可信度可信度 相位相位 38 mRNA剪切位點識別:剪切位點識別:Spidey NCBI開發(fā)的在線預測程序 用于mRNA序列同基因組序列比對分
18、析 /spidey 39 Spidey同源序列的獲得同源序列的獲得:序列比對序列比對 通過BLAST進行序列比對,找到可能同源 的相似性好的一系列mRNA序列。 BLAST比對到的三條mRNA序列 40 輸入基因組序列或序列數(shù)據(jù)庫號輸入基因組序列或序列數(shù)據(jù)庫號 輸入相似性序列輸入相似性序列 判斷用于分析的序列間的判斷用于分析的序列間的 差異,并調(diào)整比對參數(shù)差異,并調(diào)整比對參數(shù) 不受默認內(nèi)含子長度限不受默認內(nèi)含子長度限 制,制, 默認長度:內(nèi)部內(nèi)含子默認長度:內(nèi)部內(nèi)含子 為為35kb, 35kb, 末端內(nèi)含子為末端內(nèi)含子為 100kb100kb 比對閾
19、值比對閾值 選擇物種選擇物種 輸出格式選擇輸出格式選擇 41 Spidey輸出結(jié)果 第一條藍色序列第一條藍色序列 為基因組序列,為基因組序列, 橘黃色為外顯子橘黃色為外顯子 外顯子對應于外顯子對應于 基因組上的基因組上的 起始起始/ /結(jié)束位置結(jié)束位置 外顯子對應于外顯子對應于 mRNA/cDNAmRNA/cDNA上的上的 起始起始/ /結(jié)束位置結(jié)束位置 供體、受體位點供體、受體位點 外顯子外顯子 長度長度 一致性一致性 百分比百分比 錯配和錯配和gapgap 外顯子外顯子 序號序號 序列聯(lián)配結(jié)果序列聯(lián)配結(jié)果 42 課堂練習 1 練習兩種預測剪切位點的軟件的使用, NetGene2和Spidey。 2 Spidey的同源序列文件保存在 c:zcnishixi2文件下,名字為Spidey.txt, 使用寫字板打開查看。 43 選擇性剪切選擇性剪切(Alternative splicing)分析分析 選擇性剪接是調(diào)控基因表達的重要機制 了解不同物種、細胞、發(fā)育階段、環(huán)境壓力下基因 的調(diào)控表達機制 44 選擇性剪接的類型選擇性剪接的類型 選擇性剪切的五種基本類型: 內(nèi)含子保留. 5端選擇性剪切位點. 3端選擇性剪切位點. 外顯子遺漏. 互斥外顯子. 45 查詢選擇性剪切相關(guān)的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年貧瘦煤合作協(xié)議書
- 2025年特異性植物源農(nóng)藥合作協(xié)議書
- 2025年二年級下冊班級工作總結(jié)(2篇)
- 2025年企業(yè)勞動用工合同標準樣本(2篇)
- 2025年個人門面房租賃合同標準樣本(2篇)
- 2025年五年級下學期少先隊工作總結(jié)(五篇)
- 2025年中介服務合同范例(三篇)
- 戶外運動中心裝修合同終止
- 液體化工品國內(nèi)運輸協(xié)議
- 寵物運輸包車協(xié)議樣本
- 2025-2030年中國反滲透膜行業(yè)市場發(fā)展趨勢展望與投資策略分析報告
- 湖北省十堰市城區(qū)2024-2025學年九年級上學期期末質(zhì)量檢測道德與法治試題 (含答案)
- 山東省濰坊市2024-2025學年高三上學期1月期末 英語試題
- 春節(jié)節(jié)后收心會
- 《榜樣9》觀后感心得體會四
- 《住院患者身體約束的護理》團體標準解讀課件
- 中國心力衰竭診斷與治療指南解讀
- 復工復產(chǎn)工作方案范本【復產(chǎn)復工安全工作方案】
- HyperMesh100基礎(chǔ)培訓教程
- 現(xiàn)代機械強度理論及應用課件匯總?cè)譸pt完整版課件最全教學教程整套課件全書電子教案
- 農(nóng)村信用社個人借款申請審批表
評論
0/150
提交評論