基因啟動子分析_第1頁
基因啟動子分析_第2頁
基因啟動子分析_第3頁
基因啟動子分析_第4頁
基因啟動子分析_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、基因啟動子分析一:克隆目的基因基本啟動子序列我們都知道,基因的基本啟動子一般是在基因轉(zhuǎn)錄起始位點上游,當(dāng)一個基因在沒 有確定其轉(zhuǎn)錄起始位點的時候,我們假定NCB止提交的序列就是他的完整轉(zhuǎn)錄本, 那么他的第一個堿基就是他的轉(zhuǎn)錄起始位點。而基因的基本啟動子一般就是在轉(zhuǎn)錄起始位點的上游2000b左右和下游200b|左右,當(dāng)然,這個是一般情況,具體問題還 要具體分析.尤其現(xiàn)在發(fā)現(xiàn)一般的基因都是有幾個轉(zhuǎn)錄起始位點的 我們通過該基因mRN序列和基因組序列BLAST就能夠在染色體上找到這段基因組 序列。我這里用huma的AGGFS因做個例子給大家具體演示一下.1首先需要在NCB里面查找到AGGFS因的mRN

2、序列,這個我想大家都應(yīng)該很清楚, 如下圖.Lri/qsr. eyi: c d itq" rrVG 3QTr/g皀二皀_£苧1:口:'3“它左益二匚-" / ff e * &G=rrc H 7 “-e = z - ty.= " z Z 2 2 i : n /cene my二:二二J三 qW L rr / ge 口c 口 yra= TrU5 = 137Lrpg且g'ctcttcx ggcctctggt611211B124130136121481541 gaaacfcaaca601 ggqag且h臣匸廿661 tggtcaatcl;72

3、1 號匸 gHUtg 比 he: 7B1 gaccattuac811 tatagacaq901 gagataact961 gccqtatcac 1021 accggtccec 1091 tactatrtg 1141 tatccgactt 1201 ccagattctt 1261 agtgxtgaac 1321 aaataggca 13S1 aetatzag&gtagctaaggcg gaaggtggag gggagarcga gaagctgrtgtagtuatgar tgaaaatca且tggTcgTtatacraaagtaaatgaggaaaag caatgaggaaaaatagtc

4、cc tga&aacatccttatccgac rccgrtcgc cgagcccg agccgggtgl: CQtCCIjtttC acggcctcgg gagctggacc cggcaggcgc gctcctccct aggccgcgca ttcggcracH gaggctgcct ggccrtgaacg aggcgccgtcaccaggagct aagata且匸且h u曰gpt匸且ttt tgtzcag 且 tua aagtagaaaa tggaccattv ccttagaagg iigactgqart attatg且匸tu atgtgg且a旦口 ctagcacaaa ctgca

5、acaaa atacaagctg ttcatcAcaa crcctcttca ctgtctctgt caccgggeag agtgagt匸tu ttogctgacc cagcccctcc accgccgcg?ccgcacgeag aaagtctgat ZaZcagacg aca agate: aa tgargett ac tgcGLcaaat ctcAcatta agetggagaa ggq-ccatccr agg-getcar gcgcgatcca gegtjegaega tcg'ccgccgc aag-ttggaac cat cac acaq gtQaaq&ac gtaga

6、agtac tauthu呂日匸口 get at:cgaad cct ggt accg tcacaggagc getgaaagtt gaa.aat actq ctetattatg cag'tttcatt gat aaa aaar gatttaacx gaaaatttcq cccaaagtcA teta&rtcaa ggtagtttcc cggteeccrt ggee 且 ggggc: gtggtctctg gcacj 七 ctcgc ctjcccacctc gtgaactgcg aaeggetgra tcagtaaaat aaacagagaa aegttagtet cttctat

7、ttt atagaacaga GagGatctQG tgagagctgc gactgtatrt atcctcccac ctcgagtaga tzgaagaagaa cagaggatca caaatatgaa ctgttccaac catcatttaaaggaaagttr gcccgttgcc caacgcggcc ggtccgccgg (jeegga get; c ccccgagcct ga?ctgcaag cc&gaacgca actccaacgc ecatgctcct ccaaaraaa gaattetaaa aaatgttaaa. atuacaaca. ageagaageg tg

8、accacagc eggaat teat tttgcaacct aagaaa a.gat aaaageette aaagaaggee tatggaaau agatg&ga&a2然后就是用這段mRN序列和人類的基因組序列BLASTBLAST Assembled GenomesChoose a species genome to search, “l(fā)ist all qenomic: BLAST UdtehESESi° hhimHn° Rat口 Zl jaBFMogZs tha陽 ns口 0爭陽囪掉啊 Egg 恰甘口 Dneio 用Ho DrosoZ伽播它翠st赴

9、f3 BLAST!到了很多結(jié)果,我們往往選擇最上面那個最匹配的結(jié)果v DescriptionsSeqtierLees produjcing signiflcane aligmients!il.N.Tii_pu£2 .匸_.!£ LH.s5_£07.a 甘心論 sapiens eKrretues&me 5 genemit t.- it已十 i 川叫丄|3任衣95丄-1 Hm£iAJGaj44 M 6Acimcj m皚pij色n呂巴hrdatomM皀月?色.- 疋色唱 I1 IHmCr aAADElZl_224 H&Wia sapiens c

10、hrahiGSontie 5.工已 f MT_口丁25,丄3 I He 1. U_1了951 Hctno sapiens chr omosaiine ID genomi. i:mf I NV廠92宓4.1 |HmCaADEu7_44 Homo sapiens chramosome 12 ge._ 工已f I NM”_00IE 41J.ME - 1 IHsUn_W盟MM 13£ Homo sapiens genomic conti.BapiEiis chronio30lne 4 geiiaatiic . Homo sapiens chrom口口口!亡 3 ge.sapiens chro

11、niogcme 3 genoati:Lc Homo 辭I 麗DU 14127?.丄專6耳匸f I NV廠口0邊肛竹7: 1心白盯陽人陽山二皀f LTT,D2292,1了1 H$4 2 2©4合 Homo工亡f I 盼匚口01*3£!878 -16工亡fI MT。?理59 14 I盲HomoI 時應(yīng) 口 511丨日日呂1J 6piena chromosonis 3 gun* * EtQing sapXens genomic; *耳口ipo sapXens 融un口口outXi * Hamoref麗 933173.1HsC匚aAHpB匸 3 64 Homo sapi.en3 c

12、hramosame 6 cren,-refNT 02477.11 Hsl 6 2929 Homo sapiens chraniosome 16 qewnd. -工巴f I NW jjg:L8 38 28電陽丸 1(358chrcnnoscnie 16 ,-Hom sapiens chrcmQsonie 1 genomic u* Homo apxetis chrmcsanne 1 牙已門* Hoibo sapiens g hr emo some 1 ge no h “f I 麗工22口33 +1 I 曰sS aAADBCiE二 16L3 Homo sapiens genoini.c ccnt&#

13、177;g? ” .工譏丨MT_CJ329了九日I吊1_盟133工建fl価口CJ18_3857g* 2 I豆導(dǎo)1_詬人3工_3E 工言£| 麗號2 13jl +1 |日呂CraADBClE4點擊之后就可以看到下圖,這個基因的14個外顯子和13個內(nèi)含子在5號染色體上 的位置一目了然,第一個外顯子在上面,說明這個基因在染色體上是正向的,基本 啟動子就應(yīng)該在第一外顯子上面,我用紅色的方框標(biāo)明了。FTPDsbAs lacie view 時M 氏 Opt MillsCorr prees Map M ftecp on Shhnwn.三一gF一5E- F K 1 1 qf II召 r«&

14、gt;i+T L L±4a 2 Avofl-O tn- flqq 9 r- 1 fl 1 M ?;££ w盟 Lv?1IBLithtI<tiiuty-W I 573Elast Etkleiiht尸蛍3囑 56S. tEUBlast hitTndt7=10r,% fi?1 FT?BhEthitI婦血y 】Q0% E75. 1012Blast Litkleiiht尸:0兩 IU42 1231Blast hitM=n 陀L購軸 1229 1565Blast hitLJenhty= 10 0R4i15601673Bkst hitI<knai7=10C%1217

15、25El如hi【l<leiiaty00%17221827Blast hitl-_lenht7= ) 0 Cfi4i1E261的HEhst hi:陸ndg?涌19fl7亦BLschiI<lcnaty=9920712204Blast hitl-_lenhty= ) 023D4Blast hitI灰nd曠北口心2304侮5大家有沒有注意到左上方有個數(shù)據(jù)框,我把數(shù)值改為76,360K到76,362.200 , 剛好2200BP包括了第一個外顯子的前200B左右.然后點擊紅色框標(biāo)明的Dow nload/view seque nee.K 的 ion siown:fa g 或 k tJen氈尸

16、100% L.573Siimmairy of Maps ;Map I; Abehq 'febTabR VkwDisplayed- 76|360K'76,362p200 bjj DownloadN/iew Sumicnc e/E駅, eTxa mo拒七 CM Chromxotne; 351? 7 aOI-mtwiris Labeled: 2 Total models in Region 2、血p 2: KefSeq Tramcwtc 'On SeqjenDe血企頁級T.flki IDisf.7K餐(1広:&鮎7?7fin hp Tx訕TVif 如卄-1 - d T

17、oiad RrfS eq enpts On Chromo£om«: 1455 f3 notl0:ak:edTrarwctipfe Labeled: 1 Tot 就 B.ef5eq Trsn senpts 曲 Reon: 16然后就到了這個界面,Sequenee Format選擇GenBank,然后點擊Display.就 得到我們所需要的序列了.ihunian.i (Build 36.3)Chrcmio sotnt.:idhist b-/:from 763S0000OKStrand, plusto: G362200adjust bvj40KChange R&gion&

18、#39;'Str-andRecoil to retriex'e "in chromo some coordinates'):Fomiat G&nBank_ *This chromosome region corresponds to the contig region(s):Conristart stop strandXT_ijij6-1 3.1- 2691 >602 26i?2'j£Ci2- Eigplay1 Sav亡 to Disk I'iew Evidence IadeIXIaker7這里我們可以看到1989到22

19、01是AGGF的mRN序列,說明我們的確找到了該基因 5'非翻譯區(qū)的上游啟動子序列.建議將這2200bpS克隆下來,上乞二亡=”蠱匚蘭三二”丿匚段百unit: factor wlh G pacch and FH demais/excepticnnUD31as3LfieddisGrEpaEGy"/n3e= rrDerved by auu=r:aed =u:rjp'匸&二二nn也二 analysu gene predretror met?:ad: BestRefseq. 5'jppcrzisc evidence 蟲二ir二丄總上二uy ro i 1 riJ

20、mTL11.nranscript_id=Z _EC6. £rhf業(yè)_乂二士h書三:4總亍雖莎廠55L:'9r,/ dtK ref="?Z 3NC:空”/dbx石百r,CRZGIUascatrca-£61121181tectaaraacacGGc©匸匸二匚二吉匸注注 gaccctract Ci二艮匚己二匸己二utyccagagca301361421481=:-ccadcca&netc匸匸DUN己己acaaaacacazgzczctctt;(jnr;nr;ftT,mcacxtgagg aas.aa.acstag ctcxtgttca eecr

21、cacacagaa_ccccdcd aaai/Laa&tcc匸匸比乙匸t匸UCD匸二匸匕注螢二匚EG cauBacacca 陰匸 QgggG ggttatccccuxggt匚匚昌ea-atsrsLa 匸匚Eg二t二己己a. acaaaccac aacagggatg總匸ccrGcaatat,. atgciLgciCtG atggxcaggggcatttacgg c&"cracac&a*t =ta.i3i*era二己匕匸iggc己己己ctcctt-ttgcccatccacr t eq匚匸grerge agaccccaga ggccaccqat aactcctct

22、ccactc&oetert-geaaacgactcagacrsr.fli a以上的步驟就是基因基本啟動子的查找,其實還有很多調(diào)控序列是在基因內(nèi)含子區(qū) 域或者是基因的3'非翻譯區(qū)等,序列查找的步驟和上面是一樣的.8還有一個方法更加簡單,那就是用AGGF的前60bp序列和nucleotide數(shù)據(jù)庫 BLAST,以得到該序列在染色體上的位置,需要注意的是,如果是反向的序列的話, 我們就要選擇反向互補的序列Basic BLASTChoose a BLAST program to runnucleotide blast Search a nucleotideusing a nucleod

23、de query| Algonthms: blastn. nnegab-last. disccntiguous megabla&trotejn h|ast Search protein database using a protein quoryAlgonthms: blsstp psi-blasl, phi-blastiPubMedMudHlidcProteiniGerwmeSearchNucleotideVforGo丄與頁Display| GenBankvShov5v Send to7 Hide- sequence 口allbui aene. CD's and iniR2&

24、lt;/Range: fivm 16 370 649to|26 570 543ShoiY -.vhole sequence| Rt'Fers# contplfDienifd s二:軟件預(yù)測順式作用元件,做點突變分析得到這些序列后,克隆進(jìn)沒有啟動子載體pGL或者pTAL-luc中去,轉(zhuǎn)染細(xì)胞,測定 熒光活性,如果有很強的活性,那么說明你已經(jīng)成功克隆到了該基因的基本啟動子. 然后可以通過5 '非翻譯區(qū)一系列的缺失突變,不斷把范圍縮小,找到哪一段序列對 于該基因的啟動子活性是必須的或者是最重要的。當(dāng)找到這個比較核心的啟動子序列后,可以通過一些在線的軟件去預(yù)測其順式作用 元件的位點,每

25、個在線軟件都有自己獨特的算法分析,得到的結(jié)果并不都是可靠的, 每個軟件都有自己的優(yōu)勢,需要多綜合一些軟件預(yù)測的結(jié)果,并通過分析預(yù)測出來 的轉(zhuǎn)錄因子是不是和該基因有功能上的聯(lián)系等做進(jìn)一步的選擇,繼續(xù)做下面的驗證實驗。下面這兩個有商業(yè)化的軟件:http:/www.ge no matix.de/http:/www.ge ne-regulatio nsfac下面這兩個是免費:http:/www.cbrc.jp/research/db/TFSEARCH.htmlhttp:/www.cbil.upe nn. edu/cgi-b in /tess/tess用TES舉個列,直接在首頁下面的方框里輸入你要分析的

26、序列就可以了Try a qukk torch with the d»f«ult oaramtttrfJntj T1U*:.-2z jvbich <-Search DNA for BindingITSS also lees you search rirough your own sequence for TFBS You caniMlud總 ycur owfl at CDfisefKiE anrtgs diKi'oi weight m&ti ccs in Uw 輪uuh lLu Im Combined S««rch iiridw &#

27、39;Site S恫diw' iz ihf nbow w u-f? iif nHf r I叭 cm;如沏cnESS assigns a FESS job - umbeT t al seqw&nce search job石 The fib results are stored oft cur 昭 wr for s per od M jiix? spccficd in ihe scajcli subml him. Durr>g ill匕 time tfOu tnsh 搐附us ng mg 101m on this pH>TESS can also email r&siAs iq you as a t-nelmiied file 5Lii;ab m fc' loa山 ng ntc a spreadsheet projrim同樣在首頁,通過下面的方框,你可以查找一些轉(zhuǎn)錄因子的相關(guān)信息.Query for Transcription Factor InfoTESS also has data browsing and querying CBpabih

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論