啟動子生物信息學(xué)分析軟件_第1頁
啟動子生物信息學(xué)分析軟件_第2頁
啟動子生物信息學(xué)分析軟件_第3頁
啟動子生物信息學(xué)分析軟件_第4頁
啟動子生物信息學(xué)分析軟件_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

啟動子生物信息學(xué)分析軟件啟動子生物信息學(xué)分析軟件啟動子生物信息學(xué)分析軟件V:1.0精細整理,僅供參考啟動子生物信息學(xué)分析軟件日期:20xx年X月

1.PromoterPrediction/seq_tools/promoter.html2.PlantCARE(plant

cis-actingregulatoryelements),adatabaseofplant

cis-actingregulatoryelementshttp://bioinformatics.psb.ugent.be/webtools/plantcare/html/3.promoter2.0predictionserverhttp://www.cbs.dtu.dk/services/Promoter/4.啟動子分析網(wǎng)址:

1/seq_tools/promoter.html

2http://alggen.lsi.upc.es/recerca/menu_recerca.html

3http://www.cbs.dtu.dk/services/Promoter/

4/~molb470/...s/solorz/index.html

5/molbio/proscan/

http://bip.weizmann.ac.il/toolbo...ters.html#databases

/seq_tools/promoter.html

.sg/promoter/CGrich1_0/CGRICH.htm

/pub/programs.html#pmatch

.hk/~b400559/arraysoft_pathway.html#Promoter

http://www.dna.affrc.go.jp/PLACE/signalup.html

http://intra.psb.ugent.be:8080/PlantCARE/

http://www.cbs.dtu.dk/services/Promoter/

/molbio/proscan/

/molbio/signal//thread-41571-1-1.htm常用啟動子分析網(wǎng)址:http://bip.weizmann.ac.il/toolbox/seq_analysis/promoters.html#databases

/seq_tools/promoter.html

.sg/promoter/CGrich1_0/CGRICH.htm

/pub/programs.html#pmatch

.hk/~b400559/arraysoft_pathway.html#Promoter

http://www.dna.affrc.go.jp/PLACE/signalup.html

http://intra.psb.ugent.be:8080/PlantCARE/

http://www.cbs.dtu.dk/services/Promoter/

/molbio/proscan/

/molbio/signal/

首先就是想直接查找有沒有人做過這條基因的啟動子,在pubmed中輸入genename+promoter

接著就想看看有沒有數(shù)據(jù)庫可以直接給出啟動子序列的,很幸運竟然發(fā)現(xiàn)一個極好的啟動子搜索講義網(wǎng)站,如下,.il/workshops/bgu/promoterworkshop.html

第一步就是要找到基因確定基因所在基因組區(qū)域,其中列出很多網(wǎng)站,不過偶還是習慣genbank,在gene欄中search某個基因,不要搞錯基因種屬!進入后即可看到該基因的詳細條目,別眼花,就點擊右側(cè)link欄的Mapviewer鏈接,進入即可看到該基因在染色體上的形象定位,鼠標懸停在基因的起始位點時,即可在瀏覽器下方的狀態(tài)欄中顯示該位點在染色體上的明確定位,比如110997788,結(jié)合給出的基因跨度,比如110778899-117708899,即可大概確定該啟動子在基因組中的大概定位,即110778899-110997788;

第二步搞清楚基因組狀態(tài),我沒搞太清楚,不過其中給的一個鏈接來查出啟動子所在克隆(查出克隆號可以購買)/genome/guide/mouse/

該鏈接中的clonefinder工具可以做到,只要提交你要查找的基因officialname就可以返回一個clonelist;

第三步搜索啟動子,其中可以用啟動子數(shù)據(jù)庫和啟動子預(yù)測軟件,當然如果啟動子數(shù)據(jù)庫中有最好,但很失望給出的數(shù)據(jù)庫均不能查到!只好用啟動子預(yù)測軟件,使用了幾個在線預(yù)測工具后覺得下面這個速度賊快,推薦http://www.cbs.dtu.dk/services/Promoter/

我把該基因的dna序列submit之后返回了很多個PolII識別位點,到底哪個是呢我個人理解啟動子應(yīng)該是翻譯起始位點附近,所以在這個dna序列中定位翻譯起始位點即可找到最近的Highlylikelyprediction,那么怎么定位呢利用blast2這個利器,只要把dna和mrna序列粘貼進去提交就ok,正好在翻譯起始位點上游幾百bp有個識別位點,ok!啟動子序列就是翻譯起始位點上游大概1kb長度的序列了!

直接用ensemble數(shù)據(jù)庫的話,可以直接知道基因外顯子和起始位點的位置,然后直接可以查到之前的序列,再選3k-4k的長度預(yù)測就比較方便了。啟動子及轉(zhuǎn)錄因子結(jié)合位點數(shù)據(jù)庫及預(yù)測工具

(2009-05-1423:54:56)轉(zhuǎn)載忽然感覺很GUILTY的,BLOG里竟然不放一點點和研究有關(guān)的重要工具。換了電腦之后才發(fā)現(xiàn),很多有用的鏈接都沒有COPY下來,于是,從頭開始做吧。這是Andrew給我的他的PAPER里的有關(guān)轉(zhuǎn)錄因子結(jié)合位點的數(shù)據(jù)庫,還有其他網(wǎng)友整理的,都很有用,這個星期有空再核下幾個重要基因的SNP。

PROMOTERFINDINGANDANALYSISPROGRAMSONTHEINTERNET

--------------------------------------------------------------------------------

TRANSPLORER(TRANScriptionexPLORER)

Dnanalyze(TFmapping)

DragonPromoterFinder1.2(TSSfinderandpromoterregionanalysis)

FunSiteP2.1

HCtata(TATAsignalprediction)

McPromoterVer.3

MatInspector(SearchforTFbindingsites)

ModelGeneratorandModelInspector

NNPP2.1(TSSfinder)

PromoterInspector(Strandnon-specificpromoterregionfinder)

Promoter2.0(TSSfinder)

PromoterScanII(Promoterregionprediction)

RGSiteScan

SignalScan(SearchforEukaryoticTranscriptionalElements)

TESS(SearchforTranscriptionElements)

TFSEARCH(PredictsTFbindingsitesbasedonTRANSFACdata)

TRANSFAC(TFdatabaseandanumberofassociatedprograms)

TSSGandTSSW

PROMOTER2.0

http://www.cbs.dtu.dk/services/Promoter/

通常確定啟動子的算法可以分成兩種,一種根據(jù)啟動子區(qū)各種轉(zhuǎn)錄信號,如TATA盒、CCAAT盒,結(jié)合對這些保守信號及信號間保守的空間排列順序的識別進行預(yù)測。如PROMOTER2.0,用神經(jīng)網(wǎng)絡(luò)方法確定TATA盒、CCAAT盒、加帽位點(capsite)和GC盒(GCbox)的位置和距離,識別含TATA盒的啟動子。

PROMOTERSCAN

/molbio/proscan/

根據(jù)轉(zhuǎn)錄因子結(jié)合部位在基因組中分布的不平衡性,將轉(zhuǎn)錄因子結(jié)合部位分布密度與TATA盒的權(quán)重矩陣(weightmatrix)結(jié)合起來,從基因組DNA中識別出啟動子區(qū)[3]。但上述程序預(yù)測的假陽性率較高,PROMOTER210每23kb出現(xiàn)一個假陽性;PRO2MOTERSCAN平均每19kb出現(xiàn)一個假陽性。

PromoterInspector

http://www.genomatix.de/products/PromoterInspector/PromoterInspector2.html

另一種方法根據(jù)啟動子區(qū)序列的特征進行預(yù)測。Promo2terInspector從一組訓(xùn)練序列中提取出啟動子區(qū)的環(huán)境特征,并將外顯子、內(nèi)含子和3’端非翻譯區(qū)的特征與啟動子區(qū)加以區(qū)分,從而在基因組中確定啟動子位置

FirstEF

/tools/FirstEF/

近來還有一些程序?qū)⑸鲜龇椒ㄅcCpG島(CpGislands)信息相結(jié)合。CpG島是一段200bp或更長的DNA序列,核苷酸G+C的含量較高,并且CpG雙核苷酸的出現(xiàn)頻率占G+C含量的50%以上。許多脊椎動物的啟動子區(qū)都與CpG島的位置重合。FirstEF(http://rulai1cshl1org/tools/FirstEF/)搜索通過5’UTR定位技術(shù)構(gòu)建的第一外顯子數(shù)據(jù)庫,識別第一剪切點(firstsplicingdonorsite),結(jié)合CpG島信息,確定啟動子區(qū)。這種方法使預(yù)測的敏感性和特異性都明顯提高。該程序預(yù)測含CpG島的啟動子的敏感性和特異性都高于90%,預(yù)測不含CpG島的啟動子的精確性相對略低。

TRRD數(shù)據(jù)庫http://wwwmgs.bionet.nsc.ru/mgs/dbases/trrd4/

收錄了真核基因調(diào)控區(qū)結(jié)構(gòu)和基因表達方式的信息,每個條目對應(yīng)一個基因。

應(yīng)用權(quán)重矩陣數(shù)據(jù)庫搜索轉(zhuǎn)錄因子結(jié)合部位的程序包括

SIGNALSCAN

/molbio/signal/

MatInspector

http://www.genomatix.de/products/index.html

轉(zhuǎn)錄因子搜索程序(transcriptionalfactorsearch,

TF2SEARCH)http://www.cbrc.jp/research/db/TFSEARCH.html

等等。盡管基于PWM的搜索比較敏感,但它最大的缺點就是假陽性率過高,在預(yù)測的結(jié)果中有很多結(jié)合部位并不真正具有生物學(xué)功能。

COMPEL數(shù)據(jù)庫

http://compel.bionet.nsc.ru/new/index.html

經(jīng)實驗確定的復(fù)合元件不多,COMPEL數(shù)據(jù)庫中收錄了近200條經(jīng)實驗確定的復(fù)合元件的信息。如果轉(zhuǎn)錄因子結(jié)合部位的預(yù)測結(jié)果中包含復(fù)合元件,顯然比單個元件更有可能具有生物學(xué)功能。Co-Bind程序通過建立兩個轉(zhuǎn)錄因子結(jié)合部位的PWM及其復(fù)合作用的模型,可以預(yù)測序列中的復(fù)合元件。還有一些程序利用COMPEL數(shù)據(jù)庫中已知的復(fù)合元件去搜索基因組序列。

Consensus/pub/consensus/

AlignACE/cgi-bin/alignace.pl

等是用來搜索高含量基序(overrepresentedmotiffinding)的一些算法,可以對一組基因簇中的基因調(diào)控區(qū)進行比較,以發(fā)現(xiàn)其中存在的高含量的基序,調(diào)控元件可能就存在于這些基序之中。

摘自tjogzt's的BLOG,有些挺好的收錄/archive.html

1.NCBI上的FindingPromoter(NCBI推薦的)

(/Class/NAWBIS/Modules/DNA/dna21b.html)

PromoterScanfromtheBioinformaticsandMolecularAnalysissectionof

NIH.

TFSearchfromtheComputationalBiologyResearchCenterofJapan.

DRAGONGeneStartFinderfromtheDRAGONGenomeExplorersite.

2.Promoter2.0PredictionServer

(http://www.cbs.dtu.dk/services/Promoter/)

Promoter2.0predictstranscriptionstartsitesofvertebratePolII

promotersinDNAsequences.Ithasbeendevelopedasanevolutionof

simulatedtranscriptionfactorsthatinteractwithsequencesinpromoter

regions.Itbuildsonprinciplesthatarecommontoneuralnetworksand

geneticalgorithms.

3.TFSEARCH(http://www.cbrc.jp/research/db/TFSEARCH.html)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論