版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基因組序列的差異分析mVISTA的在線使用說(shuō)明當(dāng)然,除了在線版的,我們還可以在網(wǎng)站上填寫信息中請(qǐng)離線的軟件。但我試用了一下,需要先自己比對(duì),然后要按照一定的格式來(lái)制作文 件,當(dāng)然你還必須得安裝java才能運(yùn)行軟件;總之,我感覺(jué)沒(méi)有在線 版的方便。1將數(shù)據(jù)放入服務(wù)器中在首頁(yè),你將被要求確龍你想要分析的基因組序列的數(shù)量。輸入這個(gè)數(shù)字之后,點(diǎn)擊“提 交”,將帶你到主提交頁(yè)面。mVISTA服務(wù)器最多可以同時(shí)處理100條序列。mVISTA SubmissionRankVISTA regions are now autoinaiically computed for all mVISTA submissi
2、ons. Add die rankVISTA curve in the VISTABrov/ser io view them. or click the rankVISTA link in the Text Browser to download the results of the coinputationPlease enter the number of species you would like to compare and click the Submit button. This will take you to a form where you may input your s
3、pecie Sequences.Total number of I I fJ要求你填入需要分忻的序列骸量sequences: w (2 -100 ) SubmitRsuipd fields are forked1.1主提交頁(yè)面必填的內(nèi)容E-mail地址通過(guò)ErnaiL我們可以提示你的在線處理已經(jīng)得到結(jié)果。序列你可以用2種方式來(lái)上傳你的序列:使用“Browse按鈕從你的電腦上,上傳純文本的Fasta格式文件。如果是一個(gè)作為參考的 生物體的DNA序列必須作為一個(gè)contig提交(可以進(jìn)行一泄的左向排列將多個(gè)片段合并為 一個(gè)cont回,而英他非參考序列可以在一個(gè)或多個(gè)contig中提交(draft)
4、。Fasta格式的示例序列(您可以在NCBI站點(diǎn)上找到關(guān)于該格式的更多細(xì)節(jié)):mouse ATCACGCTCTTTGTACACTCCGCCATCTCTCTCT注意:序列里而我們只接受字母CAGTN和X。請(qǐng)確保提交序列是作為一種純文本格 式,而不是Word或HTML文件格式。如果您以FASTA格式提交序列,我們建議您為它取一個(gè)有意義的名稱(比如直接是你 的物種名之類的),因?yàn)檫@些需稱將出現(xiàn)在我們生成的圖形中。如果您使用的是一個(gè)draft 草圖序列,那么結(jié)果中每個(gè)contigs的命需都將按照您在“”符號(hào)后指示的命名進(jìn)行。您可以給出它的GenBank登錄號(hào),系統(tǒng)將自動(dòng)從GenBank數(shù)據(jù)庫(kù)里進(jìn)行檢索
5、序列。在這兩種情況下,序列的總大小都不應(yīng)超過(guò)10M,而且任何一條序列都不應(yīng)超過(guò)2M。1.2主提交頁(yè)面選填的內(nèi)容這些選項(xiàng)允許您自定義您的VISTA分析。您可以使用獨(dú)立獲得的基因注釋,選擇合適的Repeat Masker選項(xiàng),給分析的序列指泄爻且稱,并改變序列保存分析的參數(shù)。如果您沒(méi)有填寫這些選填 選項(xiàng),我們將使用它們的默認(rèn)值。比對(duì)程序根據(jù)您分析的具體內(nèi)容(參見(jiàn)“about”-鏈接中的詳細(xì)信息),您可以選擇以下比對(duì)程序之一:1、AVID-全局兩兩比對(duì)。如果您選擇使用這個(gè)程序,其中一個(gè)序列應(yīng)該被完成比對(duì),其他所 有序列可以完成或以草圖draft格式完成。對(duì)于集合中所有已完成的序列,AVID生成所有
6、相對(duì)所有成對(duì)的比對(duì)結(jié)果,可以使用任何序列作為基礎(chǔ)(參考)來(lái)顯示。如果某些序列是 草圖格式,AVID將生成它們與最終序列的比對(duì),這將被用作基礎(chǔ)(參考)。這是該服務(wù)器 上唯一可以處理草圖序列的比對(duì)程序。(小知識(shí):草圖序列與完整序列 DNA sequence, draft: Sequence of a DNA with less accuracy than a finished sequenee. In a draft sequenee, some segments are missing or are in the wrong order or are oriented incorrectly.
7、A draft sequenee is as opposed to a finished DNA sequence)2、LAGAN-完成完整序列的全局兩兩比對(duì)和多重比對(duì)。如果某些序列是草圖格式,您的查詢 將被重泄向到AVID以獲得兩兩比對(duì)。多重比對(duì)將由VISTA可視化,它將計(jì)算并顯示序列的 保守區(qū),以您指示的任何序列作為參考。這是該服務(wù)器上唯一能夠產(chǎn)生真正的多重比對(duì)的程序。3、Sheffle-LAGAN-完整序列的全局比對(duì)。它檢測(cè)序列中的重排和逆序,同時(shí)產(chǎn)生一個(gè)全局的端 到端映射圖。如果你輸入幾個(gè)序列,所有成對(duì)的組合將被處理,結(jié)果將在VISTA中可視 化。這是該服務(wù)器上唯一可用于檢測(cè)重排和逆序
8、的比對(duì)程序。(葉綠體基因組差異分析論 文中好像一般都選這個(gè))對(duì)每條序列你可以選擇:名字你選擇的物種統(tǒng)字將會(huì)顯示在圖例中。我們建議您使用一些有意義的內(nèi)容,例如這個(gè)生物 體的爻且稱、您的實(shí)驗(yàn)編號(hào)或數(shù)據(jù)庫(kù)標(biāo)識(shí)。當(dāng)您使用GenBank標(biāo)識(shí)符來(lái)輸入序列時(shí),默認(rèn)情況下 我們將使用它作為序列的名稱。(頁(yè)面默認(rèn)的是sequencel, sequence2, sequence3.)注釋如果有序列的基因注釋信息,您可以將其以簡(jiǎn)單的純文本格式提交,以便在繪圖中顯示。 每個(gè)基因由其在序列上的起始和結(jié)束坐標(biāo)以及列在一行上的需稱來(lái)左義。一行前應(yīng)放置大于 ()或小于(V)的符號(hào),以表示正鏈或負(fù)鏈,但編號(hào)應(yīng)根據(jù)正鏈來(lái)排列。在
9、每個(gè)外顯子的開(kāi)始和 結(jié)束坐標(biāo)之后,外顯子以單詞“exon”單獨(dú)列出。UTRs的注釋方式與外顯子相同,用utr代替 “外顯子”。例如:le ge*n shownFil?OCkpbAid0Calt?c1iaft3 . Analpii Tac:匚5|網(wǎng)d 1 ng矣 jmjlGcliBtati 廠SummaryiqucnccGeriBwhGerCank (til)FASTAASH 1XMLIMSDS制 XM.TinySeq MLFeature TaMeAccession LotGl WGFF3OtionBicRojoctBwSsrrpkTAxonoiACompcncrts (Coro)OencmeR
10、ecent activity目 Panax notoginscng iso 匕cvosome 9. whole 滬Q Panax(123355)注意:但是我下載后導(dǎo)入mVISTA,結(jié)果顯示只注釋了前而一半的基因,后一半序列沒(méi)有注釋,我 也暫時(shí)沒(méi)搞懂,所以,后來(lái)就在網(wǎng)上下了一個(gè)perl腳本,來(lái)自于簡(jiǎn)書(shū)的mVISTA格式文件:由 Perl腳本處理GenBank注釋文件而來(lái),然后把NCBI上下載的參考序列的gb文 件轉(zhuǎn)換成了 mVISTA格式文件。重復(fù)序列(RepeatMasker的選擇)我們建議掩蔽一個(gè)堿基序列以獲得更好的比對(duì)結(jié)果。您可以提交掩碼或非掩碼序列。如果 提交了一個(gè)掩碼序列,英重復(fù)的堿基
11、序列被替換為字母“N”,請(qǐng)?jiān)谙吕藛沃羞x擇“one- celled/do not maskn選項(xiàng)。我們還接受輕度掩蔽序列,其中重復(fù)的元素以小寫字母顯示,而序列的苴余部 分以大寫字母顯示。在這種情況下,你需要在菜單中選擇 softmasked 選項(xiàng)。如果你的序列是非掩碼的,我們的服務(wù)器將用RepeatMasker來(lái)掩蓋重復(fù)序列。請(qǐng)?jiān)诓藛沃?為您的具體序列選擇一個(gè)特任的掩碼。如果你不希望你的序列被掩碼,選擇“one- celled/do not mask”。反向互補(bǔ)選擇您想要對(duì)第二個(gè)序列進(jìn)行反向互補(bǔ)的比對(duì)(如果沒(méi)有同源性,請(qǐng)嘗試這樣做)。監(jiān)管 VISTA(rVISTA)訪問(wèn) RegulatoryV
12、ISTA(rVISTA)access我們的服務(wù)器可以預(yù)測(cè)轉(zhuǎn)錄因子結(jié)合位點(diǎn),通過(guò)對(duì)結(jié)果序列運(yùn)行Regulatory VISTA (rVISTA)o rVISTA的最大尺寸限制是20IG有關(guān)此工具的信息,請(qǐng)參閱rVISTA說(shuō)明。結(jié)果在提交你的序列幾分鐘后,你將收到來(lái)自vista的電子郵件,提供給你一個(gè)個(gè)人 網(wǎng) 絡(luò)鏈接,從那里你可以訪問(wèn)你的分析結(jié)果。下而是結(jié)果頁(yè)。它列出了您提交的每個(gè)生物體,并為您提供了三個(gè)查看選項(xiàng)。這三個(gè)選項(xiàng) 是:文本瀏覽器(TextBrowser):提供所有詳細(xì)信息一一序列、比對(duì)、保守序列統(tǒng)汁等;VISTA瀏覽器 (Vista Browser):是一個(gè)交互式可視化工具,可以動(dòng)態(tài)瀏
13、覽結(jié)果的比對(duì),調(diào)整VISTA曲線和保存序 列參數(shù);和一個(gè)PDF文件(PDF):這是一個(gè)靜態(tài)的VISTA比對(duì)結(jié)果圖。Base (reference)Input and output files DynamicVistaorganism(sequences八 alignments, etc.)VisualizationImagesequencelTextBrowse rVista BrowserPDFsequence2TextBrowserVista BrowserPDFsequenc&3TextBrowserVista BrowserPDF在表的底部有一個(gè)鏈接,允許您凋整保存和可視化參數(shù)。通過(guò)點(diǎn)
14、擊它,用戶可以改變某些 參數(shù),這些參數(shù)用于計(jì)算保守區(qū)域和顯示每對(duì)提交序列的VISTA圖。諳注意,這些參數(shù)也可以在 使用VISTA瀏用器(VISTA Browser)時(shí)動(dòng)態(tài)調(diào)整。TextBrowser這個(gè)鏈接將以文本格式顯示分析的結(jié)果。You are browsing diiinp_r Chimp is the basealigned with:galagomouseother organismsInunanratusing the SLAG AN alignment pm gram Al 1 gnment prog ram在頁(yè)而的頂部是一個(gè)橫幅,顯示比對(duì)好的生物體。在較暗的標(biāo)題區(qū)域中列出的序列
15、充當(dāng)基礎(chǔ)或 叫參考(要選擇一個(gè)不同的參考,返回到結(jié)果頁(yè)而并單擊所需的參考序列劃稱旁邊的文本瀏覽器 鏈接L這個(gè)橫幅還列出了用于比對(duì)序列的程序。Coordinates on base sequeneo/sequence 1 ligl7_liia: 1-504513ATi?taBrowser-view region in vista BrowserGet CNS: seauence 1Get Dotplots: seau 如 e 1 七 eauencJcns & dotplots for all displayed alignments下面是導(dǎo)航區(qū)域,它顯示了當(dāng)前顯示區(qū)域的坐標(biāo),提供了一個(gè)到Vist
16、a瀏覽器的鏈接(見(jiàn)下面). 以及一個(gè)到所有保守區(qū)域列表的鏈接。此外,如果使用Shuffle-Lagan作為比對(duì)程序,將會(huì)有一 個(gè)鏈接來(lái)下載生成的比對(duì)結(jié)果的點(diǎn)狀圖0:hgL7 dna:l 30626L (+)mm5_dna:101829-347929 (-)Sequence length: 246.10Kbp Vista BrowserScore: 81754 alignment: sequencel- sequence2 irifa:length: 306.26Kbp抨 17 dna:293043 . 32f973 (+)cns:pdf:sequencel-sequenceQsequetice
17、l-sequeticeQseqmcel-sequenceQSequence length: 31.93KbpOverlap=13218bp1115人:101859.133436 (+)Sequencelength: 31.58KbpVista ErowsetScore: 425alignment: sequencel- sequence2mfa:sequencel- sequence2cns:s e queue e 1 - s e接下來(lái)是主表,其中列出了相對(duì)參考生物體生成的每次比對(duì)。每一行都是一個(gè)單獨(dú)的比 對(duì) 結(jié)果。除最后一列外,每一列都是指提交分析的序列。最后一列包含與整個(gè)比對(duì)有關(guān)的信息。每
18、一行的第一個(gè)單元格還包含這個(gè)特泄比對(duì)的VISTA圖的預(yù)覽,這允許你快速評(píng)估這個(gè)比 對(duì)的質(zhì)量,并看到重合部分。通過(guò)觀察表格中的一行,你可以看到每個(gè)生物體的哪個(gè)部分與哪個(gè)部分比對(duì)上了。“Sequence鏈接將返回一個(gè)參與比對(duì)的fasta格式的生物體序列片段。單擊VISTABrowser”鏈接將 啟動(dòng)設(shè)置為以所選有機(jī)體為參考的VISTA瀏覽器,并將坐標(biāo)設(shè)亶為所選比對(duì)的坐標(biāo)。最后一列提供了一些關(guān)于人類可讀的、MFA (multi-fasta對(duì)齊)格式的鏈接,一個(gè)單獨(dú)使用 這種比對(duì)的保守區(qū)域列表,以及單獨(dú)使用這種比對(duì)的pdf圖的鏈接。如果被檢查的區(qū)域是20K或 更少,可以執(zhí)行rVISTA分析,并且rVI
19、STA的鏈接也會(huì)顯示在這里。最新! !最后一欄還提供了對(duì)比對(duì)rankVISTA分析結(jié)果的鏈接。點(diǎn)擊這里閱讀更多關(guān)于 RankVISTA 的信息。VISTA Browser單擊VISTA瀏覽器鏈接將啟動(dòng)程序,并選擇相應(yīng)的生物體作為基礎(chǔ)/參考序列。VISTA瀏 覽 器是一個(gè)交互式的Java程序,設(shè)計(jì)來(lái)可視化多個(gè)比對(duì)結(jié)果。瀏覽器清晰的顯示界而可以 很容易 地跨多個(gè)物種識(shí)別高度保守的區(qū)域。詳細(xì)的幫助和說(shuō)明可以在這里獲得: HYPERLINK /vgb2help.shtmL /vgb2help.shtmLPDFPDF文件是比對(duì)結(jié)果和找到的保守區(qū)域的可視化顯示方式。mVISTA圖片最明顯的特征是 “峰谷”
20、圖。這張圖顯示了在任何給左的坐標(biāo)下,兩種生物之間的保守區(qū)域百分比(或者是差異 百分比,如果你使用cVISTA選項(xiàng))。頂部和底部百分比界限顯示在每一行的右邊。不同保存區(qū)域的顏色對(duì)應(yīng)于該區(qū)域的注釋。默認(rèn)情況下,粉色區(qū)域是保守的非編碼序列” (“CNS” ),深藍(lán)色區(qū)域是外顯子exons,淺藍(lán)色區(qū)域是非翻譯區(qū)UTRs。堿基序列中的空格由圖下 面的紅色線條部分表示。顏色圖例匯總在顯示器的左上角。表示基因的箭頭畫在圖的上方,指向基因的方向。外顯子和非翻譯區(qū)在mVISTA主圖上都是 彩色的。如果有足夠的空間,基因名稱都會(huì)出現(xiàn)在箭頭下方。重復(fù)直接顯示在圖的正上方,根據(jù) 圖左側(cè)的方案著色。圖下的灰色線顯示contigs,在草圖draft序列的情況下,contigs會(huì)被編號(hào)。注意:最后得到的結(jié)果都是一個(gè)pdf的文件,pdf格式是矢量圖格式,因此你就可以盡情編借啦, 只要你用的pdf編借器有編輯功能(如下圖所示),你就能隨意調(diào)動(dòng)那些基因注釋的大
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 茶葉加工合同樣本
- 銷售合同變更協(xié)議的法律責(zé)任
- 鋼琴租用合同模板
- 電動(dòng)伸縮門購(gòu)買合同樣本
- 建筑幕墻玻璃分包協(xié)議
- 誠(chéng)信設(shè)備維保服務(wù)合同
- 房屋買賣中介權(quán)益協(xié)議
- 個(gè)性化辦公用品采購(gòu)合同
- 企業(yè)合同履行堅(jiān)定保證書(shū)
- 物料采購(gòu)合同文本
- DL∕T 2447-2021 水電站防水淹廠房安全檢查技術(shù)規(guī)程
- AQ 1097-2014 井工煤礦安全設(shè)施設(shè)計(jì)編制導(dǎo)則(正式版)
- 四川省對(duì)外文化交流中心2024年公開(kāi)招聘工作人員歷年【重點(diǎn)基礎(chǔ)提升】模擬試題(共500題)附帶答案詳解
- 許昌市2022-2023學(xué)年七年級(jí)上學(xué)期期末語(yǔ)文試題
- 小學(xué)語(yǔ)文學(xué)習(xí)任務(wù)群的設(shè)計(jì)與實(shí)施研究
- 2024年中考物理微專題練習(xí)熱學(xué)計(jì)算1含答案
- 2024風(fēng)電光伏組合箱變技術(shù)規(guī)范
- 2024年華夏銀行股份有限公司校園招聘考試試題附答案
- 趣識(shí)古文字智慧樹(shù)知到期末考試答案章節(jié)答案2024年吉林師范大學(xué)
- 小班幼兒洗手觀察記錄分析
- 格蘭氣吸精量播種機(jī)
評(píng)論
0/150
提交評(píng)論