




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、一步一步教你使用NCBI查找 DNA、mRNA、cDNA、Protein 、promoter 、引物設(shè)計、 BLAST序列比對等作者: urbest2007-8-1蘇州大學(xué)生命科學(xué)學(xué)院Part fourPart threePart twoPart one一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳最近看到很多戰(zhàn)友在論壇上詢問如何查詢基因序列、如何進(jìn)行引物設(shè)計、如何使用BLAST進(jìn)行序列比對,這些問題在 NCBI 上都可以方便的找到答案?,F(xiàn)在我就結(jié)合我自己使用 NCBI 的一些經(jīng)歷 (經(jīng)驗) 跟大家交流一下 BCBI 的使用。 希望大家都能發(fā)表自己的使用心得,讓我們共同進(jìn)步!我分以下幾個
2、部分說一下NCBI 的使用:如何查找基因序列、 mRNA、Promoter如何查找連續(xù)的 mRNA、cDNA、蛋白序列運用 STS 查找已經(jīng)公布的引物序列如何運用BLAST進(jìn)行序列比對、檢驗引物特異性特別感謝本版版主,將這個帖子置頂!從發(fā)帖到現(xiàn)在,很多戰(zhàn)友對該帖給與了積極的關(guān)注,在此向給我投票的(以及想給我投票卻暫時不能投票的)各位戰(zhàn)友表示真誠的感謝,謝謝各位戰(zhàn)友!請大家對以下我發(fā)表的內(nèi)容提出自己的意見。關(guān)于 NCBI 其他方面的使用也請水平較高的戰(zhàn)友給予補充First of all,還是讓我們從查找基因序列開始。第一部分 利用 Map viewer 查找基因序列、 mRNA序列、啟動子( P
3、romoter )下面以人的IL6 (白細(xì)胞介素6)為例講述一下具體的操作步驟1打開 Map viewer頁面,網(wǎng)址為:/mapview/index.html在 search 的下拉菜單里選擇物種,for后面填寫你的目的基因。操作完畢如圖所示:2點擊“ GO”出現(xiàn)如下頁面:2一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳3在步驟二圖示的右下角有一個Quick Filter,下面是讓你選擇的幾個復(fù)選框,在 Gene前面的小方框里打勾,然后點擊Filter.出現(xiàn)下圖:說明一下 :1、染色體的紅色區(qū)域即為你的目的基因所處位置。 2、下面參考序
4、列給出了三個,是不同的部門做出來的,經(jīng)我驗證,序列有微小的差異,但總體來說基本相同。盡管你分別點擊后,序列代碼、序列代碼等有所差異,但堿基基本一致,不影響大家研究分析序列?,F(xiàn)在普遍采用的是最上面的那個序列, 這一條是世界范圍的生物科學(xué)家用計算機合成的一個序列。我也推薦大家使用這個序列。3一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳4點擊上述三條序列第一條序列 (即 reference ) 對應(yīng)的 Genes seq ,出現(xiàn)新的頁面,頁面下方為:5點擊上圖出現(xiàn)的 “ Download/View Sequence/Evidence ” ,即下載查看序列等功能,結(jié)果如圖所示:先對上面這張圖做
5、點簡要的說明,在Sequence Format(序列輸出格式)后面是一個下拉式選擇菜單,默認(rèn)的為FASTA格式,還有一個是GenBank格式。我推薦大家選擇GenBnak格式,因為這個格式提供了很多該基因的信息,而FASTA格式只有基因序列。6在 Sequence Format后選擇GenBank,然后點擊下面的Display ,目的基因的相關(guān)信息和序列就出現(xiàn)在眼前了。點擊后如圖所示(網(wǎng)頁較大,只抓取一小部分以作示范):4一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳在上述打開的網(wǎng)頁中,你可以看到基因長度,基因序列, 以及這個基因是如何被報道出來的等各種信息。你會看到 : mRNAjoi
6、n(3598.3678,3841.4031,5090.5203,5911.6057,7803.8394)這代表了從基因的 3598 位開始就是轉(zhuǎn)錄區(qū)了, 即我們常說的 mRNA片斷,由于內(nèi)含子的存在,所以 mRNA在 DNA序列上分成了幾段。CDS join(3660.3678,3841.4031,5090.5203,5911.6057, 7803.7970)CDS代表編碼序列,即蛋白編碼區(qū)是從3660 開始的( ATG),由于剪接作用所以CDS區(qū)也是不連續(xù)的。說到這里,可能很多朋友都已經(jīng)明白了promoter即啟動子區(qū)域在哪里了。但我還是再嘮叨幾句: 轉(zhuǎn)錄起始位點前面是基因的調(diào)控區(qū),啟動子區(qū)
7、沒有明顯的位置定義,大家也只是猜測它的大體位置,如果你要研究promoter區(qū)的話,建議你選擇轉(zhuǎn)錄起始位點前的2000個堿基進(jìn)行研究,一般默認(rèn)的是這樣。當(dāng)然你如果覺得長度太長不好研究的話,也可以只研究-1000 到 0 這一千個堿基,因為一般情況下,啟動子區(qū)的變異都在這個區(qū)域內(nèi)。這樣大家就可以找到自己的目的基因序列和啟動子了,這種方法可能使用的人不是很多,但我個人比較喜歡,因為它最大的優(yōu)點是可以找到啟動子區(qū)域和其他調(diào)控區(qū)域。希望大家可以發(fā)帖交流,讓我們把NCBI 用的更好!5一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳第二部分如何查找連續(xù)的mRNA、cDNA、蛋白序列(依然以人類的 I
8、L6 為例)1進(jìn)入 NCBI 主頁: /在 search 后面選擇Gene,在 for 后面填寫需要查找的基因的名字。如圖所示:點擊“ Go”,出現(xiàn)以下界面:出現(xiàn)了很多基因序列,在每個序列的右邊還有“Order cDNA clone ” 的鏈接,這些序列中有些序列是跟你的目的基因同名的,有些是別名(Other Aliases)與你的目的基因一致,根據(jù)每個序列的介紹認(rèn)真選擇你的目的基因。上圖中我需要的IL6 是標(biāo)號為2 的序列。2.1查找 cDNA序列2.1.1點擊 Order cDNA clone,出現(xiàn)目的頁面如圖所示:6一步一步教你使用NC
9、BI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳2.1.2 點擊 Clone Sequence 后面的鏈接即可得到 cDNA序列。點擊后如圖所示(只抓取其中一部分) :2.2查找 mRNA、蛋白序列回到步驟 1 點擊“ Go”之后出現(xiàn)的頁面,點擊目的基因的名字,出現(xiàn)以下頁面( 只抓取7一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳相關(guān)部分 ) :頁面的下半部分,即可以獲取mRNA和蛋白序列的部分:找到“ NCBI Reference Sequences (RefSeq)”,它分為幾個板塊,第一個“mRNA andProtein”區(qū)可以讓我們找到連續(xù)的編碼mRNA序列和蛋白序列。在mRNAand Prot
10、ein8一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳下面有兩個序列代碼 (中間劃有一個箭頭) ,這代表了 mRNA序列和蛋白序列。 分別點擊就可以得到相應(yīng)的序列頁面。點擊后如圖所示, mRNA 序列:蛋白序列如下:NCBI Reference Sequences (RefSeq)的第二個板塊是Reference assembly ,它下面顯示的是 Genomic ,點擊Genomic 下面 Referenceassembly 對應(yīng)的 Genbank 或 FASTA即可出現(xiàn)編碼的DNA序列 (注意:只是編碼序列,其中包括內(nèi)含子,但一般沒有5非編碼區(qū)) 。這一步就不做貼圖演示了吧,呵呵。這
11、樣我們就可以找到基因的 cDNA 序列、連續(xù)的編碼 mRNA序列、蛋白序列以及含有內(nèi)含子的編碼 DNA序列了。相信這些操作對很多戰(zhàn)友還是有用的。如果大家有更好的方法,歡迎發(fā)帖交流!友情提示:在 NCBI 里打開的每一個頁面都會給我們提供大量的信息,大家不妨好好看看,可能會有令我們驚喜的收獲!最后嘮叨一句: 最近我實驗比較忙, 只能在深夜發(fā)帖, 可能要過幾天再發(fā)第三部分 Part three 運用 STS查找已經(jīng)公布的引物序列 ,希望“期待下集”的朋友可以理解。9一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳第三部分 運用 STS查找已經(jīng)公布的引物序列STS,序列標(biāo)簽位點( Sequenc
12、e Tagged Site ) :一段短的DNA序列( 200500 個堿基對),這種序列在染色體上只出現(xiàn)一次,其位置和堿基順序都是已知的。在PCR反應(yīng)中可以檢測處 STS來, STS適宜于作為人類基因組的一種地標(biāo),據(jù)此可以判定DNA的方向和特定序列的相對位置。以上內(nèi)容基本是 STS的定義,我主張活學(xué)活用, 下面就介紹一下我個人用 STS數(shù)據(jù)庫查找引物的一點經(jīng)驗。還是使用人的IL6 基因為例,呵呵1 打開 NCBI 主頁,在Search 后面的下拉菜單選擇UniSTS,在FOR后面填寫目的基因。操作完畢如圖所示:點擊 GO以后出現(xiàn)以下頁面,這是你會發(fā)現(xiàn)NCBI 又提供了很多序列,下面我們還是要
13、初步篩選我們需要的序列。10一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳2根據(jù)物種、目的陰物所在染色體的位置等選擇相應(yīng)序列(可能不只一個),點擊。下面以點擊第一個進(jìn)入的畫面為例。你會發(fā)現(xiàn)這個頁面直接就給出了引物序列, PCR 之后的片段長度也是給了的( 247bp) 。下面還有很多相關(guān)的信息3點擊 GeneBank Accession 后面的代碼,進(jìn)入下一個頁面。11一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳?。∏昂笠锒汲尸F(xiàn)在眼前了,還有反應(yīng)體系和反應(yīng)條件!其中Primer A是前引物序列, Primer B則是后引物序列,并且給出了他們在DNA序列中的位置。有興趣的朋友可
14、以在序列中找一下,是可以找到的, 不過要注意, PCR 是雙鏈擴(kuò)增,在序列中可以直接找到的是 Primer A 的原序列 和 Primer B 的互補序列。在步驟二里面我只點開了一個序列,繼續(xù)打開其他的可能還會有對自己有用的引物,不過這要你自己慢慢發(fā)掘了。這種尋找引物的方法有點投機取巧的味道, 實用程度不是很高, 但如果這里面恰好有你想 P 的片段的話,恭喜你,這些引物都是很成熟的引物,可以直接拿過來使用了。如果想尋找引物, 大家可以查閱相關(guān)論文, 已經(jīng)報道的引物我們?yōu)槭裁床挥媚???既省時間,可靠性又強。如果這兩種方法都不能找到你需要的引物的話,那就自己設(shè)計吧, 建議使用Primer 5 和
15、Oligo 。引物設(shè)計的詳細(xì)內(nèi)容我在這里就不多說了,推薦兩個帖子給大家看一下,第一個是本版版主 liuzeyi2002發(fā)起的,內(nèi)容很豐富,很值得學(xué)習(xí),另一個則是我發(fā)的。/bbs/post/view?bid=64&id=9517792&sty=1&tpg=1&age=0/bbs/post/view?bid=67&id=9523263&sty=1&tpg=1&age=012一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳第四部分 如何運用 BLAST進(jìn)行序列比對、檢驗引物特異性提到序列比對,絕大多數(shù)戰(zhàn)友都會想到 BLAST,但 B
16、LAST的使用確實又是一個很大的難題,因為他的功能比較強悍, 里面涉及到的知識比較多, 而且比對結(jié)束后輸出的結(jié)果參數(shù) (指標(biāo))又很多。如果把 BLAST的使用詳細(xì)的都講出來,我想我發(fā)帖發(fā)到明天也發(fā)不完,更何況我自己也不是完全懂得BLAST的使用。所以我在這里也就“畫龍點睛”以比對核酸序列為例來給大家介紹一下BLAST的使用,也算是 BLAST的入門課程吧。 請看帖的戰(zhàn)友好好體會,如果你用心看,在看帖完畢之后 BLAST 的基本使用(包括其他序列的比對)應(yīng)該沒有問題了。1打開 BLAST頁面, /BLAST/打開后如圖所示:對上面這個頁面進(jìn)行一
17、下必要的介紹:BLAST的這個頁面主體部分(左面)包括了三部分: BLAST Assembled Genomes、Basic BLAST、Specialized BLAST。相信大家可以看懂這三個短語的意思,我就不多說了;我要說的是,可以認(rèn)為這是三種序列比對的方法,或者說是BLAST的三條途徑。第一部分 BLAST Assembled Genomes就是讓你選擇你要比對的物種,點擊相應(yīng)物種之后13一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳即可進(jìn)入比對頁面。第二部分 Basic BLAST 包含了 5 個常用的 BLAST,每一個都附有簡短的介紹。第三部分 Specialized BL
18、AST 是一些特殊目的的 BLAST,如 IgBLAST、SNP 等等,這個時候你就需要在 Specialized BLAST 部分做出適當(dāng)?shù)倪x擇了??傊?,這是一個導(dǎo)航頁面, 它的目的是讓你根據(jù)自己的比對目的選擇相應(yīng)的BLAST途徑。下面以最基本的核酸序列比對來談一下BLAST的使用,期間我也會含沙射影的說一下其他序列比對的方法。2 點擊 Basic BLAST 部分的 nucleotide blast鏈接到一個新的頁面。打開后如圖所示:介紹一下上述頁面:Enter Query Sequence部分是讓我們輸入序列的,你可以直接把序列粘貼進(jìn)去,也可以上傳序列, 還可以選擇你要比對的序列的范圍(
19、留空就代表要比對你要輸入的整個序列)。Job Title部分還可以為本次工作命一個名字。Choose Search Set 部分是讓我們選擇要與目的序列比對的物種或序列種類( genome DNA、mRNA 等等)。如果是人或老鼠的話,就可以直接選擇了如果是其他物種就要選擇“others ”了, 這時候網(wǎng)頁會主動跳出一個下拉對話框和一個輸入式對話框,你可以分別選14一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳擇和輸入要跟你的序列比對的序列種類和物種。下面的Entrez Query可以對比對結(jié)果進(jìn)行適當(dāng)?shù)南拗?。Program Selection部分其實是讓我們選擇本次比對的精確度,種內(nèi)種間等等。在 BLAST按鈕下面有一個“ Algorithm parameters ” ,這是參數(shù)設(shè)置選項,一般用戶使用不到此項,所以它比較隱蔽,點擊,原網(wǎng)頁下方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 希沃培訓(xùn)課件答案
- 電氣考研數(shù)學(xué)試卷
- 2025年04月北京首都醫(yī)科大學(xué)附屬北京同仁醫(yī)院派遣制司機招聘1人(四)筆試歷年專業(yè)考點(難、易錯點)附帶答案詳解
- 試驗安全培訓(xùn)課件模板
- 牡丹江市辦公室選調(diào)工作人員考試真題2024
- 高血糖引起的急性并發(fā)癥與護(hù)理
- 高三衡水?dāng)?shù)學(xué)試卷
- 高新高考數(shù)學(xué)試卷
- 廣東調(diào)研數(shù)學(xué)試卷
- 固始縣考編數(shù)學(xué)試卷
- 改變觀念提高效率課件
- 立責(zé)于心履責(zé)于行全面落實企業(yè)安全生產(chǎn)主體責(zé)任課件
- 建筑工程模板施工工藝技術(shù)要點講義豐富課件
- 醫(yī)療垃圾廢物處理課件
- 位置度公差以及其計算
- 氯化銨危險化學(xué)品安全周知卡
- 《煤的發(fā)熱量測定方法》ppt課件
- 三寶、四口、五臨邊安全培訓(xùn)PPT課件
- 護(hù)理崗位管理與績效考核-PPT課件
- 李墨林按摩療法(李墨林)237頁
- 幕墻施工安全技術(shù)交底
評論
0/150
提交評論