版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、ANTHEPROT 5.0 簡(jiǎn)單使用說明生物技術(shù) 2002 房磊 021402144生物的化學(xué), 就是蛋白質(zhì)與核酸的化學(xué)。 對(duì)蛋白質(zhì)的研究是生物化學(xué)領(lǐng)域一 個(gè)非常重要的部分。 但是眾多蛋白質(zhì)的復(fù)雜序列數(shù)據(jù), 其分析工作是一個(gè)非常困 難的工作。用人工的方法是很難完成如此大量的分析工作的。 運(yùn)用計(jì)算機(jī), 利用 一定的運(yùn)算規(guī)則, 對(duì)眾多的蛋白質(zhì)序列數(shù)據(jù), 進(jìn)行蛋白序列分析就是最好的解決 方法。蛋白序列分析軟件包 ANTHEPROT 5.0 正是這樣的一個(gè)程序包。蛋白序列分析軟件包 ANTHEPROT 5.0 是法國的蛋白質(zhì)生物與化學(xué)研究院 ( Institute of Biology and Che
2、mistry of Proteins)開發(fā)的蛋白質(zhì)研究軟件包。軟件 包包括了蛋白質(zhì)研究領(lǐng)域所包括的大多數(shù)內(nèi)容,功能非常強(qiáng)大。應(yīng)用此軟件包, 使用個(gè)人電腦, 便能進(jìn)行各種蛋白序列分析與特性預(yù)測(cè)。 包括:進(jìn)行蛋白序列二 級(jí)結(jié)構(gòu)預(yù)測(cè);在蛋白序列中查找符合 PROSITES 數(shù)據(jù)庫的特征序列;繪制出蛋 白序列的所有理化特性曲線;在 Internet 或本地蛋白序列數(shù)據(jù)庫中查找類似序 列;計(jì)算蛋白序列分子量, 比重與各蛋白殘基百分組成; 計(jì)算蛋白序列滴定曲線 與等電點(diǎn);選定一個(gè)片段后,繪制 Helical Wheel 圖;進(jìn)行點(diǎn)陣圖( Dot Plot ) 分析;計(jì)算信號(hào)肽潛在的斷裂位點(diǎn)等功能。更重要的
3、是此軟件包為免費(fèi)軟件。軟件分為三個(gè)版本, 分別用于 Unix 系統(tǒng),DOS系統(tǒng)與 WINDOWS95 或 98 系統(tǒng),以用于 WINDOWS 系統(tǒng)的版本為例,介紹一下這個(gè)軟件的基本用法。軟件包為一個(gè)自解壓執(zhí)行文件, 文件名 Anthe_5_0.exe,大小為 2,013,184 字節(jié)。執(zhí)行此文件,輸入解壓后存放的目錄名,便可將所有文件解壓在此目錄下。其文件如下圖是極其簡(jiǎn)單的相關(guān)介紹,基本無任何用,可以解處。但是在軟件目錄中的自解壓壓縮文件 doc_ant.exe 文件壓在另一個(gè)目錄,是 HTML 格式的介紹文件,對(duì)軟件進(jìn)行了一些較詳細(xì)說明介 紹。如圖運(yùn)行 Documentation_anthe
4、prot.html即可。主程序名為 Anthewin ,雙擊便打開了ANTHEPROT 5.0主窗口。也可以在桌面上建立它的快捷方式, 雙擊快捷方式運(yùn)行 ANTHEPROT 5.0 主程序。通過主程序,我們可以載入蛋白序列,對(duì)序列進(jìn)行編輯、打印、拷貝、改 變?cè)O(shè)定等操作,可以在此調(diào)用各種所需的分析工具,對(duì)蛋白序列進(jìn)行分析。 一 序列編輯功能ANTHEPROT 5.0 的主窗口便是其序列編輯窗口,如圖 :可以使用按鍵或菜單中的 File/Open(或快捷鍵 Ctrl+0) 命令打開各 種序列文件(其他按鈕在后面說明) ,程序識(shí)別的文件類型包括:?jiǎn)涡蛄形募袷剑?*.SEQ,(ANTHEPROT 3
5、.3 支持以下格式的單序列文件: DNA/Strider 格式、 EMBL 格式、 NBRF 格式、 Pearson/Fasta格式、 PIR 格式與 IG/Stanford 格式 );含有多個(gè)蛋白序列的蛋白數(shù)據(jù)庫文件: *.BAS ,(以 Pearson/Fasta格式添加序 列,上限為 30 條序列或 32K 文件大小 );ClustalV 或 ClustalW 文件: *.ALN 含有 ClustalW格式的多隊(duì)列; 含有多隊(duì)列的 Multalin 4.1 格式文件: *.MUL ;在 Prosite 蛋白數(shù)據(jù)庫中查尋出 Site 結(jié)果的文件: *.SIT , 蛋白質(zhì)原子空間結(jié)構(gòu)的 PD
6、B格式文件: *.PDB ; 使用 IBCP(http:/wwww.ibcp.fr/predict.html )服務(wù)器預(yù)測(cè)蛋白二級(jí)結(jié)構(gòu)所獲 得的結(jié)果文件格式: *.CNS ;序列可以從 ANTHEPROT 編輯窗口以鍵盤輸入,或者以 *.SEQ 等文件格式 載入,也可以從其它文件復(fù)制粘貼到編輯窗口。最簡(jiǎn)單的序列格式為 Pearson/Fasta格式,為文本格式文件,帶有 開始的為序列蛋白的名稱,其后便 是蛋白序列。下面為一個(gè)此格式的例子:MBNVLSEGEWQLVLHVWAKVEADV AGHGQDILIRLFKSHPETLEKFDRFKHLKTEAEMKASEDL KKHGVTVLTALGA
7、ILKKKGHHEAELKPLAQSHA TKHKIPIKYLEFISEAIIHVLHSRHPGD FGADAQGAMNKALELFRKDIAAKYKELGYQG程序支持的一些編輯功能如下: 取消,恢復(fù)( Undo):Ctrl+Z 。 查找 Ctrl+T 。支持復(fù)制與粘貼。 可以自定義字符顏色,背景色與打印字體。可打印序列文件。輸入或載入序列后,便同時(shí)打開了一個(gè)圖像窗口,以彩圖的形式顯示出蛋白序列。不同的蛋白殘基以不同的顏色表示。 下面便是打開一個(gè)序列后的主程序窗口的例子:二工具欄與基本功能 當(dāng)序列格式識(shí)別后, Methods菜單便被激活, 相應(yīng)的快捷按鍵也出現(xiàn)在工具 欄中。如果序列格式未能識(shí)
8、別則不會(huì)出現(xiàn)下圖中新的工具按鈕。這些按鍵依次為:打開文件按鍵;存儲(chǔ)文件按鍵 ; 打印按鍵 ; 更改字體與格式按鍵更改設(shè)定顏色按鍵進(jìn)行蛋白序列二級(jí)結(jié)構(gòu)預(yù)測(cè)在蛋白序列中查找符合 PROSITES 數(shù)據(jù)庫的特征序列繪制出蛋白序列的所有理化特性曲線在 Internet 或本地蛋白序列數(shù)據(jù)庫中查找類似序列計(jì)算蛋白序列分子量,比重與各蛋白殘基百分組成計(jì)算蛋白序列滴定曲線與等電點(diǎn) ;選定一個(gè)片段后,繪制 Helical Wheel 圖進(jìn)行點(diǎn)陣圖( Dot Plot )分析;計(jì)算信號(hào)肽潛在的斷裂位點(diǎn)打開一個(gè)簡(jiǎn)單的幫助文件退出程序 三基本分析工具介紹 除了通過單擊快捷按鍵的方式進(jìn)行各種蛋白序列分析,通過菜單進(jìn)行
9、各種 操作也非常方便。下面讓我將一些主要分析工具的功能介紹一下:1. 點(diǎn)陣圖( Dot Plot )Dot Plot 分析方法對(duì)以下分析工作非常有用: 在一條序列內(nèi)查找重復(fù)序列; 在 2 條序列中不同位置查找類似片段;Dot在不同序列中查找同源性。Plot 或單擊按鍵只有當(dāng)程序載入一條序列時(shí), 才可以激活 Dot Plot 程序,選擇菜單命令 運(yùn)行 Dot Plot 程序,可再選擇要進(jìn)行比較的第二條序列然后,再確定參數(shù)與限制條件,包括: 窗口尺寸:移動(dòng)片段的長(zhǎng)度 矩陣:選擇替代矩陣 下圖為含有兩個(gè)蛋白酶序列的點(diǎn)陣圖,兩個(gè)酶具有同源性,因?yàn)橛牲c(diǎn)陣圖 可以看到,基本上有非常好的斜線。但由于此斜線的
10、位置開始于位置115,很容易知道,水平軸的蛋白序列含有前體(由 1到第 114 個(gè)殘基組成),也清楚地看 到,它們具有一個(gè)小的內(nèi)部重復(fù)片段(圖上非常短的紅線) 。2. 類似性查找( Similarity Search ) 此程序用來在一個(gè)蛋白數(shù)據(jù)庫(可以是本地?cái)?shù)據(jù)庫,也可是網(wǎng)上的數(shù)據(jù)庫) 中,找出所有與給定序列具有同源性的序列選 擇菜 單 命令 Methods/Similarity Search/WWW or Local Fasta,或者 Methods/Similarity Search/WWW-Blast at PBIL NPS server 便實(shí)現(xiàn)在蛋白數(shù)據(jù) 庫中對(duì)類似性蛋白序列的查找。
11、 需注意, 如果在本地蛋白數(shù)據(jù)庫中查找, 需要先 下載 SwissProt蛋白質(zhì)數(shù)據(jù)庫。 Prosite蛋白數(shù)據(jù)庫 1.4 兆 與 Swiss-Prot 蛋白數(shù) 據(jù)庫 41版, 85.7 兆左右,壓縮格式下載后,將其放置在 ANTHEPROT 5.0 同 一個(gè)目錄,便可在本地使用程序的檢索功能按鍵或選取菜單命令 Methods / Site3. 查找 Site/signature 在 ANTHEPROT 主窗口單擊 detection (Prosite),便進(jìn)行位點(diǎn)與特征序列的查找。程序查找給定序列是否存在 PROSITE 數(shù)據(jù)庫中已定義的特征序列,缺省設(shè)置為100%匹配,也可設(shè)定為Misma
12、tch 1 or (2 一到兩個(gè)不匹配)或者 Similarity leve(l 類似水平)。當(dāng)前 PROSITE 數(shù)據(jù)庫是 95 年 2 月發(fā)布的,共 1054 個(gè)不同位點(diǎn)與特征序列,含有兩個(gè)文件, PROSITE.DAT 與 PROSITE.DOC。此兩個(gè)文件必需均放在 ANTHEPROT 程序的 目錄下,程序才能進(jìn)行下圖為查找結(jié)束后程序輸出的結(jié)果:綠色的文字可連接到 PROSITE 文件中相應(yīng)的位置。需要知道的是,蛋白序列中找到的特征序列并不一定具有生物學(xué)意義,只 能說,查找的結(jié)果對(duì)尋找潛在的有意義片段具有很大幫助。4. 在序列數(shù)據(jù)庫中查找一個(gè)自定義的特征序列: Pattern sear
13、ch 選擇菜單命令 Databases/Patterns earch,便開始在網(wǎng)上的蛋白數(shù)據(jù)庫或本地 蛋白數(shù)據(jù)庫中查找含有自定義特征序列的蛋白。所定義的特征序列必需符合 PROSITE 規(guī)定的語法。語法規(guī)則如下:- 位置分隔符;- 允許此位置為括號(hào)內(nèi)的任何一個(gè)殘基;- 允許此位置為除了括號(hào)內(nèi)所包括的任何一個(gè)殘基;- x 代表任何殘基;- x(3) 代表任何 3 個(gè)氨基酸殘基,根據(jù)以上語法,如果要查找的特征序列為 N-PT-GM-x(2)-ILVM ,則序 列 N-P-K-G-H-V , N-T-L-K-G-M 將能夠找到,而序列 N-L-K-G-H-V , N-T-G-K-H-V 將不能找到。
14、查找結(jié)束后,所有找到的序列將以 Pearson 格式,以 SEQ_x.BAS 為文件名存儲(chǔ)在硬盤中。5. 預(yù)測(cè)物理化學(xué)特性曲線Antheprot 可以以圖示的方法,顯示出預(yù)測(cè)的蛋白質(zhì)的物理化學(xué)特性曲線, 下圖為一個(gè)親水性特性曲線的例子。 在圖中, 一個(gè)可移動(dòng)的光標(biāo), 顯示了目前在 序列中的位置為 115,此位置的氨基酸殘基( L )顯示為紅色,同時(shí)顯示前 5 個(gè) 與后五個(gè)殘基(為 AIIHVLHSRHP ),特性值( -7)與參數(shù)( 5)也顯示在圖中。光標(biāo)可以如下方式移動(dòng): 鼠標(biāo)左鍵在選定位置單擊; 方向鍵左或右為每次移動(dòng)一個(gè)位置; Shift+ 方向鍵左或右為每次移動(dòng)十個(gè)位置; 方向鍵上或下
15、為放大縮小??娠@示的物理化學(xué)特性曲線包括: 親水曲線( Hydrophobicity profile ) 疏水曲線( Hydrophilicity profile ) 易溶性曲線( Solvent accessibility profile) 抗原性曲線( Antigenicity profile ) 跨膜區(qū)域曲線( transmembranous regions profile) 結(jié)合抗原性曲線( Combined antigenicity profile )6. 二級(jí)結(jié)構(gòu)預(yù)測(cè) Antheprot 提供了幾種方法進(jìn)行蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè),包括:GOR I 方法:在菜單中選擇 Method/Se
16、condary structure prediction/Garnier et alGibrat 方法:在菜單中選擇 Method/Secondary structure prediction/Gibrat et alDouble Prediction Method DPM 方法:在菜單中選擇 Method/Secondary按鍵或在菜單中選擇structure prediction/DPMHomologue 方 法 : 在 菜 單 中 選 擇 Method/Secondary structure prediction/LevinPredator 方法:在菜單中選擇 Method/Second
17、ary structure prediction/ Predator 或全部使用以上幾種方法:?jiǎn)螕鬗ethod/Secondary structure prediction/All,其快捷鍵為 Ctrl+L 。 五種方法的輸出形式分別舉例如下:GOR I方法Homologue 方法Gibrat 方法Double Prediction Method DPM 方法Predator方法全部使用以上幾種方法的輸出形式為上圖中加入了自定義的由 X 射線衍射法確定的二級(jí)結(jié)構(gòu)圖,可以顯示在一個(gè)窗口,與其它預(yù)測(cè)的二級(jí)結(jié)構(gòu)相比較。自定義的二級(jí)結(jié)構(gòu)由以 *.XRA 為擴(kuò)展 名的文件輸入。其格式為 Pearson/
18、Fasta文件格式,下面是一個(gè) *.xra 文件的例子,MyoglobinCCCHHHHHHHHHHHHHHTTSHHHHHHHHHHHHHHHCHHHHHTCHHHHTCCSHH HHHHCHHHHHHHHHHHHHHHHHHTTTTCCHHHHHHHHHHHHHTTCCCHHHHHHHHHHHHHHHHHH CTTTTSHHHHHHHHHHHHHHHHHHHHHHHHHTCCCH 代表螺旋,圖中表示為藍(lán)色;E 代表折疊,圖中表示為橙色;T 代表轉(zhuǎn)角,圖中表示為綠色;C 代表其它松散結(jié)構(gòu),圖中表示為黑色7. 計(jì)算蛋白序列分子量,比容與各蛋白殘基百分組成的計(jì)算。單擊程序可以非常方便地對(duì)蛋白序列
19、進(jìn)行分子量,比容與各蛋白殘基百分組成Methods/AA Composition, specific volume, M.Weight 便進(jìn)行計(jì)算??旖萱I為 Ctrl+M 輸出形式如下:8. 計(jì)算蛋白序列滴定曲線與等電點(diǎn)ANTHEPRO5.0 還可根據(jù)一定算法, 對(duì)輸入的蛋白序列計(jì)算其滴定曲線與等圖a電點(diǎn)Ctrl+U 。單擊 按鍵或選取 Methods/Titration curve 便可進(jìn)行計(jì)算,快捷鍵為 輸出圖形如上圖 a。9. 選定一個(gè)片段后,繪制 Helical Wheel 圖Helical Wheel 圖。單擊ANTHEPRO4.3 還可先選定一個(gè)蛋白片段,繪制其 按鍵或選取 Methods/ Helical Wheel 便可進(jìn)行計(jì)算與繪制。在二級(jí)結(jié)構(gòu)預(yù)測(cè)輸出 窗口,用鼠標(biāo)左鍵定義起始點(diǎn),用鼠標(biāo)右鍵定義結(jié)束點(diǎn),選擇菜單命令 Helical Wheel,也可很方便的繪制此定義片段的 Helical Wheel 圖輸出圖形的例子如下: 在此窗口,單擊鼠標(biāo)左鍵放大圖形,單擊鼠標(biāo)右鍵縮小
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 安全生產(chǎn)責(zé)任清單
- 二零二五版2025年度駕校綜合設(shè)施改造施工合同范本3篇
- 室外消火栓系統(tǒng)概述與室外消防用水量
- 2024年淮北職業(yè)技術(shù)學(xué)院高職單招語文歷年參考題庫含答案解析
- 《陶罐和鐵罐》課件圖文
- 二零二五年度藝術(shù)壁畫粉刷班組服務(wù)協(xié)議6篇
- 21三體綜合征產(chǎn)前診斷
- 《科幻小說賞析與寫作》 課件 第1、2章 導(dǎo)論科幻小說賞析與寫作的“關(guān)鍵詞”;“時(shí)間旅行”的歷史與未來-《時(shí)間機(jī)器》
- 2024年瀘州醫(yī)療器械職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試歷年參考題庫含答案解析
- 2024年泉州工程職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(頻考版)含答案解析
- 2024五凌電力限公司招聘5人高頻考題難、易錯(cuò)點(diǎn)模擬試題(共500題)附帶答案詳解
- 循環(huán)系統(tǒng)練習(xí)試題(含答案)
- 2024年安徽醫(yī)學(xué)高等??茖W(xué)校高職單招(英語/數(shù)學(xué)/語文)筆試題庫含答案解析
- 昭通土豆市場(chǎng)調(diào)研報(bào)告
- 公司招標(biāo)管理辦法(國有企業(yè)適用) 94m
- 酒吧、夜店、KTV員工管理手冊(cè)(2022版)
- 國際法院規(guī)則全文
- 2023年初一美術(shù)工作總結(jié)
- 【GJB9001C內(nèi)審檢查表】2019年GJB9001C-2017質(zhì)量管理體系內(nèi)部審核檢查表(含完整檢查內(nèi)容)
- 醫(yī)院職能科室綜合質(zhì)量考核表
- 電信業(yè)務(wù)申請(qǐng)表
評(píng)論
0/150
提交評(píng)論