




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第二篇技術(shù)篇第十二章生物信息學(xué)在分子診斷中的應(yīng)用第一節(jié)生物信息學(xué)概論一、生物信息學(xué)的定義生物信息學(xué)是結(jié)合了生物學(xué)和信息技術(shù),利用計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù),分析海量的并且還在快速積累的生物數(shù)據(jù),從中獲取生物科學(xué)新知識(shí)的一門新的交叉科學(xué)。人類基因組計(jì)劃的意義人類基因研究的意義在于它可以支持和推動(dòng)生命科學(xué)中一系列重要的基礎(chǔ)性研究。如基因組遺傳語言的破譯,基因的結(jié)構(gòu)與功能關(guān)系,生命的起源和進(jìn)化,細(xì)胞發(fā)育、生產(chǎn)、分化的分子機(jī)理,疾病發(fā)生的機(jī)理等。為推動(dòng)醫(yī)學(xué)長足進(jìn)步帶來前所未有的機(jī)遇,基因診斷、基因療法和基因藥物的開發(fā),有可能成為未來醫(yī)學(xué)發(fā)展的重要分支。人類基因組計(jì)劃的進(jìn)一步成功將促進(jìn)生命科學(xué)與信息科學(xué)、材料科
2、學(xué)的融合,從而帶動(dòng)一批高技術(shù)產(chǎn)業(yè)的發(fā)展二、生物信息學(xué)研究的范疇第一、各種生物數(shù)據(jù)庫的建立和管理;第二、研究高效率的統(tǒng)計(jì)工具,分析算法,發(fā)展方便、快捷的分析程序;第三、從海量的原始生物數(shù)據(jù)中發(fā)掘新知識(shí)。第二節(jié)計(jì)算機(jī)和互聯(lián)網(wǎng)一、計(jì)算機(jī)常識(shí):硬件和軟件計(jì)算機(jī)的主要硬件由中央處理器(CPU)、存儲(chǔ)器、輸入設(shè)備和輸出設(shè)備組成。常用的操作系統(tǒng):windows、UNIX、Linux二、互聯(lián)網(wǎng)和常用搜索引擎WWW是WorldWideWeb的縮寫,即通常我們所說的國際互聯(lián)網(wǎng),它的每個(gè)節(jié)點(diǎn)在邏輯上都與任何其他節(jié)點(diǎn)保持聯(lián)系,可以相互交換信息。三、文件的壓縮和解壓傳輸或保存較大的數(shù)據(jù)時(shí),常對(duì)文件進(jìn)行壓縮,以減少數(shù)據(jù)量
3、。特別是對(duì)于圖形文件,壓縮尤其重要。在UNIX或Linux系統(tǒng)中,壓縮命令是compressmyfile,壓縮后的文件自動(dòng)加上后綴.Z。解壓縮命令是uncompressmyfile.Z。PC機(jī)上的Windows操作系統(tǒng)沒有標(biāo)準(zhǔn)的壓縮和解壓軟件,但網(wǎng)上有許多針對(duì)Windows的免費(fèi)或代免費(fèi)試用期的壓縮軟件,如FreeZip、WinZip等四、文件和數(shù)據(jù)的傳送用戶需要遞交一條或多條核酸或蛋白質(zhì)序列去做數(shù)據(jù)庫查詢或比對(duì)。這時(shí)常用的方法有:使用視窗系統(tǒng)的剪切、復(fù)制和粘貼的功能.對(duì)于不太長的序列,這種方法比較方便;網(wǎng)頁的輸入窗口旁常有一個(gè)“瀏覽目錄”按鈕,點(diǎn)擊該按鈕,會(huì)彈出一個(gè)對(duì)話框,找到需要上傳的序列
4、文件,再按“提交”鈕完成遞交。用這種方法可以一次遞交較長的序列;有些大型信息中心和研究單位還有遠(yuǎn)程文件傳送服務(wù),即遵從文件傳輸協(xié)議(filetransferprotocol,ftp)的服務(wù)器地址,用戶可以無記名的方式訪問公用的目錄,讀取文件,下載軟件或數(shù)據(jù)。五、編程和語言在眾多的計(jì)算機(jī)語言中,C語言無疑是最常用的,它具有代碼精煉,執(zhí)行效率高的特點(diǎn),網(wǎng)上還有大量的現(xiàn)成模塊供免費(fèi)使用。對(duì)于非計(jì)算機(jī)專業(yè)人員,還可以選擇VisualBASIC(VB)1/5語言。VB語言具備了高級(jí)語言的特點(diǎn),語句結(jié)構(gòu)類似自然語言,對(duì)于生物背景的專業(yè)人員可能較容易掌握。如果在研究中大量使用網(wǎng)絡(luò)資源,則需要掌握一定的網(wǎng)絡(luò)編
5、程語言,例如:Perl語言、PHP語言和JAVA語言等。第三節(jié)數(shù)據(jù)的獲得DNA、RNA、蛋白質(zhì)的測序蛋白質(zhì)結(jié)構(gòu)的分析基因和蛋白質(zhì)的表達(dá)數(shù)據(jù)蛋白質(zhì)相互作用一、DNA、RNA和蛋白質(zhì)的測序基因組DNA直接來源于細(xì)胞核基因組,它的組成包括基因和基因間區(qū)域,基因序列中還包括內(nèi)含子和外顯子。cDNA是由mRNA逆轉(zhuǎn)錄而來,全長cDNA應(yīng)該包括5端非編碼區(qū),3端的多聚腺苷酸序列和編碼序列。重組DNA序列是基因重組到質(zhì)粒、病毒和cosmid等載體后經(jīng)測序得到的DNA序列。RNA的序列可以從基因組序列或cDNA序列推導(dǎo)出來;直接的RNA測序涉及修飾核苷酸的識(shí)別,可通過質(zhì)譜分析獲得。蛋白質(zhì)的序列可以通過DNA序
6、列推導(dǎo)而來,但從DNA序列推導(dǎo)的蛋白質(zhì)序列不能反應(yīng)真實(shí)的蛋白質(zhì)序列情況,蛋白質(zhì)測序主要依靠質(zhì)譜分析(massspectrometry,MS)技術(shù),基本原理是通過準(zhǔn)確測定真空中的離子質(zhì)量或電荷量來測算出分子組成。二、蛋白結(jié)構(gòu)的分析X射線晶體學(xué)技術(shù):通過研究X射線對(duì)蛋白質(zhì)晶體的掃描后產(chǎn)生的衍射模式來測定蛋白質(zhì)的結(jié)構(gòu);核磁共振譜法(NMR)spectroscopy):該方法常用于較?。?lt;25kDa)的,可溶性蛋白質(zhì)結(jié)構(gòu)的測定;有些蛋白質(zhì)很難結(jié)晶,不能用X射線晶體學(xué)技術(shù)測定,又太大而不能用核磁共振譜技術(shù)測定,其它技術(shù)方法:X射線纖維衍射技術(shù);電子顯微鏡(electronmicroscopy);環(huán)
7、形雙色色譜技術(shù)(circulardichroism(CD)spectroscopy)三、基因和蛋白質(zhì)表達(dá)數(shù)據(jù)表達(dá)文庫的測序基因表達(dá)連續(xù)分析技術(shù)(serialanalysisofgeneexpression,SAGE)DNA芯片雙向電泳分析技術(shù)(2Dgelelectrophoresis)四、蛋白質(zhì)相互作用1、遺傳學(xué)方法:2、親和性方法:親和色譜法(Affinitychromatography)免疫共沉淀法(coimmunoprecipitation)免疫共沉淀基本原理:細(xì)胞裂解液中加入抗體,與抗原形成特異免疫復(fù)合物,經(jīng)過洗脫,收集免疫復(fù)合物,然后進(jìn)行SDS-PAGE及Westernblottin
8、g分析。3、分子和原子法:X射線晶體法和核磁共振法4、基于文庫法:酵母雙雜交系統(tǒng)(yeasttwo-hybrid(Y2H)system)2/5第四節(jié)生物信息數(shù)據(jù)庫一、重要生物信息中心美國國家信息中心(NationalCenterofBiotechnologyInformation,NCBI)的GenBank(/web/GenBank/index.html);歐洲分子生物學(xué)室驗(yàn)室(EuropeanMolecularBiologyLaboratory-EuropeanBioinformaticsInstitute,EMBL-EBI)的EMBL(h
9、ttp:/www.ebi.ac.uk/databases/index.html);日本DNA數(shù)據(jù)庫(DNADataBankofJapan,DDBJ)(http:/www.ddbj.nig.ac.jp/)最重要的蛋白質(zhì)氨基酸序列數(shù)據(jù)庫是瑞士的SWISS-PROT(/sprot/);蛋白質(zhì)數(shù)據(jù)庫PIR(ProteinInformationResource),包含所有序列已知的自然界中野生型蛋白質(zhì)的信息();PDB蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫:收集由X射線衍射和核磁共振技術(shù)測定的蛋白質(zhì)大分子三維結(jié)構(gòu)(http:/www.rcs
10、/pdb)二、數(shù)據(jù)庫檢索工具Entrez檢索工具:Entrez是美國國家生物技術(shù)信息中心(NCBI)提供的集成檢索工具/Entrez/SRS(SequenceRetrievalSystem)檢索工具:是歐洲分子生物學(xué)網(wǎng)EMBnet的主要數(shù)據(jù)庫檢索工具,可以從EMBnet的主頁進(jìn)入。DBGET/LinkDB檢索工具:是日本京都工具大學(xué)建立的GenomeNet數(shù)據(jù)庫,該數(shù)據(jù)庫主要針對(duì)代謝途徑。http:/www.genome.ad.jp/dbget/dbget_manual.html。二、數(shù)據(jù)庫檢索工具第五節(jié)核酸序列分析一、核酸序列的基
11、本分析核酸序列的分子量、堿基組成、堿基分布等基本分析:BioEdit(/BioEdit/bioedit.html)DNAMAN(限制性酶切分析:限制性酶數(shù)據(jù)庫(RestrictionEnzyme(;測序峰圖的查看、核實(shí)與修改:Chromas,BioEdit,DNAMAN測序結(jié)果需要識(shí)別與去除測序時(shí)使用的載體序列:VecScreen(/VecScreen.html)DataBase,REBASE)EST序列進(jìn)行電子延伸:將待分析的核酸序列(稱為種子序列)采用Blast軟件搜索GenBank的EST數(shù)
12、據(jù)庫,獲得與種子序列有較高同源性的EST序列,一般要求在重疊40個(gè)堿基范圍內(nèi)有95以上的同源性,稱匹配序列;將匹配序列與種子序列裝配成新序列,即片段重疊群分析(contiganalysis);再以新產(chǎn)生的序列為種子序列,重復(fù)上述過程,直至沒有新的匹配序列為止。對(duì)核酸序列進(jìn)行電子基因定位:利用序列標(biāo)簽位點(diǎn)(SequenceTaggedSite,STS);利用UniGene數(shù)據(jù)庫進(jìn)行基因電子定位;直接利用基因組序列進(jìn)行基因電子定位。二、核酸序列的比對(duì)分析和功能預(yù)測BLAST(BasicLocalAlignmentSearchTool)是基本局域聯(lián)配搜索工具;Blast功能有:FASTA:根據(jù)用戶提
13、交的單個(gè)序列進(jìn)行數(shù)據(jù)庫搜索比對(duì)的程序。3/5網(wǎng)上服務(wù)器和電子郵件服務(wù):http:/www.ebi.ac.uk/mailto:fastaebi.ac.ukhttp:/www.fasta.genome.ad.jpmailto:fastanig.ac.jp進(jìn)行多序列聯(lián)配:ClustalW:http:/www.ebi.ac.uk/clustalw/index.html/soft/molbio/align/clustal/ftp:/ftp.ebi.ac.uk/pub/software/dos/clustalw。ClustalX:CluastalW程序
14、的UNIX版本,它使用X窗口圖形界面,ftp:/ftp.ebi.ac.uk/pub/softwareftp:/ftp-igbmc.u-strassbg.fr/pub/clustalX。對(duì)聯(lián)配結(jié)果進(jìn)一步編輯,形成適于發(fā)表的形式,可用的軟件有:SeaView:ftp:/biom3.univ-lyon1.frBOXSHADE:/software/box_form.html)CINEMA:http:/www.bioinf.man.ac.uk/dbbrowser/cinema2.1/cinema2hdr.html三、開讀框的分析GT-AG法則:外顯子與內(nèi)含子
15、之間的連接區(qū)序列高度保守,如大部分內(nèi)含子5端起始的兩個(gè)堿基是GT,3端最后兩個(gè)堿基是AG?;蜃R(shí)別軟件,常用的有:ORFFinder(/gorf/gorf.html)GRAIL(/grainbin/)GeneFinder(http:/genomic.sanger.ac.uk)Glimmer(/labs/compbio/glimmer.html/)GenScan(/genscan.html)GeneLang(http:/www
16、./genlang/)四、引物設(shè)計(jì)PrimerPremier軟件:Primer3軟件:/cgi-bin/primer/primer3Oligo、VectorNT、Omiga等五、向數(shù)據(jù)庫提交核酸序列向EMBL提交數(shù)據(jù)的網(wǎng)絡(luò)表格可參見:http:/www.ebi.ac.uk/subs/emblsubs.tml向GenBank數(shù)據(jù)庫提交核酸序列可聯(lián)網(wǎng)進(jìn)/GenBank/index.html也可用Sequin軟件制作好序列提交文件,向NCBI發(fā)送E-mail(gb-s
17、)提交第六節(jié)蛋白質(zhì)序列分析一、蛋白質(zhì)基本性質(zhì)分析蛋白質(zhì)的氨基酸組成、分子量、等電點(diǎn)等方面的分析:OMIGA、DNAMAN、BioEdit、MacVector等,4/5蛋白質(zhì)疏水性分析:ProtScale,/cgi-bin/protscale.pl預(yù)測跨膜區(qū):http:/genome.cbs.dtu.dk/services/TMHMM-2.0//software/TMPRED_form.htmlhttp:/www.emblheidelberg.de/services/sand
18、er/predictproteinftp:/ftp.biochem.ucl.ac.uk。預(yù)測信號(hào)肽:http:/genome.cbs.dtu.dk/services/SignalP/蛋白質(zhì)亞細(xì)胞定位:http:/predict.sanger.ac.uk/nnpsl/二、蛋白質(zhì)功能預(yù)測磷酸化位點(diǎn)、糖基化位點(diǎn),特殊的結(jié)構(gòu)區(qū)(motif)的分析:PROSITE:/prosite/BLOCKS:/blocks/PFAM:http:/www.sanger.ac.uk/software/pfam/PESCAN:http:/www.isrec.isb-sib.ch/software/pfscanInterProScan:http:/www.ebi.ac.uk/interpro/scan.htmlSMART:http:/smart.embl-heidberg.de/三、蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)的立體結(jié)構(gòu)數(shù)據(jù)庫PDB(ProteinDataBank):(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 郵件通知分發(fā)記錄表
- 健康管理與養(yǎng)生服務(wù)合作協(xié)議
- 中國寓言中的人物性格讀后感
- 企業(yè)內(nèi)訓(xùn)師培訓(xùn)教程作業(yè)指導(dǎo)書
- 生產(chǎn)車間承包協(xié)議
- 購買墳?zāi)雇恋貐f(xié)議書
- 邊坡支護(hù)施工合同
- 辦公室設(shè)備采購申請(qǐng)說明文書
- 西游記賞析傳統(tǒng)神話的魅力
- 走近哲學(xué)世界:大二哲學(xué)導(dǎo)論教學(xué)教案
- 2024廣西百色市平果市事業(yè)單位招聘工作人員歷年高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 口服給藥法課件
- 2輸變電工程施工質(zhì)量驗(yàn)收統(tǒng)一表式(變電工程土建專業(yè))-2024年版
- 道德與法治培訓(xùn)日志范文30篇
- 新人教小學(xué)四年級(jí)數(shù)學(xué)下冊(cè)第2單元《觀察物體(二)》教學(xué)課件
- 【正版授權(quán)】 ISO 7241:2023 EN Hydraulic fluid power - Dimensions and requirements of quick-action couplings
- QCT457-2023救護(hù)車技術(shù)規(guī)范
- DZ∕T 0207-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 硅質(zhì)原料類(正式版)
- 危險(xiǎn)化學(xué)品無倉儲(chǔ)經(jīng)營單位生產(chǎn)安全事故應(yīng)急救援預(yù)案(新導(dǎo)則版)
- 新人教版九年級(jí)數(shù)學(xué)第一輪總復(fù)習(xí)教案集2018年3月
- 追覓入職測評(píng)題庫
評(píng)論
0/150
提交評(píng)論