![測序普通名詞解釋匯總整編_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/14/524ae600-eae6-4309-b089-a6dce7fb256e/524ae600-eae6-4309-b089-a6dce7fb256e1.gif)
![測序普通名詞解釋匯總整編_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/14/524ae600-eae6-4309-b089-a6dce7fb256e/524ae600-eae6-4309-b089-a6dce7fb256e2.gif)
![測序普通名詞解釋匯總整編_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/14/524ae600-eae6-4309-b089-a6dce7fb256e/524ae600-eae6-4309-b089-a6dce7fb256e3.gif)
![測序普通名詞解釋匯總整編_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/14/524ae600-eae6-4309-b089-a6dce7fb256e/524ae600-eae6-4309-b089-a6dce7fb256e4.gif)
![測序普通名詞解釋匯總整編_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/14/524ae600-eae6-4309-b089-a6dce7fb256e/524ae600-eae6-4309-b089-a6dce7fb256e5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、高通量測序領(lǐng)域常用名詞解釋大全物種基因組大小發(fā)表時間擬南芥fArabidopsis thalianaJ125Mb200041水毎ff力;IN? safira)400Mb2111)2.4楊 樹(Popilifs tfichocwpa)480Mb2006.9俞萄 f Vlijs rim/era)49fflMb21107.9小立碗 fPln scorn itieHa patens/480Mb2008,1番木瓜fC仍Cd papaya)370Mb2008.4高粱(Sorgfum? bjcohr)750Mb2009.1玉3氏mays)2300Mb2009J1黃瓜(Ctfcitmhef/3 SOM2009
2、JI大星max)1100Mb2010d穗運柄草(Bvacbypodrnm distachyon)35SMb什么是咼通量測序?高通量測序技術(shù)(High-through put seque ncing, HTS )是對傳統(tǒng)San ger測序(稱為一代測序技術(shù))革命性的改變,一次對幾十萬到幾百萬條核酸分子進行序列測 定,因此在有些文獻中稱其為下一代測序技術(shù) (next generation sequencing NGS )足見其劃時代的改變,同時高通量測序使得對一個物種的轉(zhuǎn)錄組和基因組進行 細(xì)致全貌的分析成為可能,所以又被稱為深度測序(Deep sequencing。 什么是Sanger法測序(一代
3、測序)San ger法測序利用一種DNA聚合酶來延伸結(jié)合在待定序列模板上的引物。直到 摻入一種鏈終止核苷酸為止。每一次序列測定由一套四個單獨的反應(yīng)構(gòu)成,每個 反應(yīng)含有所有四種脫氧核苷酸三磷酸(dNTP),并混入限量的一種不同的雙脫氧核 苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-0H基團,使延長的寡聚核苷 酸選擇性地在G A、T或C處終止。終止點由反應(yīng)中相應(yīng)的雙脫氧而定。每一種 dNTPs和ddNTPS的相對濃度可以調(diào)整,使反應(yīng)得到一組長幾百至幾千堿基的鏈終止產(chǎn)物。它們具有共同的起始點,但終止在不同的的核苷酸上,可通過高分辨率變性凝膠電泳分離大小不同的片段,凝膠處理后可用X-光膠
4、片放射自顯影或非同位素標(biāo)記進行檢測。什么是基因組重測序(Genome Re-sequencing)全基因組重測序是對基因組序列已知的個體進行基因組測序,并在個體或群體 水平上進行差異性分析的方法。隨著基因組測序成本的不斷降低,人類疾病的致 病突變研究由外顯子區(qū)域擴大到全基因組范圍。 通過構(gòu)建不同長度的插入片段文 庫和短序列、雙末端測序相結(jié)合的策略進行高通量測序,實現(xiàn)在全基因組水平上 檢測疾病關(guān)聯(lián)的常見、低頻、甚至是罕見的突變位點,以及結(jié)構(gòu)變異等,具有重 大的科研和產(chǎn)業(yè)價值。什么是de novo測序Genomic DNA打碎成周宦度片段g測序儀序列測定第二代測序技術(shù)組裝程序序列組裝SOAPden
5、ovo軟件Assembled genome tde novo測序也稱為從頭測序:其不需要任何現(xiàn)有的序列資料就可以對某個物種進行測序,利用生物信息學(xué)分析手段對序列進行拼接,組裝,從而獲得該物種 的基因組圖譜。獲得一個物種的全基因組序列是加快對此物種了解的重要捷徑。隨著新一代測序技術(shù)的飛速發(fā)展,基因組測序所需的成本和時間較傳統(tǒng)技術(shù)都大 大降低,大規(guī)?;蚪M測序漸入佳境,基因組學(xué)研究也迎來新的發(fā)展契機和革命 性突破。利用新一代高通量、高效率測序技術(shù)以及強大的生物信息分析能力, 可 以高效、低成本地測定并分析所有生物的基因組序列。測序名詞關(guān)系圖ScaffoldufiTi:q ?Read (known
6、eqiierKe) Roughly known length but not known sequence什么是fragmentsfragments就是打成的片段,而測序測的就是這些 fragments,測出來的結(jié)果就 是reads,又可以分為單端側(cè)和雙端側(cè),單端測序的話,只是從 fragments的一 端測序,測多長read就多長,雙端測序就是從一個fragments的兩端測,就會 得出兩個reads 什么是Reads 高通量測序平臺產(chǎn)生的序列就稱為reads。(測序讀到的堿基序列片段,測序的最小單位;)什么是Contig拼接軟件基于reads之間的overlap區(qū),拼接獲得的序列稱為Con
7、 tig (重疊群)。(由reads通過對overlap區(qū)域拼接組裝成的 沒有g(shù)ap的序列段;) 什么是Contig N50Reads拼接后會獲得一些不同長度的 Contigs。將所有的Contig長度相加,能獲 得一個Contig總長度。然后將所有的Contigs按照從長到短進行排序,如獲得Con tig 1 ,Co ntig 2 ,Con tig 3Con tig 25。將 Co ntig 按照這個順序依次相加,當(dāng)相加的長度達到 Contig總長度的一半時,最后一個加上的Contig長度即為 Contig N50。舉例:Contig 1+Contig 2+ Contig 3 +Contig
8、 4=Contig總長度*1/2時,Contig 4的長度即為Contig N50 Contig N50可以作為基因組拼接的結(jié)果好壞的一個判斷標(biāo)準(zhǔn)。什么是Scaffold 基因組de novo測序(沒有參考基因組的測序,需要研究人員從頭拼接得到的序列),通過reads拼接獲得Contigs后,往往還需要構(gòu)建454 Paired-end 庫或 Illumina Mate-pair 庫,以獲得一定大小片段(如 3Kb 6Kb 10Kb 20Kb)兩 端的序列?;谶@些序列,可以確定一些 Con tig之間的順序關(guān)系,這些先后順序已知的Contigs組成Scaffold。(通過P air e nds
9、 信息確定出的con tig 排列,中間有g(shù)ap) 什么是 Scaffold N50Scaffold N50 與Co ntig N50的定義類似。Con tigs拼接組裝獲得一些不同長度 的Scaffolds。將所有的Scaffold長度相加,能獲得一個 Scaffold總長度。然后將所有的Scaffolds按照從長到短進行排序,如獲得Scaffold 1, Scaffold 2,Scaffold 3.Scaffold 25。將Scaffold 按照這個順序依次相加,當(dāng)相加的長度達到Scaffold總長度的一半時,最后一個加上的Scaffold長度即為Scaffold N5Q 舉例:Scaff
10、old 1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold 總長度 *1/2 時,Scaffold 5 的長度即為 Scaffold N5(X Scaffold N50可以作為基因組拼接的結(jié)果好壞的一個判斷標(biāo)準(zhǔn)。什么是測序深度和覆蓋度 測序深度:是指測序得到的總堿基數(shù)與待測基因組大小的比值。 假設(shè)一個基因大 小為2M測序深度為10X,那么獲得的總數(shù)據(jù)量為20M 覆蓋度:是指測序獲得的序列占整個基因組的比例。Gap由于基因組中的高GC重復(fù)序列等復(fù)雜結(jié)構(gòu)的存在,測序最終拼接組裝獲得的序列往往無法覆蓋有所的區(qū)域, 這部分沒有獲得的區(qū)域就
11、稱為。例如一個細(xì) 菌基因組測序,覆蓋度是98%那么還有2%勺序列區(qū)域是沒有通過測序獲得的。什么是RPKM FPKMRP KM,ReadPer Kilobase of ex on model p er Millio n mapp edreads, is defi nedin thisway Mortazavi etal., 2008:每1百萬個map上的reads中map到外顯子的每1K個堿基上的reads個數(shù)。假如有1百萬個reads映射到了人的基因組上,那么具體到每個外顯子呢,有多少映射上了呢,而外顯子的長度不一,那么每1K個堿基上又有多少reads映射上了呢,這大概就是這個 RPKM勺直觀
12、解釋。RKPMI (exon) = IO- * eon_iag_couni / (totaLtag_couni * exon_si2e)RPKMI (gen = 10 gene_tag_couint # (total_tag_count * canonical_transcfipt_siz0)Mortajsvl紐 a/(200S Nature Lie(hod-s如果對應(yīng)特定基因的話,那么就是每 1000000 mapped到該基因上的reads中每 kb有多少是 mapped到該基因上的exon的readTotal exon reads:This is the nu mber in the c
13、olu mn with header Total exon reads in the row for the gene. This is the nu mber of reads that have beenmappecto a region in which an exon is annotated for the gene or across thebo un daries of two exons or an intron and an exon for an anno tated tran scri pt ofthe gene. For eukaryotes, exons and th
14、eir internal映射到外顯子上總relati onships are defi ned bya nno tati ons of type mRNA.的reads個數(shù)。這個是映射到某個區(qū)域上的reads個數(shù),這個區(qū)域或者是已知注 釋的基因或者跨兩個外顯子的邊界或者是某個基因已經(jīng)注釋的轉(zhuǎn)錄本的內(nèi)含子、外顯子。對于真核生物來說,外顯子和它們自己內(nèi)部的關(guān)系由某類型的mRNA來注釋。Exonlen gth: This is thenu mber in the colu mn with the header Exon len gth in the row for the gene, divided
15、 by 1000. This is calculated as the sumof thelengths of all exonsannotated for the gene. Each exon is includedonly once in thissum, eve n if it is p rese nt in more anno tated tran scri pts for the gene.Partly overlapping exons will count with their full length,eve n though theyshare the same region
16、.外顯子的長度。計算時,計算所有某 個基因已注釋的所有外顯子長度的總和。即使某個基因以多種注釋的轉(zhuǎn)錄本呈現(xiàn), 這個外顯子在求和時只被包含一次。 即使部分重疊的外顯子共享相同的區(qū)域, 重 疊的外顯子以其總長來計算。Mapped reads: The sum of all the nu mbers in the colu mn with headerTotalge ne reads. The Total gene reads for a gene is the total nu mberofreads that after mapping have bee n mapped to the regi
17、 on of the gene.Thus this in cludes all the reads uniq uely mapp edto the regi on of the geneas well asthose of the reads which match in more pl aces (below the limitset in thedialog in figure 18.110) that have been allocated tothis genesregi on. A gen es regi on is that comp rised of the flanking r
18、egi on s(if itwas sp ecified in figure18.110), the exons, the introns andacrossexon-exon boundaries of all transcriptsannotated for the gene.Thus,thesum of the total gene reads nu mbers is the nu mber of mapped reads forthesa mple (you can find the nu mber in the RNA-Seq repo rt).ma p的 reads總和。映射到某個
19、基因上的所有reads總數(shù)。因此這包含所有的唯一映射到這個區(qū)域上的reads。舉例:比如對應(yīng)到該基因的read有1000個,總reads個數(shù)有100萬,而該基因的外顯子總長為5kb,那么它的RPKMfe: 109*1000(reads個數(shù))/10八6(總reads個數(shù))*5000(外顯子長度)=200或者:1000(reads個數(shù))/1(百萬)*5(K)=200 這個值反映基因的表達水平。FP KM(fragme nts per kilobase of exon per millio n fragme nts mapp ed). FPKM與RPKM計算方法基本一致。不同點就是 FPKM計算的是
20、fragments,而RPKM計算的是reads。 Fragment比read的含義更廣,因此 FPKM包含的意義也更廣,可以是 Pair-end 的一個fragment,也可以是一個 read。什么是 soft-clipped reads當(dāng)基因組發(fā)生某一段的缺失,或轉(zhuǎn)錄組的剪接,在測序過程中,橫跨缺失位點及剪接位點的reads回帖到基因組時,一條reads被切成兩段,匹配到不同的區(qū)域,這樣的reads叫做soft-clipped reads ,這些reads對于鑒定染色體結(jié)構(gòu)變異及外源序列整合具有重要作用。什么是 multi-hits reads由于大部分測序得到的reads較短,一個rea
21、ds能夠匹配到基因組多個位置,無法區(qū)分其真實來源的位置。一些工具根據(jù)統(tǒng)計模型,如將這類reads分配給reads較多的區(qū)域。什么是外顯子測序( whole exon sequencing)外顯子組測序是指利用序列捕獲技術(shù)將全基因組外顯子區(qū)域DNAi捉并富集后進行高通量測序的基因組分析方法。外顯子測序相對于基因組重測序成本較低, 對研究已知基因的SNR In del等具有較大的優(yōu)勢,但無法研究基因組結(jié)構(gòu)變異如染色體斷裂重組等。什么是 mRNAM序(RNA-seq轉(zhuǎn)錄組學(xué)(transcriptomics)是在基因組學(xué)后新興的一門學(xué)科,即研究特定細(xì) 胞在某一功能狀態(tài)下所能轉(zhuǎn)錄出來的所有 RNA(包括
22、mRNA和非編碼RNA的類型與拷貝數(shù)。Illumina提供的mRN測序技術(shù)可在整個mRN領(lǐng)域進行各種相關(guān) 研究和新的發(fā)現(xiàn)。mRNAffl序不對引物或探針進行設(shè)計,可自由提供關(guān)于轉(zhuǎn)錄的客觀和權(quán)威信息。研究人員僅需要一次試驗即可快速生成完整的poly-A尾的RNA完整序列信息,并分析基因表達、cSNR全新的轉(zhuǎn)錄、全新異構(gòu)體、剪接位點、 等位基因特異性表達和罕見轉(zhuǎn)錄等最全面的轉(zhuǎn)錄組信息。簡單的樣品制備和數(shù)據(jù) 分析軟件支持在所有物種中的 mRNAM序研究。什么是small RNA測序Small RNA(micro RNAs、siRNAs和pi RNAs )是生命活動重要的調(diào)控因子,在 基因表達調(diào)控、生
23、物個體發(fā)育、代謝及疾病的發(fā)生等生理過程中起著重要的作用。Illumi na能夠?qū)?xì)胞或者組織中的全部 Small RNA進行深度測序及定量分析等研究。實驗時首先將18-30 nt范圍的Small RNA從總RNA中分離出來,兩端分別加上特定接頭后體外反轉(zhuǎn)錄做成 cDNA再做進一步處理后,利用測序儀對 DNA片段進行單向末端直接測序。 通過Illumina對Small RNA大規(guī)模測序分析,可以從中獲得物種全基因組水平的 miRNA圖譜,實現(xiàn)包括新miRNA分子的挖掘,其作用靶基因的預(yù)測和鑒定、樣品間差異表達分析、miRNAs聚類和表達譜分析等科學(xué)應(yīng)用。什么是miRNAM序 成熟的microRN
24、A(miRNA是1724nt的單鏈非編碼 RNA分子,通過與 mRNA目互作用影響目標(biāo) mRNA勺穩(wěn)定性及翻譯,最終誘導(dǎo)基因沉默,調(diào)控著基因表達、細(xì)胞生長、發(fā)育等生物學(xué)過程。 基于第二代測序技術(shù)的microRNA測序,可以一 次性獲得數(shù)百萬條microRNA序列,能夠快速鑒定出不同組織、不同發(fā)育階段、不同疾病狀態(tài)下已知和未知的 microRNA及其表達差異,為研究microRNA對細(xì)胞 進程的作用及其生物學(xué)影響提供了有力工具。什么是Chip-seq染色質(zhì)免疫共沉淀技術(shù)(ChromatinImmunoprecipitation,ChIP)也稱結(jié)合位 點分析法,是研究體內(nèi)蛋白質(zhì)與 DNA相互作用的
25、有力工具,通常用于轉(zhuǎn)錄因子結(jié)合位點或組蛋白特異性修飾位點的研究。將Ch IP與第二代測序技術(shù)相結(jié)合的ChlP-Seq技術(shù),能夠高效地在全基因組范圍內(nèi)檢測與組蛋白、轉(zhuǎn)錄因子等互作的DNA區(qū)段。ChIP-Seq的原理是:首先通過染色質(zhì)免疫共沉淀技術(shù)(ChIP)特異性地富集目 的蛋白結(jié)合的DN/片段,并對其進行純化與文庫構(gòu)建;然后對富集得到的DNA片段進行高通量測序。研究人員通過將獲得的數(shù)百萬條序列標(biāo)簽精確定位到基 因組上,從而獲得全基因組范圍內(nèi)與組蛋白、 轉(zhuǎn)錄因子等互作的DNAX段信息。是一種檢測與RNA什么是CHIRP-SeqCHIR P-Seq( Chromat in Isolation by
26、 RNA P urificatio n )綁定的DNA和蛋白的高通量測序方法。方法是通過設(shè)計生物素或鏈霉親和素探 針,把目標(biāo)RNA拉下來以后,與其共同作用的 DNA染色體片段就會附在到磁珠上,最后把染色體片段做高通量測序,這樣會得到該 RNA能夠結(jié)合到在基因組 的哪些區(qū)域,但由于蛋白測序技術(shù)不夠成熟,無法知道與該 RNA結(jié)合的蛋白。什么是RIP-seqRNAmmunoprecipitation是研究細(xì)胞內(nèi)RNA與蛋白結(jié)合情況的技術(shù),是了解轉(zhuǎn)錄后調(diào)控網(wǎng)絡(luò)動態(tài)過程的有力工具,能幫助我們發(fā)現(xiàn)miRNA的調(diào)節(jié)靶點。這種技術(shù)運用針對目標(biāo)蛋白的抗體把相應(yīng)的 RNA蛋白復(fù)合物沉淀下來,然后經(jīng)過分 離純化就可
27、以對結(jié)合在復(fù)合物上的 RNA行測序分析。RIP可以看成是普遍使用的染色質(zhì)免疫沉淀 ChlP技術(shù)的類似應(yīng)用,但由于研究 對象是RNA蛋白復(fù)合物而不是DNA蛋白復(fù)合物,RIP實驗的優(yōu)化條件與ChIP實 驗不太相同(如復(fù)合物不需要固定,RIP反應(yīng)體系中的試劑和抗體絕對不能含有RNA酶,抗體需經(jīng)RIP實驗驗證等等)。RIP技術(shù)下游結(jié)合microarray技術(shù)被 稱為RIP-Chip,幫助我們更高通量地了解癌癥以及其它疾病整體水平的 RNA變化。什么是CLIP-seqCLIP-seq,又稱為HITS-CLIP,即紫外交聯(lián)免疫沉淀結(jié)合高通量測序 (crossli nkin g-im munp reci p
28、i tatio n and high-through put seque ncin g),一項在全基因組水平揭示 RNA分子與RNA吉合蛋白相互作用的革命性技術(shù)。其主要原理是基于RNA分子與RNA吉合蛋白在紫外照射下發(fā)生耦聯(lián),以 RNA吉合蛋白的特異性抗體將RNA蛋白質(zhì)復(fù)合體沉淀之后,回收其中的 RNAt段,經(jīng)添加接頭、RT- PCF等步驟,對這些分子進行高通量測序,再經(jīng)生物信息學(xué)的分析和處理、總結(jié),挖掘出其特定規(guī)律,從而深入揭示RNA結(jié)合蛋白與RNA分子的調(diào)控作用及其對生命的意義。什么是metagenomic (宏基因組):Mage nomics研究的對象是整個微生物群落。相對于傳統(tǒng)單個細(xì)菌
29、研究來說,它具有眾多優(yōu)勢,其中很重要的兩點:(1)微生物通常是以群落方式共生于某一 小生境中,它們的很多特性是基于整個群落環(huán)境及個體間的相互影響的,因此做Metagenomics研究比做單個個體的研究更能發(fā)現(xiàn)其特性;(2) Metagenomics研究無需分離單個細(xì)菌,可以研究那些不能被實驗室分離培養(yǎng)的微生物。 宏基因組是基因組學(xué)一個新興的科學(xué)研究方向。宏基因組學(xué)(又稱元基因組學(xué), 環(huán)境基因組學(xué),生態(tài)基因組學(xué)等),是研究直接從環(huán)境樣本中提取的基因組遺傳物質(zhì)的學(xué)科。傳統(tǒng)的微生物研究依賴于實驗室培養(yǎng),宏基因組的興起填補了無 法在傳統(tǒng)實驗室中培養(yǎng)的微生物研究的空白。過去幾年中,DNA測序技術(shù)的進步
30、以及測序通量和分析方法的改進使得人們得以一窺這一未知的基因組科學(xué)領(lǐng)域。什么是SNP、SNV (單核苷酸位點變異)單核苷酸多態(tài)性singlenucleotide polymorphism,SNP或單核苷酸位點變異SNV個體間基因組DNA序列同一位置單個核苷酸變異(替代、插入或缺失)所引起的多態(tài)性。不同物種、個體基因組 DNA序列同一位置上的單個核苷酸存在差別的現(xiàn)象。有這種差別的基因座、DNA序列等可作為基因組作圖的標(biāo)志。 人基因 組上平均約每1000個核苷酸即可能出現(xiàn)1個單核苷酸多態(tài)性的變化,其中有些單核苷酸多態(tài)性可能與疾病有關(guān),但可能大多數(shù)與疾病無關(guān)。單核苷酸多態(tài)性是 研究人類家族和動植物品系
31、遺傳變異的重要依據(jù)。在研究癌癥基因組變異時,相對于正常組織,癌癥中特異的單核苷酸變異是一種體細(xì)胞突變(somaticmutation ),稱做 SNV什么是INDEL (基因組小片段插入)基因組上小片段(50bP)的插入或缺失,形同SNP/SNV 什么是copy number variation (CNV):基因組拷貝數(shù)變異基因組拷貝數(shù)變異是基因組變異的一種形式,通常使基因組中大片段的DNA形成非正常的拷貝數(shù)量。例如人類正常染色體拷貝數(shù)是2,有些染色體區(qū)域拷貝數(shù) 變成1或3,這樣,該區(qū)域發(fā)生拷貝數(shù)缺失或增加,位于該區(qū)域內(nèi)的基因表達量 也會受到影響。如果把一條染色體分成 A-B-C-D四個區(qū)域,
32、則A-B-C-C-D/A-C-B-C-D/A-C-C-B-C-D/A-B-D 分別發(fā)生了 C 區(qū)域的擴增及缺失,擴 增的位置可以是連續(xù)擴增如 A-B-C-C-D也可以是在其他位置的擴增,如A-C-B-C-D 0什么是 structure variation(SV):基因組結(jié)構(gòu)變異染色體結(jié)構(gòu)變異是指在染色體上發(fā)生了大片段的變異。主要包括染色體大片段 的插入和缺失(引起CNV的變化),染色體內(nèi)部的某塊區(qū)域發(fā)生翻轉(zhuǎn)顛換,兩條染色體之間發(fā)生重組(inter-chromosome trans-location)等。一般SV的 展示利用Circos軟件。什么是 Segment duplication一般稱
33、為SD區(qū)域,串聯(lián)重復(fù)是由序列相近的一些 DNA片段串聯(lián)組成。串聯(lián)重復(fù)在人類基因多樣性的靈長類基因中發(fā)揮重要作用。在人類染色體丫和22號染色 體上,有很大的SD序列。什么是 genotype and phenotype既基因型與表型;一般指某些單核苷酸位點變異與表現(xiàn)形式間的關(guān)系。什么是轉(zhuǎn)錄本重構(gòu)用測序的數(shù)據(jù)組裝成轉(zhuǎn)錄本。有兩種組裝方式:1, de-novo構(gòu)建;2,有參考基因組重構(gòu)。其中de-novo組裝是指在不依賴參考基因組的情況下,將有overlap的reads連接成一個更長的序列,經(jīng)過不斷的延伸,拼成一個個的con tig及scaffold。常用工具包括 velvet ,trans-ABY
34、SS,Trinity等。有參考基因組重 構(gòu),是指先將read貼回到基因組上,然后在基因組通過reads覆蓋度,junction位點的信息等得到轉(zhuǎn)錄本,常用工具包括scripture 、cufflinks 。什么是 genefusion將基因組位置不同的兩個基因中的一部分或全部整合到一起,形成新的基因, 稱作融合基因,或嵌合體基因。該基因有可能翻譯出融合或嵌合體蛋白。什么是表達譜基因表達譜(geneexpression profile):指通過構(gòu)建處于某一特定狀態(tài)下的細(xì) 胞或組織的非偏性cDNA文庫,大規(guī)模cDNA測序,收集cDNA序列片段、定性、定 量分析其mRNz群體組成,從而描繪該特定細(xì)胞
35、或組織在特定狀態(tài)下的基因表達 種類和豐度信息,這樣編制成的數(shù)據(jù)表就稱為基因表達譜 什么是功能基因組學(xué) 功能基因組學(xué)(Functuionalgenomics )又往往被稱為后基因組學(xué)(Postgenomics ),它利用結(jié)構(gòu)基因組所提供的信息和產(chǎn)物,發(fā)展和應(yīng)用新的 實驗手段,通過在基因組或系統(tǒng)水平上全面分析基因的功能,使得生物學(xué)研究 從對單一基因或蛋白質(zhì)得研究轉(zhuǎn)向多個基因或蛋白質(zhì)同時進行系統(tǒng)的研究。這 是在基因組靜態(tài)的堿基序列弄清楚之后轉(zhuǎn)入對基因組動態(tài)的生物學(xué)功能學(xué)研究。研究內(nèi)容包括基因功能發(fā)現(xiàn)、基因表達分析及突變檢測?;虻墓δ馨ǎ荷?物學(xué)功能,如作為蛋白質(zhì)激酶對特異蛋白質(zhì)進行磷酸化修飾;細(xì)
36、胞學(xué)功能,如 參與細(xì)胞間和細(xì)胞內(nèi)信號傳遞途徑;發(fā)育上功能,如參與形態(tài)建成等。采用的 手段包括經(jīng)典的減法雜交,差示篩選,cDNA弋表差異分析以及mRN差異顯示等, 但這些技術(shù)不能對基因進行全面系統(tǒng)的分析,新的技術(shù)應(yīng)運而生,包括基因表 達的系統(tǒng)分析(serial analysis of gene expression,SAGE ) , cDNA微陣列(cDNA microarray ) , DNA芯片(DNA chip)和序列標(biāo)志片段顯示(sequenee tagged fragme ntsdis play 。什么是比較基因組學(xué) 比較基因組學(xué)(ComparativeGenomics)是基于基因組圖譜和測序基礎(chǔ)上,對已知 的基因和基因組結(jié)構(gòu)進行比較,來了解基因的功能、表達機理和物種進化的學(xué)科。利用模式生物基因組與人類基因組之間編碼順序上和結(jié)構(gòu)上的同源性,克隆人類
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年五年級數(shù)學(xué)下冊 五 分?jǐn)?shù)除法練習(xí)五說課稿 北師大版001
- Unit 3 Amazingt animals Part A Letters and sounds(說課稿)-2024-2025學(xué)年人教PEP版(2024)英語三年級上冊
- Unit 3 Weather B learn(說課稿)-2023-2024學(xué)年人教PEP版英語四年級下冊
- 2023八年級數(shù)學(xué)上冊 第15章 數(shù)據(jù)的收集與表示15.1數(shù)據(jù)的收集 1數(shù)據(jù)有用嗎說課稿 (新版)華東師大版
- 2023八年級道德與法治上冊 第二單元 遵守社會規(guī)則 第三課 社會生活離不開規(guī)則第2課時 遵守規(guī)則說課稿 新人教版
- 2024八年級英語下冊 Unit 1 Spring Is ComingLesson 4 The Spring City說課稿(新版)冀教版
- 17 要是你在野外迷了路(說課稿)-2023-2024學(xué)年統(tǒng)編版語文二年級下冊
- 2025回遷房買賣合同模板
- 2025勞動合同書的范本
- Unit 8 What's his job單元整體(說課稿)-2024-2025學(xué)年接力版(2024)英語三年級上冊
- 綠色能源項目融資計劃書范文
- 大樹扶正施工方案
- 《造血干細(xì)胞移植護理》課件
- 課題申報參考:全齡友好視角下的社區(qū)語言景觀評估及空間優(yōu)化研究
- 中央2025年公安部部分直屬事業(yè)單位招聘84人筆試歷年參考題庫附帶答案詳解
- 五年級下冊語文四大名著??贾R點
- 光伏發(fā)電項目施工組織設(shè)計方案及技術(shù)措施
- 2025年1月日歷表(含農(nóng)歷-周數(shù)-方便記事備忘)
- 2024年同等學(xué)力人員申請碩士學(xué)位英語試卷與參考答案
- 臨床用血管理培訓(xùn)
- 介入手術(shù)室護理風(fēng)險
評論
0/150
提交評論