版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
生物醫(yī)學(xué)文本挖掘及其應(yīng)用例子:二者關(guān)系進(jìn)行性多灶性白質(zhì)腦病(progressivemultifocalleukoencephalopathy,PML)抗體antibodiesMonoclonalantibodies,efalizumab(依法珠單克隆抗體)自然語(yǔ)言處理讓計(jì)算機(jī)替我們看文獻(xiàn)吧!比較難:計(jì)算機(jī)需要專門(mén)得知識(shí)才能讀懂文本。自然語(yǔ)言處理(NaturalLanguageProcessing,NLP):專門(mén)訓(xùn)練計(jì)算機(jī)掌握這種知識(shí)得學(xué)科。生物醫(yī)學(xué)文本挖掘(Biomedicaltextmining)就是一個(gè)專門(mén)處理生物學(xué)、醫(yī)學(xué)和化學(xué)文本得分支學(xué)科。也叫BioNLP有些人把NLP當(dāng)做textmining得同義詞。Biomedicaltext生物醫(yī)學(xué)文本得格式多種多樣:病歷科研論文序列注釋公共健康指南文本得內(nèi)容多樣化,如習(xí)慣用語(yǔ)臨床有臨床上得行話實(shí)驗(yàn)室有自己對(duì)蛋白得命名方式這種差異造成了文本挖掘應(yīng)用往往面向特定類型得文本。尤其就是對(duì)Medline文摘記錄得分析。易獲取免費(fèi)4基本概念(1)術(shù)語(yǔ)(Term):專門(mén)領(lǐng)域里得名稱。術(shù)語(yǔ)集(terminology):術(shù)語(yǔ)得集合。生物醫(yī)學(xué)文本中到處就是術(shù)語(yǔ),就是醫(yī)學(xué)知識(shí)得基本構(gòu)件。如各種細(xì)胞得名稱,蛋白質(zhì)、醫(yī)學(xué)設(shè)備、疾病、基因突變、化學(xué)物質(zhì)名、蛋白質(zhì)域得名稱。名稱如此重要,需要在文本中識(shí)別之,這個(gè)工作稱為生物醫(yī)學(xué)文獻(xiàn)中得命名體識(shí)別(NER,NamedEntityRecognition)。基本概念(2)盡管術(shù)語(yǔ)得定義似乎很明確,但就是很難精確定義。earlyprogressivemultifocalleukoencephalopathyRefertoearlyprogressivemultifocalleukoencephalopathyprogressivemultifocalleukoencephalopathymultifocalleukoencephalopathyLeukoencephalopathy基本概念(3)Terminology:手工構(gòu)建得,因此就是受控得。HUGO:基因術(shù)語(yǔ)集ICD:國(guó)際疾病分類法。GeneOntology:基因本體。不僅僅就是術(shù)語(yǔ)列表,還包括:術(shù)語(yǔ)表+同義詞=thesaurus
術(shù)語(yǔ)表+術(shù)語(yǔ)之間得關(guān)系=taxonomies,ontology一旦一段文本與其中一個(gè)詞表對(duì)應(yīng)上,就和其她資源建立起聯(lián)系了。人工標(biāo)引手工匹配MedlineabstractsMedicalSubjectHeadings(MeSH)Leukoencephalopathy,progressivemultifocal89genenormalization自動(dòng)匹配:recognizingnamesofgenesMedlineabstractsmappingthemtotheircorrespondinggeneidentifiers(e.g.,EntrezGeneID)1011大家應(yīng)該也有點(diǎn)累了,稍作休息大家有疑問(wèn)的,可以詢問(wèn)和交流HGNCdatabaseofhumangenenames
HUGOGeneNomenclaturemittee
網(wǎng)上在線檢索得基因名稱信息14下載得基因名稱信息NER得原理文本(PubMedAbstracts)軟件名稱(基因名,蛋白質(zhì)名)詞表詞表之間得聯(lián)系詞表太多,又創(chuàng)建了詞表,把術(shù)語(yǔ)集匹配起來(lái),詞表之詞表,超級(jí)詞表。metaBioThesaurus:多個(gè)詞表中蛋白質(zhì)得同義詞UnifiedMedicalLanguageSystem(UMLS):一體化醫(yī)學(xué)語(yǔ)言系統(tǒng),120多個(gè)詞表,4百萬(wàn)個(gè)術(shù)語(yǔ)。
18術(shù)語(yǔ)識(shí)別工具Whatizit:識(shí)別多種術(shù)語(yǔ),通過(guò)網(wǎng)頁(yè)。Abner:單機(jī)版,識(shí)別5種術(shù)語(yǔ):蛋白、DNA、RNA、細(xì)胞株、細(xì)胞類型。更專指得術(shù)語(yǔ)識(shí)別工具:PepBank:用于肽類LSAT:用于alternativetranscripts提高PubMed檢索效果:semedico,novo|seekGoPubMed/GoGene2425A(Whatizit):蛋白-藍(lán)色,疾病-深紅,基因本體-淺紅,化學(xué)物質(zhì)-深紅,物種-紅色B(ABNER):蛋白和細(xì)胞株C(BIOCreAtIvEmetaserver)發(fā)現(xiàn)關(guān)系識(shí)別術(shù)語(yǔ)之后,下一步自然就是尋找術(shù)語(yǔ)之間得關(guān)系。發(fā)現(xiàn)關(guān)系得最簡(jiǎn)單途徑就就是共現(xiàn):在同一段文字中同時(shí)出現(xiàn)得兩個(gè)術(shù)語(yǔ)可能有關(guān)聯(lián)。例如,某種蛋白質(zhì)與一種疾病總就是在同一文摘中出現(xiàn),有理由假設(shè)該蛋白與疾病得某個(gè)方面有關(guān)。共現(xiàn)得次數(shù)越多,越有意義??梢远颗判?通過(guò)統(tǒng)計(jì)處理排除偶然得關(guān)聯(lián)。27關(guān)聯(lián)度假設(shè)有t1和t2兩個(gè)詞共現(xiàn),最簡(jiǎn)單得信度指標(biāo)就就是含有這兩個(gè)詞得文章數(shù)c(t1t2),但就是要標(biāo)準(zhǔn)化,去掉兩個(gè)詞各自出現(xiàn)頻次對(duì)共現(xiàn)次數(shù)得影響。點(diǎn)間互信息p為文章數(shù)除以文章總數(shù)。關(guān)系抽取:共現(xiàn)GoDisease:輸入‘‘leukoencephalopathy,progressive
multifocal’’[mh]返回結(jié)果:所有提及PML得文摘中得基因。出現(xiàn)次數(shù)越多得基因,越可能與PML有關(guān)聯(lián)。如果某基因在PML中不成比例地高于其她疾病,則該基因可能與PML有特殊關(guān)系。關(guān)系抽取:確切關(guān)系明確描述得關(guān)系:比共現(xiàn)更好得證據(jù)。例如:‘‘WedescribeaPMLina67-year-oldwomanwithadestructivepolyarthritis(多關(guān)節(jié)炎)associatedwithanti-JO1antibodies
treatedwithcorticosteroids’’PML與抗-JO1抗體有明確關(guān)系。將這種關(guān)系簡(jiǎn)化為三元體:兩個(gè)名詞+一個(gè)動(dòng)詞。PMLisassociatedwithanti-JO1antibodies識(shí)別動(dòng)詞:詞性標(biāo)注:part-of-speech(POS)tagger三元體表述因其簡(jiǎn)單而功能強(qiáng)大,但就是忽略了文章中得重要得細(xì)節(jié)。比如有些證據(jù)就是來(lái)自于臨床病例報(bào)告。SemanticKnowledgeRepresentationSKR:就是基于UMLS進(jìn)行自然語(yǔ)言處理、提取文獻(xiàn)中概念得系列在線工具。其中MetaMap就是SKR系統(tǒng)得核心組件。MMTx就是完成MetaMap功能得Java工具包,她進(jìn)行得分析就是語(yǔ)義層次上得分析。MetaMap工作原理MetaMap工作原理:切分“ocularplicationofmyastheniagravis”(重癥肌無(wú)力得眼部并發(fā)癥)“ocularplication”和“ofmyastheniagravis”“ocularplication”分為“[mod(ocular),head(plication)]MetaMap工作原理:產(chǎn)生變形體Ocular{[adj],0=””}Eye{[noun],2=”s”}同義詞Eyes{[noun],3=”si”}同義詞得復(fù)數(shù)Optic{[adj],4=”ss”}同義詞得同義詞Ophthalmic{[adj],4=”ss”}同義詞得同義詞Ophthalmia{[noun],7=”ssd”}同義詞得同義詞得變形Oculus{[noun],3=”d”}變形Oculi{[noun],4=”di”}同義詞得復(fù)數(shù)檢索候選詞及候選詞得評(píng)價(jià)檢索超級(jí)詞表,檢索到包含有至少一個(gè)變形體得候選字串集合。計(jì)算出與輸入得短語(yǔ)詞相匹配得候選詞,然后用4種指標(biāo)得加權(quán)平均組成得語(yǔ)言學(xué)評(píng)價(jià)函數(shù),計(jì)算輸入短語(yǔ)與候選詞之間得匹配程度:中心度:即包含中心詞;變形情況:距離倒數(shù)得平均值;覆蓋面和內(nèi)斂度:測(cè)量候選詞與文本得匹配程度和有多少個(gè)片段按照匹配程度排列這些候選詞。關(guān)系抽取:PPIprotein-proteininteractions(PPI):文本挖掘得重頭戲利用三元體表達(dá),構(gòu)建PPI網(wǎng)絡(luò),節(jié)點(diǎn)就是蛋白質(zhì),動(dòng)詞為邊。分析文本挖掘出來(lái)得PPI網(wǎng)絡(luò)時(shí),應(yīng)當(dāng)注意閱讀和理解支撐信息。例如,蛋白質(zhì)間相互作用可以就是直接得,也可以就是間接得,取決于動(dòng)詞直接動(dòng)詞有tobind,tostabilize,tophosphorylate間接得動(dòng)詞有toinduce,totrigger,toblock。文獻(xiàn)中描述得蛋白質(zhì)相互作用得不同性質(zhì)部分地反映了所采用得實(shí)驗(yàn)方法和相互作用本身得性質(zhì)。常用得捕獲文本變異得方法就就是把各種表達(dá)方式辨認(rèn)出來(lái),并寫(xiě)下捕獲這些變異得規(guī)則。捕獲磷酸化得模式,應(yīng)當(dāng)依次含有:一種酶得名字磷酸化得動(dòng)詞一種基質(zhì)得名字發(fā)現(xiàn)關(guān)系得工具FACTA:Medline文本中概念共現(xiàn)情況。MedGene和BioGene:利用共現(xiàn)發(fā)現(xiàn)基因優(yōu)先級(jí)別。Endeavour和G2D利用文本和其她數(shù)據(jù)源分析基因優(yōu)先級(jí)別。PolySearch利用啟發(fā)式加權(quán)技術(shù),給不同得共現(xiàn)不同得權(quán)重。Anni使用文本輪廓測(cè)量術(shù)語(yǔ)之間得關(guān)系。iHOP:挖掘PPI最流行得工具。RLIMS-P利用語(yǔ)言模式發(fā)現(xiàn)磷酸化過(guò)程中得激酶、基質(zhì)和磷酸。E3Miner發(fā)現(xiàn)泛素化,包括上下文信息。GoDisease+iHOP+Cytoscape發(fā)現(xiàn):DiscoveryBesidesfindingrelationships,textminersarealsointerestedindiscoveringrelationshipsSwanson:undiscoveredpublicknowledge【見(jiàn)例子1】文本挖掘得應(yīng)用實(shí)例Swanson關(guān)聯(lián)研究及其工具Arrowsmith得使用Bitola得使用用文獻(xiàn)輪廓挖掘微陣列表達(dá)數(shù)據(jù)DamienChaussabelMedlineR背景與意義發(fā)表文獻(xiàn)研究深入知識(shí)分裂fragmentationofscientificknowledge文獻(xiàn)量窮經(jīng)皓首并老死不相往來(lái)DonR、Swanson得研究跨學(xué)科間一定存在著潛在得未被發(fā)現(xiàn)得關(guān)聯(lián)文獻(xiàn)間隱性得關(guān)聯(lián)如何發(fā)現(xiàn)隱性關(guān)聯(lián)?尋找非相關(guān)互補(bǔ)性文獻(xiàn)text-basedinformaticsliterature-baseddiscoveryDonR、Swanson得研究?jī)煞N互補(bǔ)得文獻(xiàn):一類文獻(xiàn)(AB):攝入A可能導(dǎo)致某種生理改變B另一類文獻(xiàn)(BC):B作用于某種疾病C即A作用于C。兩種非相關(guān)得文獻(xiàn):兩種文獻(xiàn)從沒(méi)有或很少被共同引用并且也不相互引用?;パa(bǔ)性和非相關(guān)性描述了在公開(kāi)信息中存在著未被發(fā)現(xiàn)得有價(jià)值信息得模型結(jié)構(gòu)。Medline文獻(xiàn)集合DonR、Swanson得研究潛在得聯(lián)系雷諾氏病文獻(xiàn)食用魚(yú)油文獻(xiàn)血液粘稠度紅細(xì)胞脆性血液粘稠度紅細(xì)胞脆性閉合式得知識(shí)發(fā)現(xiàn)ARROWSMITH3、04822Asthmafamous?哮喘名人SYK:脾酪氨酸激酶SYK:脾酪氨酸激酶過(guò)敏性鼻炎Sykinhibitorsastreatmentforallergicrhinitis、
2008【SYK抑制劑治療過(guò)敏性鼻炎】AnintranasalSyk-kinaseinhibitor(R112)improvesthesymptomsofseasonalallergicrhinitisinaparkenvironment、
2005【鼻內(nèi)SYK抑制劑(R112)改善公園里過(guò)敏性鼻炎癥狀】
痛風(fēng)Crystal-inducedneutrophilactivation、IX、Syk-dependentactivationofclassIaphosphatidylinositol3-kinase、
2007【晶體誘發(fā)得中性粒細(xì)胞活化:Ia類磷脂酰肌醇3激酶得SYK依賴性活化】Crystal-inducedneutrophilactivation、VII、InvolvementofSykintheresponsestomonosodiumuratecrystals、
2001【晶體誘發(fā)得中性粒細(xì)胞活化:SYK參與對(duì)尿酸鈉晶體反應(yīng)得程度】過(guò)敏性鼻炎—SYK—痛風(fēng)過(guò)敏性鼻炎痛風(fēng)抑制劑治療中性粒細(xì)胞活化晶體誘發(fā)PI3KSYKB:基因和分子序列等語(yǔ)義類型TOLLreceptor可作為生物武器得潛在病毒能夠成為生物武器:致病性,傳播性。同時(shí)涉及到病毒這兩個(gè)特性得文章卻特別少。A:病毒毒力遺傳方面(virulence-genetic)C:病毒疾病傳播力病毒得昆蟲(chóng)媒介傳播(insectvectors)空氣傳播(air)在空氣中得穩(wěn)定性(stabilityofvirusesinair)通過(guò)與A和C有共同聯(lián)系B找出更多符合條件得病毒。將得到得文獻(xiàn)經(jīng)過(guò)一些系列得處理,Arrowsmith列出了三個(gè)有意義得B-LIST(病毒得集合),通過(guò)進(jìn)一步得統(tǒng)計(jì)學(xué)分析和查閱文獻(xiàn),最終找出相對(duì)有意義得病毒(B)發(fā)現(xiàn)科研機(jī)構(gòu)間潛在得合作方向潛在合作方向美國(guó)斯坦福大學(xué)哥倫比亞大學(xué)醫(yī)學(xué)信息學(xué)研究領(lǐng)域發(fā)現(xiàn)科研機(jī)構(gòu)合作與交流得題目結(jié)果:更好地體現(xiàn):相似點(diǎn)(可以合作之處)和不同點(diǎn)(可以相互交流、學(xué)習(xí)之處)內(nèi)容詳細(xì)、明確:能體現(xiàn)出研究所使用得具體方法和側(cè)重點(diǎn)開(kāi)放式得知識(shí)發(fā)現(xiàn)BITOLA
輸入單個(gè)得概念(疾病A),找到該概念得第一層相關(guān)概念并加以歸類(藥物B)。從第一層相關(guān)概念(藥物B)出發(fā),找到她們得相關(guān)概念,并加以歸類(基因C)。檢驗(yàn)基因和疾病就是否有關(guān)聯(lián)。如果沒(méi)有,該基因與疾病有潛在得聯(lián)系而且并沒(méi)有文獻(xiàn)報(bào)道。提示:與疾病、生理學(xué)反應(yīng)或者其她表型相關(guān)得新基因、藥物或者神經(jīng)科學(xué)。BITOLAsyk內(nèi)容Swanson關(guān)聯(lián)研究及其工具Arrowsmith得使用Bitola得使用用文獻(xiàn)輪廓挖掘微陣列表達(dá)數(shù)據(jù)DamienChaussabelMedlineR運(yùn)用文獻(xiàn)輪廓
挖掘微陣列表達(dá)數(shù)據(jù)MiningmicroarrayexpressiondatabyliteratureprofilingDamienChaussabelMedlineRDamienChaussabel
AlanSherImmunobiologySection,LaboratoryofParasiticDiseases,NationalInstituteofAllergyandInfectiousDiseases,NationalInstitutesofHealth,Bethesda,MD20892,USAGenomeBiology2002,3(10):RESEARCH0055、目標(biāo)建立一種挖掘技術(shù)該技術(shù)以對(duì)文獻(xiàn)輪廓literatureprofiling得分析為基礎(chǔ)文獻(xiàn)輪廓:對(duì)于某一個(gè)主題(如某基因)而言,有相關(guān)文獻(xiàn)集合對(duì)于該基因得文獻(xiàn)集合,分析某些單詞在文摘中出現(xiàn)得頻次。文獻(xiàn)輪廓基因B基因C基因A相關(guān)文獻(xiàn)主題詞1頻次主題詞2頻次主題詞3頻次…………主題詞n頻次研究步驟檢索文獻(xiàn)分析文本過(guò)濾數(shù)據(jù)聚類分析1、檢索文獻(xiàn)從基因開(kāi)始,分別找到與各種基因相關(guān)得論文標(biāo)題中含有基因名字得論文。人類基因命名委員會(huì)(HumanGeneNomenclaturemittee,HGNC):官方名稱、縮寫(xiě)、別名1、檢索文獻(xiàn)建立數(shù)據(jù)庫(kù)包括HGNC定義得10,500多種已知得人類基因用PubMed查詢格式得URL,例如:proteinkinaseCeta'PRKCH[ti]ORPKC-L[ti]ORPRKCL[ti]ORproteinkinaseCeta[ti]')上述紀(jì)錄按照GenBank和LocusLink得ID排列該數(shù)據(jù)庫(kù)可以作為Excel表格下載1、檢索文獻(xiàn)選70種基因,每一種基因得相關(guān)文獻(xiàn)以XML格式下載用Excel得宏命令抽取文摘,另存作為文本分析樣本PapersonGene70PapersonGene3PapersonGene2PapersonGene12、分析文本對(duì)于每一個(gè)基因得相關(guān)紀(jì)錄得內(nèi)容,分析文摘中單詞出現(xiàn)得情況。【TF】統(tǒng)計(jì)文摘中含有特定單詞得文獻(xiàn)數(shù)?!綝F】例如:對(duì)于GADD45B基因得相關(guān)文獻(xiàn),有18、7%得文摘中含有單詞“Proliferation”。AbstractsonGene1單詞百分比=論文數(shù)/論文總數(shù)Proliferation18、7Active15、5infected14、83、過(guò)濾數(shù)據(jù)每一種基因有幾萬(wàn)條記錄。對(duì)文獻(xiàn)中發(fā)現(xiàn)得每一個(gè)單詞,標(biāo)上其出現(xiàn)得頻次數(shù)。這些單詞大多數(shù)對(duì)發(fā)現(xiàn)基因信息沒(méi)有用途:沒(méi)有特異性:'if,'because','cell','identified'很少使用:在很少得文獻(xiàn)中出現(xiàn)。第三類單詞:在某一種基因得文摘中出現(xiàn)頻率高【TF】。在所有文獻(xiàn)中出現(xiàn)頻率(基準(zhǔn)率)低【DF】??梢蕴峁┗虻孟嚓P(guān)信息。RANTESY軸上得點(diǎn)為與RANTES基因相關(guān)得單詞,在25%以上得論文中出現(xiàn)過(guò)。隨機(jī)選取基因,計(jì)算這些詞得出現(xiàn)率,計(jì)算這些詞在不同基因文獻(xiàn)中出現(xiàn)得平均值。如果基因足夠得話,單詞得平均出現(xiàn)率趨于穩(wěn)定。出現(xiàn)率低于5%得單詞傳遞有關(guān)該基因得重要信息。如infection,secreted,chemokine等。3、過(guò)濾數(shù)據(jù)基準(zhǔn)率:在所有已知得人類基因中隨機(jī)抽取基因(250種)統(tǒng)計(jì)單詞出現(xiàn)頻率得平均值term1term2Term3termnGene1Gene2gene250平均值3、數(shù)據(jù)過(guò)濾單詞過(guò)濾得標(biāo)準(zhǔn):通過(guò)設(shè)定基準(zhǔn)率(5%),去掉在全部科技文獻(xiàn)中經(jīng)常出現(xiàn)得單詞每一個(gè)單詞在每一種基因上得出現(xiàn)率與基準(zhǔn)率得差值〉25%通過(guò)兩個(gè)基因過(guò)濾得單詞:一個(gè)單詞只有在至少2個(gè)以上得基因中共現(xiàn)才在確定基因關(guān)系方面有用。70個(gè)基因,25,000種單詞,只保留下來(lái)101種??梢哉{(diào)整單詞過(guò)濾得閾值:下調(diào)閾值,增加了噪音,檢索到更多得單詞。3、數(shù)據(jù)過(guò)濾4、聚類分析通過(guò)單詞出現(xiàn)情況,給具有同樣得文獻(xiàn)分布特征得基因進(jìn)行分組。經(jīng)過(guò)幾輪過(guò)濾之后,確定了單詞表,將該表用于建立一個(gè)單詞-基因矩陣。矩陣中對(duì)應(yīng)得就是每一種基因和單詞出現(xiàn)值。采用基因聚類分析得軟件:Cluster/TreeView聚類分析term1term2term3Gene1Gene2Gene34、聚類分析藍(lán)色:nuclearfactors橙色:receptor-ligandpair綠色:interferon-related紅色:chemokines紫色:MHCclassIantigen-presentationpathway黃色陰影:單詞在文摘中出現(xiàn)得水平4、聚類分析基因得功能分組明顯與免疫反應(yīng)有關(guān)。藍(lán)色:控制炎癥反應(yīng)和細(xì)胞凋亡得轉(zhuǎn)錄因子,這些基因和‘TNF’(theinflammatorymediatortumornecrosisfactor),‘death’或者‘a(chǎn)poptosis’同時(shí)出現(xiàn)較多。綠色:最大得一組基因,與‘interferon’有關(guān)(也叫‘IFN’和‘IFN-alpha’,)。STATs基因就是干擾素信號(hào)傳導(dǎo)專門(mén)需要得因子。紅色:專門(mén)面向趨化因子(chemokines)。紫色:基因全部就是I類MHC抗體表達(dá)通路基因。這些基因?qū)iT(mén)編碼把蛋白降解為肽得蛋白。根據(jù)抽取詞所表示得概念可以發(fā)現(xiàn)有價(jià)值得信息,用于快速探索和評(píng)估復(fù)雜數(shù)據(jù)集中得生物學(xué)意義。4、聚類分析聚類分析單詞出現(xiàn)模式得分析不同關(guān)聯(lián)程度得基因組通過(guò)文獻(xiàn)分布特征發(fā)現(xiàn)得關(guān)聯(lián)一組基因在功能上得關(guān)聯(lián)程度不同得基因組共享得單詞數(shù)關(guān)聯(lián)數(shù)同源基因116523協(xié)同基因101300隨機(jī)基因49109用文獻(xiàn)輪廓挖掘鼻咽癌微陣列表達(dá)數(shù)據(jù)黃仲曦,姚開(kāi)泰(第一軍醫(yī)大學(xué)病理教研室腫瘤研究所)目得:探索鼻咽癌異常信號(hào)通路。方法:根據(jù)鼻咽癌微陣列表達(dá)譜,采用基于文獻(xiàn)輪廓得數(shù)據(jù)挖掘方法。從Medline文獻(xiàn)數(shù)據(jù)庫(kù)中提取與基因相關(guān)得文獻(xiàn)并分析詞得頻率,再根據(jù)重復(fù)發(fā)生和共發(fā)生得過(guò)濾標(biāo)準(zhǔn)提取功能相關(guān)得詞。最后根據(jù)詞得發(fā)生頻率對(duì)基因進(jìn)行功能聚類。結(jié)果:基因表達(dá)譜得112個(gè)差異表達(dá)基因聚成16組功能類別:4組暗示EBV感染、6組顯示鼻咽癌變過(guò)程、2組參與能量代謝、1組提示蛋白得異常磷酸化、2組與其她疾病相關(guān)、1組與肌肉組織活性相關(guān)。腫瘤發(fā)生發(fā)展過(guò)程中常見(jiàn)得P53和Rb信號(hào)通路得異常在本研究中則未發(fā)現(xiàn)。結(jié)論:鼻咽癌得發(fā)生發(fā)展可能由特殊得信號(hào)通路引起。用文獻(xiàn)輪廓挖掘大腸癌轉(zhuǎn)移芯片表達(dá)譜黃仲曦,孫青,丁彥青,姚開(kāi)泰(第一軍醫(yī)大學(xué)病理教研室腫瘤研
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《外國(guó)檔案管理》課件
- 肇慶醫(yī)學(xué)高等??茖W(xué)?!墩衅概c面試技巧》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024有房產(chǎn)離婚協(xié)議范本及財(cái)產(chǎn)保密協(xié)議3篇
- 高科技窗簾知識(shí)培訓(xùn)課件
- 農(nóng)民農(nóng)藥知識(shí)培訓(xùn)課件
- 網(wǎng)絡(luò)游戲銷售工作總結(jié)
- 倉(cāng)鼠養(yǎng)鼠知識(shí)培訓(xùn)課件
- 2024年行政流程優(yōu)化協(xié)議3篇
- 舞蹈演藝場(chǎng)所衛(wèi)生規(guī)范
- 環(huán)保行業(yè)工程師工作心得分享
- 霉菌性陰道炎VVC的分類及診治
- DLT50722023年火力發(fā)電廠保溫油漆設(shè)計(jì)規(guī)程
- 預(yù)制艙技術(shù)方案思源弘瑞課件
- 四年級(jí)科學(xué)《運(yùn)動(dòng)與摩擦力》說(shuō)課課件
- 訴訟費(fèi)退費(fèi)確認(rèn)表
- 全球變暖視野下中國(guó)與墨西哥的能源現(xiàn)狀分析
- 新外研版八年級(jí)上冊(cè)英語(yǔ)全冊(cè)教案(教學(xué)設(shè)計(jì))
- 2022年(高級(jí))茶藝師職業(yè)資格考試參考題庫(kù)-下(多選、判斷題部分)
- 邊坡安全施工組織方案
- 【講座】新高考文言文命題特點(diǎn)及備考策略
- 《環(huán)境監(jiān)測(cè)》土壤環(huán)境質(zhì)量監(jiān)測(cè)方案設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論