成年線蟲高分辨率圖像的自動(dòng)標(biāo)注_第1頁
成年線蟲高分辨率圖像的自動(dòng)標(biāo)注_第2頁
成年線蟲高分辨率圖像的自動(dòng)標(biāo)注_第3頁
成年線蟲高分辨率圖像的自動(dòng)標(biāo)注_第4頁
成年線蟲高分辨率圖像的自動(dòng)標(biāo)注_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

成年線蟲高分辨率圖像的自動(dòng)標(biāo)注什么是秀麗隱桿線蟲秀麗隱桿線蟲(Caenorhabditiselegans)是一種能夠在溫和環(huán)境中獨(dú)立生存的土壤線蟲,以微生物如大腸桿菌(E.coli)等為食,有雄性及雌雄同體(hermaphrodite)兩種性別。自然界中,絕大多數(shù)個(gè)體為雌雄同體,雄性僅占0.05%秀麗隱桿線蟲的優(yōu)勢線蟲是一種非常簡單多細(xì)胞真核生物。線蟲結(jié)構(gòu)簡單且通身透明體細(xì)胞數(shù)目恒定,雌雄同體的成蟲含有959個(gè)體細(xì)胞和約2000個(gè)生殖細(xì)胞;雄性成蟲有1031個(gè)體細(xì)胞和約1000個(gè)生殖細(xì)胞線蟲生命周期短,從一個(gè)受精卵發(fā)育成可以產(chǎn)卵的成蟲只需要兩三天,節(jié)約了實(shí)驗(yàn)所消耗的時(shí)間由于具有雄性和雌雄同體這兩種性別,線蟲在遺傳研究上具有無可比擬的優(yōu)勢秀麗隱桿線蟲的生命周期研究秀麗隱桿線蟲的意義線蟲在生命科學(xué)的各個(gè)領(lǐng)域,包括胚胎發(fā)育、性別決定、細(xì)胞凋亡、行為與神經(jīng)生物學(xué)等的研究中得到廣泛應(yīng)用。在MAPK信號(hào)傳導(dǎo)、細(xì)胞程序性死亡、TGF-β信號(hào)傳遞途徑、RNAi干擾和smallRNA、衰老和壽命及脂肪代謝等方面取得了重大突破??梢娋€蟲作為模式生物對(duì)于生命科學(xué)領(lǐng)域具有非凡的意義。組合優(yōu)化問題介紹三要素:變量,約束和目標(biāo)函數(shù)變量:求解過程中選定的基本參數(shù)約束:對(duì)變量取值的限制目標(biāo)函數(shù):可行方案衡量標(biāo)準(zhǔn)的函數(shù)目標(biāo):從組合問題的可行解集中求出最優(yōu)解組合優(yōu)化問題介紹組合優(yōu)化問題是在給定的約束條件下,求目標(biāo)函數(shù)最優(yōu)值(最小值或最大值)的問題。組合優(yōu)化問題的一個(gè)實(shí)例可以表示為一個(gè)對(duì)偶(S,f),其中解空間S為可行解集,目標(biāo)函數(shù)f是一個(gè)映射,定義為f:S->R求目標(biāo)函數(shù)最小值的問題稱為最小化向題,記為minf(i),i屬于S同理,求目標(biāo)函數(shù)最大值的同題稱為最大化間題,記為maxf(i),i屬于S算法提出的意義過去標(biāo)定秀麗隱桿線蟲圖像上的細(xì)胞是手動(dòng)分割的,這非常的單調(diào)并且耗時(shí)之前偶匹配算法是適用于L1狀態(tài)(第一幼蟲時(shí)期),它是基于位置的算法,L1時(shí)期細(xì)胞位置和數(shù)目是相對(duì)固定的。但是到成蟲期,細(xì)胞數(shù)目急劇增長,細(xì)胞種類和空間位置也發(fā)生明顯變化,故在成蟲期不適用本文算法介紹本文作者將成年線蟲的細(xì)胞標(biāo)定問題轉(zhuǎn)為為組合優(yōu)化問題,該算法基于先前的偶匹配算法,但豐富了評(píng)價(jià)函數(shù)。加入了諸如細(xì)胞尺寸,鄰里密度等特征然后,作者介紹了利用最小損失最大流來解決組合優(yōu)化問題,并且運(yùn)用一種基于交叉熵–基學(xué)習(xí)算法來調(diào)節(jié)模型的參數(shù),提高匹配正確率上圖是成年線蟲在Z軸上的投影,藍(lán)色部分有由DAPI染色,代表細(xì)胞中的DNA,綠色是由綠色熒光蛋白(GFP)染色,代表細(xì)胞核算法的表示將細(xì)胞標(biāo)定問題轉(zhuǎn)化為組合優(yōu)化問題假設(shè)圖像中有p個(gè)細(xì)胞

(它們的位置和邊界已經(jīng)在預(yù)處理中提?。1硎疚覀兿MA(yù)測每個(gè)細(xì)胞所對(duì)應(yīng)的標(biāo)簽,表示的候選標(biāo)簽代表那些沒有被標(biāo)定細(xì)胞,等代表訓(xùn)練集中q種由專業(yè)人員標(biāo)定的不同細(xì)胞。于是給每個(gè)細(xì)胞決定的任務(wù)就變成了如下組合優(yōu)化問題:(i)每個(gè)細(xì)胞只分配一個(gè)來自的標(biāo)簽(ii)每個(gè)標(biāo)簽只分配給每個(gè)細(xì)胞(iii)這個(gè)未指定的標(biāo)簽可能對(duì)應(yīng)了多個(gè)細(xì)胞算法的表示是一個(gè)矩陣,當(dāng)細(xì)胞和標(biāo)簽相匹配時(shí),將置1,否則置0。同樣的,是由可能的細(xì)胞標(biāo)簽分配所組成的損失函數(shù),最后,問題可表示為:

subjectto

注:上面的這些限制確保了每個(gè)細(xì)胞只能分配惟一的標(biāo)簽,反過來也是一樣

損失矩陣的定義眾所周知損失值是算法重要因素。所以我們相對(duì)之前的算法考慮了更多的特征,列舉如下:(1)細(xì)胞位置(2)細(xì)胞尺寸(3)GFP表達(dá)水平(4)DAPI強(qiáng)度(5)附近細(xì)胞(6)細(xì)胞形狀所有上面的因素都是專業(yè)標(biāo)定師在標(biāo)定成熟線蟲所考慮的特征損失矩陣的定義這里,我們先單獨(dú)考慮細(xì)胞的位置(其他的特征的損失矩陣類似)。假設(shè)我們已經(jīng)得到了線蟲圖像的訓(xùn)練集我們用表示在標(biāo)準(zhǔn)蟲坐標(biāo)空間的3D向量坐標(biāo),每一維都是零均值和方差。損失矩陣的一種表示方法是馬氏距離:

(2)

表示是一個(gè)3D向量,它表示具有標(biāo)簽訓(xùn)練細(xì)胞位置的平均值表示樣本位置的協(xié)方差矩陣,當(dāng)然上述表達(dá)式可簡寫為

(3)這里的均值和方差都是由基于來自訓(xùn)練數(shù)據(jù)中標(biāo)簽為細(xì)胞估計(jì)的。最后,損失函數(shù)可以表示為:

(4)這里,是(log)權(quán)值。最后,損失函數(shù)可以表示為:組合優(yōu)化算法的求解-最小損失一種方法是應(yīng)用直接的最大權(quán)值的二分匹配。該算法主要思想是構(gòu)造一個(gè)二分圖,圖的兩邊各包含p個(gè)節(jié)點(diǎn)。左邊空間每個(gè)節(jié)點(diǎn)代表每個(gè)輸入細(xì)胞右邊空間每個(gè)節(jié)點(diǎn)代表每個(gè)非空標(biāo)簽以及p-q個(gè)代表空標(biāo)簽的左邊空間第i個(gè)節(jié)點(diǎn)與右邊空間第j個(gè)節(jié)點(diǎn)匹配的開銷記為求最小損失匹配最終的復(fù)雜度為,是比較耗時(shí)的算法本文算法在求解最小損失的復(fù)雜度為,該算法很靈活,允許我們進(jìn)一步的拓展來處理細(xì)胞分裂的特殊情況本文算法-最小損失最大流問題構(gòu)造一個(gè)有向圖G=(V,E)包括p個(gè)輸入細(xì)胞節(jié)點(diǎn)(表示)q+1個(gè)節(jié)點(diǎn)代表細(xì)胞的可能標(biāo)簽()還有2個(gè)節(jié)點(diǎn)s和t,分別代表源和底邊包括以下幾方面:(1)表示從源節(jié)點(diǎn)到第i個(gè)輸入細(xì)胞的節(jié)點(diǎn)的邊(2)表示第i個(gè)輸入細(xì)胞節(jié)點(diǎn)到第j個(gè)標(biāo)簽節(jié)點(diǎn)的邊(3)第j個(gè)標(biāo)簽節(jié)點(diǎn)到底節(jié)點(diǎn)邊每條邊(a,b)都有一個(gè)下限,一個(gè)上限,損失我們規(guī)定:前兩行約束確保所有的細(xì)胞和非空標(biāo)簽都匹配一次,第三行確保有p-q個(gè)細(xì)胞匹配空標(biāo)簽最后一行指細(xì)胞匹配標(biāo)簽的損失本文算法算法的最小損失最大流問題可以表示如下:

subjectto這里代表了每個(gè)節(jié)點(diǎn)標(biāo)記后的補(bǔ)充值,表示如下ifu=sifu=totherwise這里,表示用標(biāo)簽注釋細(xì)胞分裂細(xì)胞的注釋雖然成年線蟲的細(xì)胞譜系是已知的,基本上是固定的,但是仍然有例外,尤其是本文數(shù)據(jù)中每個(gè)線蟲有四個(gè)細(xì)胞可能會(huì)經(jīng)歷一次細(xì)胞分裂,分別在P={143,146,149,152}

對(duì)于標(biāo)簽為j的母細(xì)胞,其子女細(xì)胞可表示為{j+1,j+2}我們通過增加點(diǎn)和邊來改變前面的二分圖,對(duì)于每個(gè)母細(xì)胞j,創(chuàng)建兩個(gè)‘決定”節(jié)點(diǎn),創(chuàng)建的邊如下表示:修改:原先所有直接從到底節(jié)點(diǎn)t的應(yīng)該刪除空標(biāo)簽到底節(jié)點(diǎn),約束修改為r表示可以進(jìn)行分裂的母細(xì)胞的個(gè)數(shù),這里r=4

分裂細(xì)胞的注釋‘決定”節(jié)點(diǎn)被用來加強(qiáng)互斥約束。例如右圖中確保了母節(jié)點(diǎn)或子節(jié)點(diǎn)在最后的注釋顯示出來,同樣的,同樣的,決定是否注釋特別地,如果被注釋了,確保也被注釋。同樣的,如果沒有被注釋,即母細(xì)胞沒有分裂,那么確保母細(xì)胞被注釋實(shí)驗(yàn)結(jié)果訓(xùn)練數(shù)據(jù):成年雌雄同體線蟲25天的圖像,這些圖像同樣被DAPI和GFP染色。每張圖像都被注釋了142標(biāo)簽包括腸道,肌肉和皮下細(xì)胞,另外,一同被注釋的還有經(jīng)歷分裂的細(xì)胞和12個(gè)特殊的額外細(xì)胞,我們從這些細(xì)胞中提取位置,尺寸等特征。1、采用五倍交叉驗(yàn)證的未經(jīng)訓(xùn)練的匹配方法上表是利用五倍交叉驗(yàn)證每個(gè)單獨(dú)細(xì)胞注釋的結(jié)果:用20組線蟲訓(xùn)練,預(yù)測剩下的5組表中前兩行表示模型單獨(dú)用"位置"特征,不包括未標(biāo)記的細(xì)胞損失時(shí)(loc-),模型得到了平均每只線蟲36%的正確率,否則即(loc+)得到了41%的正確率。其他的在表中可以看出。實(shí)驗(yàn)結(jié)果2、使用經(jīng)過訓(xùn)練的特征權(quán)值為了提高單個(gè)線蟲的平均正確率,在以上方法的基礎(chǔ)上對(duì)損失函數(shù)的權(quán)值進(jìn)行訓(xùn)練,結(jié)果如下:

上表是包括了未標(biāo)簽細(xì)胞的損失,且包括所有特征(full+)從表中數(shù)據(jù)可以看出,相比用平均特征權(quán)重,使用訓(xùn)練后的特征權(quán)重單個(gè)線蟲和細(xì)胞的正確率上升了,達(dá)到了77%。實(shí)驗(yàn)結(jié)果黑色代表未經(jīng)訓(xùn)練的并且只包含位置特征模型,灰色代表未經(jīng)訓(xùn)練的全特征模型,白色代表使用了經(jīng)過訓(xùn)練后的全特征模型從表中可以看出,僅僅使用位置特征的模型正確率中位數(shù)為35%,對(duì)于訓(xùn)練后的模型它為84%。(平均值為77%)。實(shí)驗(yàn)結(jié)果使用網(wǎng)絡(luò)流識(shí)別分裂細(xì)胞的正確率由前面知識(shí)可知:每只線蟲只有4個(gè)細(xì)胞可能發(fā)生分裂本次試驗(yàn)中,我們觀察到54處腸細(xì)胞經(jīng)歷了細(xì)胞分裂,在25個(gè)線蟲中只有3個(gè)線蟲的四個(gè)細(xì)胞沒有發(fā)生分裂。Ventral9andVentral10代表兩個(gè)腹側(cè)細(xì)胞,Dorsal9andDorsal10代表兩個(gè)背腸細(xì)胞由表可知,總體的正確率為80%。背腸細(xì)胞的正確率分別為80%和88%。最具有挑戰(zhàn)性的是Ventral9,只取得了72%的正確率。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論