版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、自然場(chǎng)景下的文本定位圖像在人類的視覺(jué)中起著重要的作用,文本是圖像的一種重要信息源,在自然場(chǎng)景中,各種車牌、路標(biāo)、樓層、商場(chǎng)指示牌、標(biāo)語(yǔ)等為人們的生活提供重要信息,捕獲并識(shí)別這些文字信息具有重要意義。一般來(lái)說(shuō)影響文本定位的因素主要有以下幾點(diǎn):圖像中的文本具有不同顏色、大小、排列方向;拍攝圖像時(shí)抖動(dòng)或者焦距不合適導(dǎo)致拍攝的文本模糊不清;光照不均勻?qū)е峦晃谋緟^(qū)域中的字符顏色不一致;文本與背景的顏色對(duì)比度低導(dǎo)致圖像處理時(shí)分割困難;圖像中的文本是多種文本組成的,字符間筆畫(huà)差異大;復(fù)雜背景中有很多物體類似于字符,比如樹(shù)葉、窗戶等;場(chǎng)景文本有的與背景中的一些物體相連接,導(dǎo)致后續(xù)處理時(shí)分割錯(cuò)誤。針對(duì)這些問(wèn)題
2、,各個(gè)學(xué)者根據(jù)不同的影響因素提出了不同的文本定位方法,該文重點(diǎn)對(duì)當(dāng)前文本定位的一般過(guò)程、重要方法進(jìn)行分類分析,指出了它的優(yōu)勢(shì)和缺點(diǎn)。1 文本定位的基本流程2 文本定位的主要方法文本定位是指從復(fù)雜背景圖像中找出其中文本所在的位置。根據(jù)文本的特征:顏色特征、字符大小、字符邊緣、字符間距、紋理特征等,文本定位方法通常分為以下幾類:基于連通區(qū)域的方法、基于紋理的方法、基于邊緣的方法、基于邊和角點(diǎn)的方法、基于機(jī)器學(xué)習(xí)的方法。2.1 基于連通區(qū)域的方法圖像連通區(qū)域是利用文本區(qū)域具有相似的字符顏色和大小這一特性來(lái)進(jìn)行定位,它具有整體性,通常是用顏色聚類或圖像閾值化法生成連通域,再根據(jù)候選連通域的大小、寬高比
3、等特征使用先驗(yàn)知識(shí)限制來(lái)獲得文本區(qū)域。Kim3利用顏色聚類方法把圖像分割成許多個(gè)區(qū)域塊,然后根據(jù)文本的基本特征去除明顯的非文本區(qū),如狹長(zhǎng)的線段、不連通的邊框等,利用投影分析法進(jìn)一步提取文本區(qū)域,最后將這些文本區(qū)域基于先驗(yàn)知識(shí)規(guī)則進(jìn)行合并。但是由于過(guò)程中的一些閾值需要根據(jù)先前經(jīng)驗(yàn)來(lái)決定,所以這個(gè)方法的通用性不強(qiáng)。CunzhaoShi等人4使用MSERt立圖模型方法定位文本,首先對(duì)原圖像進(jìn)行MSER僉測(cè)得到連通分量,然后構(gòu)建圖模型,其中MSER蚱為圖的節(jié)點(diǎn),并且對(duì)圖定義一個(gè)成本函數(shù),通過(guò)圖割算法最小化成本函數(shù)。Soo-changPei5等人對(duì)輸入圖像進(jìn)行顏色量化采用自組織神經(jīng)網(wǎng)絡(luò),然后根據(jù)三維彩色
4、直方圖對(duì)圖像進(jìn)行二值化,首先設(shè)置一個(gè)合適的梯度閾值,當(dāng)某一顏色處的梯度大于該閾值時(shí),就認(rèn)為該顏色可能是文本顏色,并將該顏色所占區(qū)域賦值為1;當(dāng)某一處顏色的梯度小于閾值時(shí),就認(rèn)為該顏色可能是非文本顏色,就將該顏色所占區(qū)域賦值為0,從而得到很多個(gè)二值圖像區(qū)域塊。再對(duì)各個(gè)二值子圖像進(jìn)行形態(tài)學(xué)處理、連通域分析,得到文本區(qū)域,該算法的魯棒性較強(qiáng)。顏色特征提取文本區(qū)域的優(yōu)點(diǎn)是顏色對(duì)圖像區(qū)域的方向、大小等變化不敏感,通常對(duì)噪聲、圖像的分辨率、尺寸和方向等的變化具有很強(qiáng)的魯棒性,是絕大多數(shù)基于內(nèi)容的圖像和視頻檢索的多媒體數(shù)據(jù)庫(kù)中使用的特征之一。顏色特征提取的缺點(diǎn)是容易受到復(fù)雜背景的影響,對(duì)于文本與背景對(duì)比度低
5、的較小字符很難定位,針對(duì)這個(gè)問(wèn)題,PalaihnaknoteShivakumara等人6提出了應(yīng)用于多方向文本的Fourier-Laplacian方法,對(duì)輸入圖像首先進(jìn)行傅立葉拉普拉斯濾波平滑噪聲,然后運(yùn)用形態(tài)學(xué)開(kāi)運(yùn)算和最大值不同取得文本簇和非文本簇,再細(xì)化文本簇,并把復(fù)雜的文本簇分割成多個(gè)簡(jiǎn)單的子文本簇,最后根據(jù)文本邊緣密度和文本邊緣線較直而非文本邊緣線較彎曲規(guī)則來(lái)排除非文本區(qū)域,此方法能有效地提取圖片文本和場(chǎng)景文本,無(wú)論是水平文本還是非水平文本,都能較好的定位,但是理想的低通濾波的閾值不固定,不同的視頻或者圖片低通濾波閾值不同,該方法的可移植性不太好。2.2 基于紋理的文本定位方法如果把圖
6、像中的文本看作是一種特殊的紋理,則非文本區(qū)域的紋理特征和已知文本區(qū)域的紋理特征不同,對(duì)各個(gè)區(qū)域的紋理特征分析,獲得空域或頻域的紋理特征就可以判斷該區(qū)域是否是文本區(qū)域?;诩y理的文本定位方法檢測(cè)大小不同字符的方法通常有兩種:金字塔分解或者小波分解原始圖像,然后對(duì)每一層子圖像都進(jìn)行類似處理得到文本區(qū)域,最后融合到原始圖像上。統(tǒng)計(jì)分析描述法是最常用的紋理分析方法,該方法通過(guò)統(tǒng)計(jì)圖像的邊界頻率、空間灰度依賴關(guān)系以及空間頻率等來(lái)分析紋理,被廣泛應(yīng)用的二階紋理統(tǒng)計(jì)算法如:灰度共生矩陣7,該方法通過(guò)統(tǒng)計(jì)滿足特定灰度值和特定位移關(guān)系的像素點(diǎn)對(duì)發(fā)生的概率來(lái)構(gòu)造對(duì)稱矩陣,是鄰近像素之間的角度函數(shù)以及鄰近像素之間的
7、距離函數(shù),圖像灰度有關(guān)方向和間隔等整體信息通過(guò)統(tǒng)計(jì)學(xué)中的概率反映出來(lái)。在許多的紋理特征中,并不是每一個(gè)紋理特征都非常有效果,有些特征計(jì)算復(fù)雜度較高。Chen8針對(duì)文本區(qū)域特征主要提取三類窗口的紋理特征:子窗口中特定模式均值和方差以及梯度的均值和方差;子窗口中去除邊緣點(diǎn)的直方圖;子窗口中長(zhǎng)邊緣的個(gè)數(shù)。然后用信息熵選擇更有效的特征,選擇之后使用一個(gè)適當(dāng)?shù)姆诸惼鲗?duì)每個(gè)子窗口進(jìn)行分類。ZhouYatong9等人利用DC餞換來(lái)提取視頻每一幀的紋理特征,把DCT系數(shù)作為文本紋理特征值,然后使用RMPhfr類器獲取分類超平面對(duì)各個(gè)文本塊進(jìn)行分類,并且分別統(tǒng)計(jì)背景DCT塊的數(shù)目和文本DCT的數(shù)目,得到DCT的
8、分布曲線圖,根據(jù)分布曲線圖變化情況來(lái)判定視頻是否包含文本。1.1 irmala10描述了一種基于RGBa道的Gabor濾波紋理分析方法區(qū)分文本和非文本區(qū)域.每個(gè)顏色通道都經(jīng)過(guò)一個(gè)二維Gabor濾波器在四個(gè)方向上轉(zhuǎn)換成頻率在0.07-0.1之間的高頻,這樣提取的每種紋理對(duì)應(yīng)的主要頻率成分經(jīng)過(guò)頻-時(shí)域變換就實(shí)現(xiàn)了紋理提取。然后根據(jù)每個(gè)通道的過(guò)濾響應(yīng)把子過(guò)濾通道進(jìn)行合并,形成候選文本區(qū)域。該方法有效地降低了紋理之間頻譜混跌造成的影響,在紋理頻譜類間離散度高和方向性強(qiáng)的圖像中有一定的適用性。作為一種統(tǒng)計(jì)特征,紋理特征通常具有旋轉(zhuǎn)不變性,因此基于紋理的分割方法具有一定的通用性,并且對(duì)于噪聲有較強(qiáng)的抵抗能
9、力。但是經(jīng)常會(huì)出現(xiàn)文本區(qū)域與背景中的一些物體邊緣相黏連的情況,這種情況就很難找出文本區(qū)域的精確邊界。另外,紋理特征是在包含多個(gè)像素點(diǎn)的區(qū)域中進(jìn)行統(tǒng)計(jì)計(jì)算,不是基于像素點(diǎn)的特征,因此當(dāng)圖像的分辨率發(fā)生變化時(shí),所計(jì)算出來(lái)的紋理可能會(huì)有較大偏差。再者,原始圖像有可能受多種因素的影響,比如:光照、反射因素,從二維圖像中得到的紋理不一定是三維物體表面真實(shí)的紋理。2.3 基于邊緣的文本定位方法人眼在觀察一幅圖像時(shí),圖像的輪廓是最先得到的信息。圖像中灰度變化較大的邊緣區(qū)域其梯度值大,在灰度變化平緩的區(qū)域其梯度值較小,而在灰度均勻區(qū)域其梯度值為零,圖像的邊緣是圖像中灰度發(fā)生急劇變化的區(qū)域邊界,因此圖像灰度的變
10、化情況可以用梯度來(lái)反映,一般常用一階和二階導(dǎo)數(shù)來(lái)檢測(cè)邊緣,比如:高斯-拉普拉斯算子邊緣檢測(cè)、Roberts邊緣檢測(cè)、Sobel邊緣檢測(cè)、Prewitt邊緣檢測(cè)、Canny邊緣檢測(cè)等,由于文本區(qū)域有較高邊緣密度,利用這一特性可以實(shí)現(xiàn)文本信息提取。ZhaoXu等人11針對(duì)視頻中的文本采用Canny過(guò)濾器和邊緣平滑處理方法檢測(cè)視頻圖像中水平和垂直方向的邊緣,得到候選文本區(qū)域,然后使用灰度梯度、梯度特征、SV泌類器來(lái)驗(yàn)證真正的文本區(qū)域。MaLong12利用harr小波分析法對(duì)輸入圖像進(jìn)行小波變換得到垂直、水平、對(duì)角線邊緣。利用動(dòng)態(tài)閾值化方法對(duì)這些邊緣進(jìn)行分割,去除一些非文本的邊緣,再對(duì)每個(gè)邊緣進(jìn)行形態(tài)
11、學(xué)的擴(kuò)張,利用文本區(qū)域邊緣比較密集的特性,用一個(gè)“與”操作來(lái)排除一些非文本的區(qū)域。該方法相對(duì)而言實(shí)現(xiàn)簡(jiǎn)單,速度較快,但是只能用在背景相對(duì)簡(jiǎn)單的圖像中,對(duì)單一的字符定位效果不是很好。M.Basavanna等人13采用Sobel算子提取圖像邊緣,然后根據(jù)字符邊緣間的距離大小固定的規(guī)則,使用邊緣增長(zhǎng)計(jì)算水平方向字符邊緣間距的大小,為了解決字符與字符之間邊緣間距很小造成的字符粘連問(wèn)題,采用零交叉點(diǎn)的方法。但是該方法對(duì)彎曲邊緣線和圖像中包含不同方向文本線的圖像不適用,因?yàn)榱憬徊纥c(diǎn)法要求是水平文本圖像。QiaoYusun等人14從人的視覺(jué)為切入點(diǎn),通常情況下,文本筆畫(huà)有四個(gè)方向:水平、垂直、右上、左上,用
12、Sobel算子檢測(cè)水平和垂直方向的筆畫(huà)邊緣用脊邊緣檢測(cè)器檢測(cè)450和1350方向的字符邊緣,四個(gè)邊緣子圖組合成一個(gè)完整的邊緣圖,然后利用邊緣方向的直方圖進(jìn)行連通分量過(guò)濾,過(guò)濾去除非文本區(qū)域,最后合并連通區(qū)域并鑒別候選文本區(qū)域。因?yàn)檫@種方法對(duì)于字體大小、空間對(duì)齊、背景復(fù)雜度有魯棒性,所以從復(fù)雜的背景中定位文本是有效的。Hua15等人針對(duì)視頻圖像中的文本提出相應(yīng)的檢測(cè)方法,首先把圖像中所有的角點(diǎn)提取出來(lái),然后把一些孤立的角點(diǎn)去除,合并剩余角點(diǎn)形成候選文本區(qū)域。其次,利用Sobel算子計(jì)算取得文本候選區(qū)域的邊緣圖。最后,根據(jù)邊緣圖的特征去除偽文本區(qū)域,因?yàn)闈h字字符區(qū)域具有強(qiáng)烈的邊角特征,所以該方法對(duì)
13、視頻圖像中的中文字符檢測(cè)效果比較好。基于邊緣特征的文本檢測(cè)方法時(shí)間復(fù)雜性比較低,實(shí)時(shí)應(yīng)用時(shí)的效率較高,但是該方法根據(jù)邊緣密度來(lái)定位文本,而大字符的邊緣密度較小,因此不適合檢測(cè)包含大字符的文本區(qū)域。2.4 基于邊/角的方法一般來(lái)說(shuō)文本區(qū)域含有豐富的角和邊的信息,因此可以通過(guò)邊/角的檢測(cè)、提煉和合并來(lái)搜索文本區(qū)域。邊和角點(diǎn)信息相對(duì)于對(duì)比度、字體顏色、字體大小的文本特征是獨(dú)立的,因此邊和角點(diǎn)與文本其他特征相比更可靠。邊/角有兩個(gè)特征:邊/角的強(qiáng)度和邊/角的密度?;谶叺姆椒?617,通過(guò)對(duì)邊強(qiáng)度的投影分析來(lái)分割文本區(qū)域?;诮屈c(diǎn)的方法,通常使用Harris角點(diǎn)檢測(cè)和SUSAN!點(diǎn)檢測(cè)得到角點(diǎn)圖像,然
14、后根據(jù)文本區(qū)域的角點(diǎn)密度等特性分析角點(diǎn)圖像,進(jìn)一步對(duì)角點(diǎn)求精和合并,得到文本區(qū)域。FengZengguang18等人利用SUSAN1點(diǎn)檢測(cè)實(shí)現(xiàn)目標(biāo)跟蹤,目標(biāo)區(qū)域內(nèi)角點(diǎn)具有較強(qiáng)的目標(biāo)表征能力,使用這些角點(diǎn)構(gòu)建目標(biāo)模型,增強(qiáng)目標(biāo)與背景區(qū)域之間的辨別力,削弱了背景信息對(duì)目標(biāo)定位的干擾。該算法在信噪比較高情況下角點(diǎn)檢測(cè)效果較好,算法自身運(yùn)算量小,非常適合于實(shí)時(shí)應(yīng)用,但是該算法需要人為地選取灰度差閾值T,而T的設(shè)定只能通過(guò)大量的實(shí)驗(yàn)來(lái)獲得,因此在復(fù)雜圖像或者圖像對(duì)比度變化較大的情況下,該方法直接影響角點(diǎn)提取的效果。TianHongliang19聯(lián)合Harris與SUSAN!點(diǎn)檢測(cè)算法。該算法確定角點(diǎn)檢測(cè)
15、區(qū)域使用改進(jìn)特征點(diǎn)提取算法和特征點(diǎn)匹配算法,利用Harris角點(diǎn)檢測(cè)算法獲取該區(qū)域內(nèi)角點(diǎn);然后采用局部改進(jìn)的susaNT法對(duì)所得角點(diǎn)進(jìn)行篩選,剔除邊緣點(diǎn)及偽角點(diǎn);最后采用改進(jìn)的互相關(guān)匹配算法求取最佳匹配角點(diǎn)對(duì)。由于susaNT法在椒鹽噪聲環(huán)境下單個(gè)噪聲點(diǎn)或者噪聲塊中的中心點(diǎn)因USANM積小而被誤當(dāng)做候選角點(diǎn),因此結(jié)合Harris算法,引入濾波機(jī)制,提高了算法的抗噪性。角點(diǎn)特征主要描述的是紋理和結(jié)構(gòu)的特征,這些都是圖像空間結(jié)構(gòu)上的特點(diǎn),文本存在大量的角點(diǎn),但是許多非文本區(qū)域同樣存在角點(diǎn)信息,圖像上的線段交叉形成角點(diǎn),自然環(huán)境中存在很多這樣的角點(diǎn)結(jié)構(gòu),例如樹(shù)枝、樹(shù)葉的交叉點(diǎn),窗戶的窗格交叉點(diǎn)等,因
16、此,使用角點(diǎn)特征提取文本過(guò)程中還需要用其他特征對(duì)基于角點(diǎn)的定位作補(bǔ)充。2.5 基于機(jī)器學(xué)習(xí)的方法由于文本定位是用來(lái)區(qū)分文本區(qū)域和非文本區(qū)域的,因此文本定位可以看作是區(qū)域的分類:文本類和非文本類,所以機(jī)器學(xué)習(xí)的方法也應(yīng)用在文本定位課題上,把文本和非文本分類。常用的機(jī)器學(xué)習(xí)的方法有神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)(SVM)。2.5.1 基于神經(jīng)網(wǎng)絡(luò)的方法神經(jīng)網(wǎng)絡(luò)在模式識(shí)別、圖像處理領(lǐng)域中廣泛應(yīng)用,它有并行性、實(shí)時(shí)性和分布式存儲(chǔ)與處理等特點(diǎn)而受到研究者的重視。潘道遠(yuǎn)等人20采用多方法融合的方法進(jìn)行文本定位。他們首先使用金字塔分解把原始圖像分解成大小不同的子圖像,然后使用CROtsu算子對(duì)每一層子圖提取邊緣,并對(duì)
17、子圖分別進(jìn)行數(shù)學(xué)形態(tài)學(xué)操作,去除孤立的背景,再使用先驗(yàn)知識(shí)規(guī)則去除一些非文本區(qū),接著融合各個(gè)子圖像,并使用最近鄰插值法將融合圖像放大為原圖像的大小。將備選文本區(qū)的R、G、B三基色分別作為BP神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù),利用“米”字形網(wǎng)格結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)分類為文本或非文本。這種方法通過(guò)融合基于邊緣的方法和基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法,較為準(zhǔn)確地實(shí)現(xiàn)自然場(chǎng)景文本的提取,由于備選文本區(qū)域的提取只采用了邊緣信息,邊緣不突出的文字常常被遺漏,因此該算法在處理邊緣不明顯的文本時(shí),效果不太理想,同時(shí)將有些紋理比較復(fù)雜的背景區(qū)域錯(cuò)誤的分類為文本區(qū)域。歐文武21等人首先提取彩色圖像的邊緣,然后利用先驗(yàn)知識(shí)得到候選文本區(qū)域,接著對(duì)
18、候選文本區(qū)域進(jìn)行多通道Gabor濾波得到候選文本區(qū)域的特征,這些特征作為BP網(wǎng)絡(luò)的輸入內(nèi)容來(lái)驗(yàn)證備選文本區(qū)域。這種基于BP網(wǎng)絡(luò)的方法提高了文本定位的準(zhǔn)確度,但是Gabor濾波處理后的結(jié)果往往存在分類錯(cuò)誤的情況,導(dǎo)致很多文本遺漏,也就是后處理算法對(duì)前處理算法依賴性太大。李念永等人22針對(duì)復(fù)雜彩色圖像中文本字符筆畫(huà)寬度與整個(gè)文本塊的寬度比值存在一定的上限的特征,使用小波變換和BP神經(jīng)網(wǎng)絡(luò)甄選文本區(qū)域。該算法根據(jù)文本塊的邊緣特征提取出備選圖像塊,然后采用小波變換提取備選圖像塊的紋理特征,最后把這些紋理特征參量和圖像塊的顏色特征和筆畫(huà)特征參量作為BP神經(jīng)網(wǎng)絡(luò)的輸入信號(hào),判斷備選圖像塊是否包含文本。該方
19、法運(yùn)算簡(jiǎn)單,定位時(shí)間短。2.5.2 基于SVM勺方法支持向量機(jī)(SupportVectorMachine,SVM是一種可訓(xùn)練的機(jī)器學(xué)習(xí)方法,針對(duì)線性可分情況進(jìn)行分析,對(duì)于線性不可分的情況,通過(guò)使用非線性映射算法將低維輸入空間線性不可分的樣本轉(zhuǎn)化為高維特征空間使其線性可分,是解決分類問(wèn)題的有力工具,因此,可以應(yīng)用在文本定位問(wèn)題上,對(duì)文本區(qū)域和非文本區(qū)域進(jìn)行分類。Kim23等人首次將SVMT法應(yīng)用于文本定位和提取,該方法的SVM是通過(guò)多分辨率小波變換的特征訓(xùn)練出來(lái)的,再用訓(xùn)練好的SVM對(duì)連通區(qū)域進(jìn)行分類,得到了良好的分類結(jié)果,文本定位的準(zhǔn)確度也較高。該方法在有限的樣本中訓(xùn)練SVM并且SVMM有自動(dòng)
20、尋找的功能,可以自動(dòng)尋找到有較好區(qū)分能力的支持向量,來(lái)構(gòu)成類間間隔最大的分類器,因此該方法對(duì)于文本定位有很好的泛化能力。3候選文本區(qū)域驗(yàn)證自然環(huán)境中文字的光照等條件復(fù)雜多變,為了避免低對(duì)比度和低照度導(dǎo)致文本漏檢,通常首先對(duì)邊緣圖像進(jìn)行二值化,由于文字區(qū)域的邊緣大都是閉合的矩形區(qū)域,可以利用數(shù)學(xué)形態(tài)學(xué)運(yùn)算對(duì)圖像上的候選區(qū)域做形狀等方面的限制24,去除部分背景區(qū)域,并將原來(lái)相連的背景和文本分離開(kāi)來(lái),然后對(duì)二值圖像進(jìn)行連通分量分析,采用如下先驗(yàn)知識(shí)規(guī)則25去除一些明顯的非文字區(qū)域.1)字符像素?cái)?shù)量的限制自然場(chǎng)景中的文字一般以酒店招牌、道路標(biāo)識(shí)、安全警示或提示信息等形式出現(xiàn),通常候選區(qū)域內(nèi)字符筆畫(huà)像素
21、應(yīng)該少于背景像素來(lái)區(qū)分背景和字符灰度,因此可以限定文字的灰度像素。2)文字區(qū)域高寬比的限制文本區(qū)域的矩形框通常包圍一個(gè)或者多個(gè)字符,因此自然場(chǎng)景中的文字符合一定的高寬比,不會(huì)過(guò)于狹長(zhǎng),所以可以采用這個(gè)規(guī)則去除水平方向或垂直方向過(guò)于狹長(zhǎng)的連通區(qū)域。3)文字輪廓面積的填充比的限制文本區(qū)域比較接近矩形,因此文本輪廓面積與外接矩形的面積比較大,而非文本區(qū)域的輪廓不規(guī)則,與外接矩形的面積比較小,因此可以找候選區(qū)域的輪廓和外接矩形,分別計(jì)算輪廓面積和外接矩形面積,通過(guò)面積比值的大小來(lái)去除一些非文本區(qū)域。4) 文字角點(diǎn)密度的限制文字區(qū)域通常具有密集的角點(diǎn),所以采用角點(diǎn)密度可消除一些非文字區(qū)域,文字塊的角點(diǎn)密集,所以把角點(diǎn)密度小于某個(gè)閾值的連通區(qū)域定為非文字區(qū)域。5) 字符波峰和波谷的限制文本區(qū)域的投影曲線有明顯的波峰和波谷,非文本區(qū)域的投影區(qū)域相對(duì)平滑,波峰的數(shù)量較少,或者沒(méi)有波峰,因此可以根據(jù)投影曲線的波峰數(shù)量和曲線方差特征來(lái)區(qū)分文本區(qū)域和非文本區(qū)域。如果連通區(qū)域滿足上述任意一個(gè)規(guī)則,則判定為非文字塊,將被去除;否則保留下來(lái)作為候選文
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版木地板電商平臺(tái)入駐與銷售合同3篇
- 二零二五年度農(nóng)業(yè)種植節(jié)水灌溉技術(shù)服務(wù)合同標(biāo)準(zhǔn)
- 二零二五年度寵物貓寵物用品線上商城合作合同4篇
- 二零二五年度土地儲(chǔ)備開(kāi)發(fā)土地征用補(bǔ)償合同
- 2025年銷售總監(jiān)勞動(dòng)合同模板:業(yè)績(jī)提升與團(tuán)隊(duì)建設(shè)策略3篇
- 2025年度健康醫(yī)療大數(shù)據(jù)應(yīng)用合同范本2篇
- 二手房買賣協(xié)議規(guī)范文本2024版版B版
- 二零二五年度工業(yè)用地收儲(chǔ)補(bǔ)償合同3篇
- 二零二五年度女方離婚協(xié)議書(shū)制作參考模板
- 2025年度農(nóng)民工職業(yè)培訓(xùn)合作服務(wù)合同模板
- 第3篇 助跑 項(xiàng)目六 異形芯片分揀與安裝講解
- 匯款賬戶變更協(xié)議
- 實(shí)體瘤療效評(píng)價(jià)標(biāo)準(zhǔn)(RECIST11)
- 電力系統(tǒng)動(dòng)態(tài)仿真與建模
- 蝦皮shopee新手賣家考試題庫(kù)及答案
- 四川省宜賓市2023-2024學(xué)年八年級(jí)上學(xué)期期末義務(wù)教育階段教學(xué)質(zhì)量監(jiān)測(cè)英語(yǔ)試題
- 價(jià)值醫(yī)療的概念 實(shí)踐及其實(shí)現(xiàn)路徑
- 2024年中國(guó)華能集團(tuán)燃料有限公司招聘筆試參考題庫(kù)含答案解析
- 《紅樓夢(mèng)》中的男性形象解讀
- 安全生產(chǎn)技術(shù)規(guī)范 第49部分:加油站 DB50-T 867.49-2023
- 《三國(guó)演義》中的語(yǔ)言藝術(shù):詩(shī)詞歌賦的應(yīng)用
評(píng)論
0/150
提交評(píng)論