版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
如何破解字符驗(yàn)證碼第1頁/共13頁對驗(yàn)證碼的介紹字符驗(yàn)證碼如何破解字符驗(yàn)證碼小組總結(jié)3/27/2023第2頁/共13頁3/27/2023驗(yàn)證碼的英文CAPTCHA這個(gè)詞最早是在2000年由卡內(nèi)基梅隆大學(xué)的LuisvonAhn等學(xué)者所提出的。CAPTCHA是“CompletelyAutomatedPublicTuringtesttotellComputersandHumansApart”(全自動(dòng)區(qū)分計(jì)算機(jī)和人類的圖靈測試)的縮寫,是一種區(qū)分用戶是計(jì)算機(jī)和人的公共全自動(dòng)程序。這個(gè)問題可以由計(jì)算機(jī)生成并評判,但是必須只有人類才能解答。由于計(jì)算機(jī)無法解答CAPTCHA的問題,所以回答出問題的用戶就可以被認(rèn)為是人類。驗(yàn)證碼起源第3頁/共13頁(1)由4個(gè)隨機(jī)數(shù)字組成的最原始驗(yàn)證碼:驗(yàn)證作用幾乎為零。(2)GIF動(dòng)畫驗(yàn)證碼:防垃圾注入可以達(dá)到100%,有效的同時(shí)能增加網(wǎng)站頁面的美觀效果。(3)手機(jī)驗(yàn)證碼:通過發(fā)送驗(yàn)證碼到手機(jī),比較準(zhǔn)確驗(yàn)證用戶的正確性,是最有效的驗(yàn)證碼之一。(4)字符驗(yàn)證碼:服務(wù)器端隨機(jī)生成驗(yàn)證碼字符串,保存在內(nèi)存中,并寫入圖片或者加入干擾線條,將圖片連同表單發(fā)給客戶端。是目前而言最常見的驗(yàn)證碼。常見的驗(yàn)證碼~3/27/2023第4頁/共13頁字符驗(yàn)證碼的工作流程(1)、服務(wù)器端隨機(jī)生成驗(yàn)證碼字符串,保存在內(nèi)存中,并寫入圖片或者加入干擾線條,將圖片連同表單發(fā)給客戶端。(2)、客戶端輸入驗(yàn)證碼,并提交給表單,服務(wù)器端獲取客戶提交的驗(yàn)證碼,和前面產(chǎn)生的的隨機(jī)數(shù)字相比較;如果相同,則繼續(xù)進(jìn)行表單所描述的操作(如登錄、注冊等);如果不同,直接將錯(cuò)誤信息返回給客戶端。避免程序的繼續(xù)運(yùn)行以及訪問數(shù)據(jù)庫。3/27/2023第5頁/共13頁如何破解字符驗(yàn)證碼
1、去噪
(1)由于其背景色的亮度與文字或者數(shù)字的亮度差別較大,這樣我們就可以通過設(shè)定亮度域值的方法來對它進(jìn)行二值化處理,即將圖像上的像素點(diǎn)的灰度值設(shè)置為0或255,也就是將整個(gè)圖像呈現(xiàn)出明顯的只有黑和白的視覺效果。(2)對于干擾線的去除,我們通過對水平方向長度超過圖片二分之一的線直接去除,因?yàn)閳D片文字本身寬度不可能超過二分之一的圖片大小。3/27/2023第6頁/共13頁(3)先在x軸方向進(jìn)行分割:對x軸上每一點(diǎn),統(tǒng)計(jì)y坐標(biāo)方向上黑點(diǎn)數(shù)目。當(dāng)黑點(diǎn)數(shù)目少于設(shè)定的域值時(shí)候,認(rèn)為是字符間的空白區(qū),而黑點(diǎn)數(shù)目大于設(shè)定的閾值時(shí)則認(rèn)為是字符區(qū)。(4)有時(shí)存在字符相連的情況,為避免兩個(gè)相連的字符分割失敗,對字符的最大寬度和最小寬度設(shè)定閾值:當(dāng)寬度大于最大寬度時(shí)候,即認(rèn)為是兩個(gè)字符,需要將分割得到的字符繼續(xù)分割;如果分割得到的字符寬度小于設(shè)定的最小寬度,則需要進(jìn)行合并鄰近的兩個(gè)字符進(jìn)行分割。(5)利用同樣的方法可以進(jìn)行y軸方向上的分割。(6)由于驗(yàn)證碼文字的隨機(jī)性,對分割得到的單個(gè)字符進(jìn)行進(jìn)一步的邊框確定。通過對水平和垂直方向掃描,確定出單個(gè)字符的邊框。3/27/2023第7頁/共13頁2、將分割出的字符與模版匹配,判別字符類型(1)模版庫的建立:從網(wǎng)絡(luò)上采集一系列驗(yàn)證碼的樣本,建立驗(yàn)證碼字符樣本空間。比如為字母A~Z和數(shù)字0~9。對于每一個(gè)樣本,我們提取特征,建立模版。(2)將得到的圖片切割為固定的長度和寬度。先將字符從水平方向進(jìn)行掃描,則每條掃描線都是由黑點(diǎn)或者白點(diǎn)構(gòu)成的序列,每條水平掃描線可以用一個(gè)向量表示。將向量分類為N種模式,比如模式0表示長的空白段,而模式1代表長的黑點(diǎn)段。模式2表示一段相對長的白點(diǎn)之后跟著一段黑點(diǎn)。以此類推得到自己設(shè)計(jì)的模式圖。3/27/2023第8頁/共13頁(3)用上述的編碼方法分別對模版與待識別的字符進(jìn)行編碼,然后計(jì)算模版與待識別字符的編碼的相似度。把一個(gè)字當(dāng)做一幅圖,從上往下一行行掃描,每一行都是由不同長短的黑色橫杠組成的,每種橫杠對應(yīng)著模式圖中的一個(gè)編碼。取相似度最高的模版字符為識別的結(jié)果。如圖所示,數(shù)字7的編碼為1288886999793/27/2023第9頁/共13頁3/27/2023上述破解原理可用OCR(OpticalCharacterRecognition):光學(xué)字符識別來實(shí)現(xiàn)
1、下載安裝Tesseract-OCR引擎2、使用Tesseract-OCR引擎識別驗(yàn)證碼第10頁/共1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年機(jī)動(dòng)車質(zhì)押借款合同解除及賠償條款3篇
- 二零二五年度零食店收銀員食品安全責(zé)任承諾合同4篇
- 二零二五年度大型工業(yè)鍋爐設(shè)備采購合同2篇
- 2025年度塔吊操作人員勞務(wù)派遣及技能培訓(xùn)合同
- 二零二五年度企業(yè)項(xiàng)目管理培訓(xùn)服務(wù)合同標(biāo)準(zhǔn)3篇
- 2025年度航空器租賃及操作培訓(xùn)合同4篇
- 2025年度農(nóng)機(jī)零部件定制加工合同范本4篇
- 二零二五年度房地產(chǎn)開發(fā)貸款擔(dān)保合同
- 二零二五年度智慧城市版委托貸款合同
- 2025年度體育賽事組織策劃人員勞動(dòng)合同規(guī)范文本4篇
- 電化學(xué)儲能電站安全規(guī)程
- 幼兒園學(xué)習(xí)使用人民幣教案教案
- 2023年浙江省紹興市中考科學(xué)真題(解析版)
- 語言學(xué)概論全套教學(xué)課件
- 大數(shù)據(jù)與人工智能概論
- 《史記》上冊注音版
- 2018年湖北省武漢市中考數(shù)學(xué)試卷含解析
- 測繪工程產(chǎn)品價(jià)格表匯編
- 《腎臟的結(jié)構(gòu)和功能》課件
- 裝飾圖案設(shè)計(jì)-裝飾圖案的形式課件
- 護(hù)理學(xué)基礎(chǔ)教案導(dǎo)尿術(shù)catheterization
評論
0/150
提交評論