計(jì)算機(jī)病毒技術(shù)及其防御 課件 第8章-計(jì)算機(jī)病毒檢測(cè)_第1頁
計(jì)算機(jī)病毒技術(shù)及其防御 課件 第8章-計(jì)算機(jī)病毒檢測(cè)_第2頁
計(jì)算機(jī)病毒技術(shù)及其防御 課件 第8章-計(jì)算機(jī)病毒檢測(cè)_第3頁
計(jì)算機(jī)病毒技術(shù)及其防御 課件 第8章-計(jì)算機(jī)病毒檢測(cè)_第4頁
計(jì)算機(jī)病毒技術(shù)及其防御 課件 第8章-計(jì)算機(jī)病毒檢測(cè)_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

MalwarePrinciples&Prevention主講人:張瑜廣東技術(shù)師范大學(xué)

網(wǎng)絡(luò)空間安全學(xué)院計(jì)算機(jī)病毒技術(shù)及其防御

ComputerVirusTechnology&ItsDefense主講人:張瑜廣東技術(shù)師范大學(xué)

網(wǎng)絡(luò)空間安全學(xué)院主講人:張瑜第八章ChapterEight廣東技術(shù)師范大學(xué)網(wǎng)絡(luò)空間安全學(xué)院ComputerVirusesDetection計(jì)算機(jī)病毒檢測(cè)前言PREFACE對(duì)于計(jì)算機(jī)病毒,無論其處于傳播、潛伏還是發(fā)作階段,都應(yīng)開啟實(shí)時(shí)檢測(cè)以及早發(fā)現(xiàn),并及時(shí)采取應(yīng)急響應(yīng)措施圍堵獵殺,保障信息系統(tǒng)安全。計(jì)算機(jī)病毒檢測(cè)是計(jì)算機(jī)病毒防御的第一步,只有將可疑文件、進(jìn)程進(jìn)行檢測(cè)后,才能確認(rèn)計(jì)算機(jī)是否被感染。如確認(rèn)被計(jì)算機(jī)病毒感染,則需進(jìn)一步殺滅和免疫,以絕后患。本章將從特征碼檢測(cè)、啟發(fā)式檢測(cè)、虛擬沙箱檢測(cè)、數(shù)據(jù)驅(qū)動(dòng)檢測(cè)、基于ChatGPT的安全防御等維度探討計(jì)算機(jī)病毒檢測(cè)發(fā)現(xiàn)技術(shù)。激湍之下,必有深潭;高丘之下,必有浚谷。——明·劉基1背景介紹目錄2特征碼檢測(cè)3啟發(fā)式檢測(cè)4沙箱檢測(cè)45數(shù)據(jù)驅(qū)動(dòng)檢測(cè)45GPT防御1CHAPTER

背景介紹1.背景介紹

檢測(cè)分類特征碼檢測(cè)、啟發(fā)式檢測(cè)、虛擬沙箱檢測(cè)、數(shù)據(jù)驅(qū)動(dòng)檢測(cè)、基于ChatGPT的安全防御。計(jì)算機(jī)病毒檢測(cè)是計(jì)算機(jī)病毒防御的第一步。只有將可疑文件、進(jìn)程進(jìn)行檢測(cè)后,才能確認(rèn)是否為計(jì)算機(jī)病毒所感染。如確認(rèn)為計(jì)算機(jī)病毒,將會(huì)進(jìn)一步殺滅與免疫以絕后患。基礎(chǔ)知識(shí)特征碼檢測(cè)背景介紹檢驗(yàn)和特征碼特殊字符串特征碼特殊匯編碼特征碼2CHAPTER特征匹配樣本選擇特征提取2.基于特征碼檢測(cè)定義:基于病毒特征碼檢測(cè);先從計(jì)算機(jī)病毒樣本中選擇、提取特征碼,再用該特征碼去匹配待掃描文件,如匹配度高于設(shè)定閾值,則認(rèn)為該掃描文件內(nèi)含計(jì)算機(jī)病毒。分類:檢驗(yàn)和特征碼,特殊字符串特征碼,特殊匯編碼特征碼2.1校驗(yàn)和特征碼種類優(yōu)缺點(diǎn)可使用

MD5或SHA等算法生成每個(gè)未感染文件的校驗(yàn)和(消息摘要),并將其作為該文件獨(dú)特的數(shù)字指紋保存至檢驗(yàn)和數(shù)據(jù)庫中既能發(fā)現(xiàn)已知病毒,也能發(fā)現(xiàn)未知病毒;但保存的檢驗(yàn)和數(shù)據(jù)庫會(huì)隨文件數(shù)和文件更改數(shù)而遞增,開銷劇增。檢驗(yàn)和(Checksum),最初用于數(shù)據(jù)處理和數(shù)據(jù)通信領(lǐng)域,用于校驗(yàn)數(shù)據(jù)通過傳輸?shù)竭_(dá)目的地后的完整性和準(zhǔn)確性的一組數(shù)據(jù)項(xiàng)之和?;A(chǔ)知識(shí)示例-MD5加密步驟一:生成待加密字符串編碼。步驟二:與MD5加密后編碼進(jìn)行匹配。2.3特殊字符串特征碼示例優(yōu)缺點(diǎn)例如:CIH病毒中包含諸如“CIHv1.2TTIT”;大麻病毒包含“YourPCisnowStoned!LEGALISEMARIJUANA!”字符串,熊貓燒香病毒包含諸如“whboy”、“xboy”之類的字符串。能檢測(cè)并識(shí)別特定計(jì)算機(jī)病毒,但掃描耗時(shí)較多,且無法應(yīng)對(duì)病毒變體。

計(jì)算機(jī)病毒中包含一些特殊字符串,并通過查找計(jì)算機(jī)樣本中的此類特殊字符串進(jìn)行對(duì)比,實(shí)現(xiàn)檢測(cè)病毒?;A(chǔ)知識(shí)示例-字符串匹配步驟一:輸入待匹配字符串。步驟二:利用函數(shù)進(jìn)行匹配。2.4特殊匯編碼特征碼示例優(yōu)缺點(diǎn)對(duì)于WindowsPE病毒,其程序中均包含不可或缺的重定位代碼。病毒重定位可助計(jì)算機(jī)病毒實(shí)現(xiàn)兩個(gè)功能:(1)正確引用自身變量或常量,(2)動(dòng)態(tài)獲取系統(tǒng)API函數(shù)地址。能快速有效地提取惡意軟件的獨(dú)特指令序列特征,但容易受到惡意軟件的代碼變異影響,且可能導(dǎo)致誤報(bào)率較高。

計(jì)算機(jī)病毒是一段程序代碼,如從語義視角去考量病毒特征碼,則可將其包含的有特殊含義且普通程序未有的代碼作為其特征碼;即病毒的反匯編編碼。基礎(chǔ)知識(shí)2.4.1示例-特征碼提取恒定部分可變部分

由匯編碼CallVstart所構(gòu)成,匯編碼CallVstart所對(duì)應(yīng)的機(jī)器碼為:E8xx000000E8后面的第一個(gè)字節(jié)表示跳轉(zhuǎn)到的下一個(gè)要執(zhí)行的指令到E8xx000000指令的距離。由多條匯編指令構(gòu)成,例如,匯編碼PopEBX、SubEBX,offsetVstart或MovEBX,[ESP]、SubEBX,offsetVstart等都可實(shí)現(xiàn)相關(guān)。介紹

本節(jié)將以WindowsPE病毒為例探討病毒特征碼提取。通過逆向分析病毒重定位代碼后,可發(fā)現(xiàn)其結(jié)構(gòu)由2部分組成:(1)恒定部分,(2)可變部分。示例-匯編碼匹配匯編碼(前四行):表示函數(shù)行為匯編碼十六進(jìn)制數(shù)下列的病毒重定位演示代碼中的前四行是匯編碼,后一行是前四行匯編碼對(duì)應(yīng)的十六進(jìn)制數(shù)據(jù),該數(shù)據(jù)可提供為病毒特征碼。示例-匯編碼匹配在定義好特征碼并提取出特征碼后,利用病毒特征碼進(jìn)行可疑文件檢測(cè),其實(shí)就是一個(gè)簡(jiǎn)單的字符匹配算法過程:首先,進(jìn)行輸入?yún)?shù)判斷;其次,加載相關(guān)病毒特征碼庫;最后,將待掃描文件與病毒特征碼庫進(jìn)行比對(duì)并判斷輸出結(jié)果。步驟一:加載特征碼庫。步驟二:掃描引擎初始化。示例-匯編碼匹配步驟三:掃描記錄,輸出結(jié)果。啟發(fā)式檢測(cè)啟發(fā)式檢測(cè)啟發(fā)式病毒屬性啟發(fā)式病毒檢測(cè)3CHAPTER3.啟發(fā)式檢測(cè)優(yōu)缺點(diǎn)能檢測(cè)到不在病毒特征庫中的未知病毒或已知病毒新變種;但可能會(huì)將正常但不尋常的行為誤認(rèn)為是惡意軟件,導(dǎo)致誤報(bào)率較高。

啟發(fā)式檢測(cè)實(shí)質(zhì)上是一種基于邏輯推理的計(jì)算機(jī)病毒檢測(cè)方法,通過檢查文件中的可疑屬性并在滿足相應(yīng)閾值時(shí),給出是否為病毒的邏輯判斷?;A(chǔ)知識(shí)3.1啟發(fā)式病毒屬性盡管計(jì)算機(jī)病毒與普通程序一樣,都是編程者精心設(shè)計(jì)編寫的二進(jìn)制代碼,但從指令屬性的視角,兩者仍存在很多不同。病毒防御者如能仔細(xì)辨別兩者的不同屬性,找尋到計(jì)算機(jī)病毒區(qū)別于正常程序的功能屬性,并以此為依據(jù)檢測(cè)計(jì)算機(jī)病毒,就能相對(duì)簡(jiǎn)易地發(fā)現(xiàn)未知病毒。屬性下面將以此演示啟發(fā)式檢測(cè)方法。演示代碼的邏輯流程為:讀內(nèi)存文件→解析該文件導(dǎo)入表API函數(shù)并分類危險(xiǎn)度→掃描導(dǎo)入表API函數(shù)→如超過設(shè)定閾值則判斷為病毒。3.2啟發(fā)式病毒檢測(cè)定義:?jiǎn)l(fā)式病毒檢測(cè)通過檢查文件中的可疑屬性并在滿足相應(yīng)閾值時(shí),給出是否為病毒的邏輯判斷。例如,啟發(fā)式檢測(cè)通常會(huì)掃描PE文件導(dǎo)入表,根據(jù)導(dǎo)入表中API函數(shù)的危險(xiǎn)度去判斷程序行為。示例-啟發(fā)式病毒步驟一:初始和加載模塊。示例-啟發(fā)式病毒步驟二:解析導(dǎo)入表并進(jìn)行API函數(shù)危險(xiǎn)度分析。示例-啟發(fā)式病毒步驟三:掃描導(dǎo)入表API函數(shù),并進(jìn)行分級(jí)。步驟四:函數(shù)危險(xiǎn)級(jí)別分類。示例-啟發(fā)式病毒步驟五:閾值判斷。4CHAPTER沙箱檢測(cè)計(jì)算機(jī)病毒樣本分析登記文檔計(jì)算機(jī)病毒樣本分析結(jié)果登記文檔計(jì)算機(jī)病毒分析報(bào)告4.沙箱檢測(cè)什么是沙箱?沙箱(SandBox),本質(zhì)上就是一個(gè)增強(qiáng)的虛擬機(jī),能為程序提供一個(gè)虛擬化環(huán)境(隔離環(huán)境),保證程序所有操作都在該隔離環(huán)境內(nèi)完成,不會(huì)對(duì)隔離環(huán)境之外的系統(tǒng)造成任何影響。沙箱會(huì)嚴(yán)控其中運(yùn)行程序所能訪問的各種資源,是虛擬化和監(jiān)控方法的結(jié)合體。沙箱的優(yōu)缺點(diǎn)有哪些?可以用于檢測(cè)潛在的惡意軟件,包括采用加殼技術(shù)、隱匿類病毒,從而提供實(shí)時(shí)的惡意軟件檢測(cè)和防護(hù),但可能會(huì)導(dǎo)致性能損耗,因?yàn)轭~外的資源和計(jì)算能力用于維護(hù)隔離環(huán)境?;A(chǔ)知識(shí)

沙箱重定向在沙箱內(nèi),所有操作都會(huì)被重定向。沙箱能虛擬處理如下資源:文件、注冊(cè)表、服務(wù)、進(jìn)程、線程、全局鉤子、注入、驅(qū)動(dòng)加載等。例如,在沙箱內(nèi)進(jìn)行文件操作時(shí),所有與文件創(chuàng)建、修改、讀寫、刪除等相關(guān)操作都被重定向,不會(huì)操作真實(shí)系統(tǒng)中的文件。在應(yīng)用模式下,可通過鉤掛NTDLL.DLL中文件相關(guān)函數(shù)。5CHAPTER數(shù)據(jù)驅(qū)動(dòng)檢測(cè)數(shù)據(jù)驅(qū)動(dòng)檢測(cè)基于機(jī)器學(xué)習(xí)檢測(cè)基于深度學(xué)習(xí)檢測(cè)分類classification定義傳統(tǒng)的計(jì)算機(jī)病毒檢測(cè)(特征碼檢測(cè),啟發(fā)式檢測(cè)...)方法需要人工逆向分析與特征碼提取,耗時(shí)巨大且效果欠佳,隨著病毒數(shù)量呈指數(shù)級(jí)增長(zhǎng)后,此類檢測(cè)方法已有英雄遲暮之感。而借助數(shù)據(jù)科學(xué)與人工智能方法來進(jìn)行計(jì)算機(jī)病毒檢測(cè)自動(dòng)化,將節(jié)省大量人力財(cái)力,且還可有效提升檢測(cè)精準(zhǔn)度。5.數(shù)據(jù)驅(qū)動(dòng)檢測(cè)結(jié)構(gòu)

人工智能是以史為鑒,讓歷史揭示未來。即以歷史數(shù)據(jù)為學(xué)習(xí)內(nèi)容,利用算法與模型來預(yù)測(cè)未來數(shù)據(jù)。分類

分類,聚類,降維?;谌斯ぶ悄艿牟《緳z測(cè)其實(shí)就是分類問題,即將待檢測(cè)文件劃分為兩類:良性代碼,計(jì)算機(jī)病毒。定義Definition結(jié)構(gòu)construction5.1基于機(jī)器學(xué)習(xí)的病毒檢測(cè)優(yōu)缺點(diǎn)能自動(dòng)學(xué)習(xí)惡意軟件的特征和模式,無需手動(dòng)編寫規(guī)則或特征提取過程;但存在過擬合、欠擬合問題。

機(jī)器學(xué)習(xí)利用數(shù)學(xué)和統(tǒng)計(jì)學(xué)的知識(shí)與原理,從數(shù)據(jù)中發(fā)現(xiàn)模式、相關(guān)性、異常性,為解決實(shí)際問題提供分類、聚類、降維等處理結(jié)果?;A(chǔ)知識(shí)基本步驟問題抽象數(shù)據(jù)預(yù)處理模型驗(yàn)證機(jī)器學(xué)習(xí)基本步驟數(shù)據(jù)采集模型構(gòu)建降維Reduction分類分類是機(jī)器學(xué)習(xí)中的一個(gè)任務(wù),其目標(biāo)是將數(shù)據(jù)點(diǎn)分配到預(yù)定義的類別或標(biāo)簽中。分類問題通常是有監(jiān)督學(xué)習(xí)的一種形式,其中算法通過從帶有標(biāo)簽的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)特征和模式,來建立一個(gè)可以將新數(shù)據(jù)點(diǎn)分配到正確類別的模型。常見的應(yīng)用包括垃圾郵件過濾、圖像識(shí)別、醫(yī)學(xué)診斷等。5.1.1問題抽象聚類聚類是機(jī)器學(xué)習(xí)中的另一種任務(wù),其目標(biāo)是將數(shù)據(jù)點(diǎn)分組為相似的集群,其中每個(gè)集群內(nèi)的數(shù)據(jù)點(diǎn)彼此更加相似,而不同集群之間的數(shù)據(jù)點(diǎn)相似度較低。聚類問題通常是無監(jiān)督學(xué)習(xí)的一種形式,因?yàn)樗惴ㄔ跊]有預(yù)先定義類別的情況下自行識(shí)別數(shù)據(jù)中的模式和結(jié)構(gòu)。聚類可用于市場(chǎng)細(xì)分、社交網(wǎng)絡(luò)分析、圖像分割等領(lǐng)域降維采用某種映射方法,將高維空間中的數(shù)據(jù)點(diǎn)映射到低維度的空間。分類Classification聚類Cluster5.1.2數(shù)據(jù)采集什么是數(shù)據(jù)采集?數(shù)據(jù)采集是指收集、獲取和整理用于訓(xùn)練和評(píng)估機(jī)器學(xué)習(xí)模型的數(shù)據(jù)的過程。數(shù)據(jù)是機(jī)器學(xué)習(xí)的基礎(chǔ),模型的性能和效果很大程度上取決于使用的數(shù)據(jù)質(zhì)量和數(shù)量。常用數(shù)據(jù)集有哪些?(1)SoRel-20M(2)EMBER(3)微軟KMC2015基礎(chǔ)知識(shí)

5.1.2數(shù)據(jù)采集(2)EMBER數(shù)據(jù)集2018年4月網(wǎng)絡(luò)安全公司Endgame發(fā)布了EMBER,110萬個(gè)良性和惡意WindowsPE文件樣本集合,其中90萬個(gè)為訓(xùn)練樣本(30萬個(gè)惡意、30萬個(gè)良性、30萬個(gè)未標(biāo)記),20萬個(gè)為測(cè)試樣本(10萬個(gè)惡意、10萬個(gè)良性)。(3)微軟KMC

2015數(shù)據(jù)集Microsoft公司于2015年舉辦了惡意軟件分類挑戰(zhàn)賽KaggleMicrosoftMalwareClassificationChallenge(BIG2015),且為參賽者提供超過500GB(解壓后)數(shù)據(jù)集KMC2015,含9類惡意軟件家族,在訓(xùn)練集里有近900萬條數(shù)據(jù),(1)SoReL-20M數(shù)據(jù)集網(wǎng)絡(luò)安全公司Sophos和ReversingLabs聯(lián)合發(fā)布,SoReL-20M數(shù)據(jù)庫內(nèi)含2000萬WindowsPE文件元數(shù)據(jù)、標(biāo)簽和特征,其中包括1000萬個(gè)刪除了攻擊載荷的計(jì)算機(jī)病毒樣本和1000萬個(gè)良性樣本。5.1.3數(shù)據(jù)預(yù)處理及特征提取機(jī)器學(xué)習(xí)使用數(shù)學(xué)模型來擬合數(shù)據(jù),以便提取知識(shí)和做出預(yù)測(cè)。而這些數(shù)學(xué)模型的輸入就是數(shù)據(jù)及其特征。數(shù)據(jù)需要準(zhǔn)備、標(biāo)準(zhǔn)化、去重復(fù)、消除錯(cuò)誤和偏差等一系列預(yù)處理過程以及特征工程提取相關(guān)數(shù)據(jù)的特征。處理之后的數(shù)據(jù)需要進(jìn)行分割,通常將其分為三個(gè)集合:訓(xùn)練集、驗(yàn)證集、測(cè)試集。基礎(chǔ)知識(shí)

功能特點(diǎn)功能特點(diǎn)功能特點(diǎn)基本步驟數(shù)據(jù)準(zhǔn)備去重復(fù)標(biāo)準(zhǔn)化消除錯(cuò)誤和偏差示例-數(shù)據(jù)預(yù)處理步驟一:提取.asm文件opcode序列。步驟二:統(tǒng)計(jì)opcode序列n-gram特征。示例-數(shù)據(jù)集分類步驟一:讀取數(shù)據(jù)標(biāo)簽。步驟二:隨機(jī)抽取分類數(shù)據(jù)示例-數(shù)據(jù)集分類步驟三:生成訓(xùn)練集標(biāo)注。5.1.4模型構(gòu)建模型構(gòu)建是指根據(jù)數(shù)據(jù)與特征去選擇相應(yīng)的模型與算法,模型構(gòu)建邏輯為定位機(jī)器學(xué)習(xí)型(有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí))→定性機(jī)器學(xué)習(xí)(分類、聚類、降維)→嘗試應(yīng)用所有可能的對(duì)應(yīng)算法。常用的機(jī)器學(xué)習(xí)算法包括:線性回歸、邏輯回歸、決策樹、K均值、主成分分析(PCA)、支持向量機(jī)(SVM)、樸素貝葉斯、隨機(jī)森林和神經(jīng)網(wǎng)絡(luò)等等?;A(chǔ)知識(shí)

功能特點(diǎn)功能特點(diǎn)功能特點(diǎn)定位機(jī)器學(xué)習(xí)學(xué)習(xí)分類學(xué)習(xí)算法有監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)強(qiáng)化學(xué)習(xí)線性回歸邏輯回歸決策樹分類聚類降維5.1.5模型驗(yàn)證功能特點(diǎn)功能特點(diǎn)功能特點(diǎn)機(jī)器學(xué)習(xí)模型選擇并構(gòu)建好之后,就可進(jìn)行模型訓(xùn)練。使用訓(xùn)練數(shù)據(jù)迭代訓(xùn)練并改善模型預(yù)測(cè)結(jié)果,并借助模型預(yù)測(cè)效果評(píng)估迭代調(diào)整模型參數(shù),直至達(dá)到預(yù)期目的。基礎(chǔ)知識(shí)

隨機(jī)森林算法實(shí)現(xiàn)分類。5.2基于深度學(xué)習(xí)的病毒檢測(cè)優(yōu)缺點(diǎn)

以自動(dòng)從原始數(shù)據(jù)中學(xué)習(xí)和提取高級(jí)特征,無需手動(dòng)設(shè)計(jì)特征;但如果沒有足夠的數(shù)據(jù)進(jìn)行訓(xùn)練,深度學(xué)習(xí)模型可能容易過擬合,從而導(dǎo)致在未見數(shù)據(jù)上的性能下降。

深度學(xué)習(xí)(DeepLearning)是機(jī)器學(xué)習(xí)中一種基于對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法。與普通機(jī)器學(xué)習(xí)需要通過特征工程提取訓(xùn)練模型所需的輸入特征,深度學(xué)習(xí)可在相對(duì)原始的數(shù)據(jù)上進(jìn)行操作,而無需人工干預(yù)即可提取特征?;A(chǔ)知識(shí)5.2.1數(shù)據(jù)預(yù)處理在使用深度學(xué)習(xí)處理模式識(shí)別問題時(shí),都需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理:通過數(shù)據(jù)格式轉(zhuǎn)換,將病毒檢測(cè)問題轉(zhuǎn)換為對(duì)文本分類問題或圖像識(shí)別問題。由于在網(wǎng)絡(luò)安全領(lǐng)域采用深度學(xué)習(xí)方法所用的模型與算法均源于圖形圖像、音頻、自然語言處理等領(lǐng)域,因此,在進(jìn)行數(shù)據(jù)預(yù)處理時(shí),通常會(huì)按照上述領(lǐng)域?qū)?shù)據(jù)進(jìn)行向量化處理。具體到計(jì)算機(jī)病毒檢測(cè),可考慮采用自然語言處理領(lǐng)域的詞向量處理方法:Word2vec、CBOW、skip-gram、code2vec、Node2vec、Instruction2vec、Structure2Vec、Asm2vec等。基礎(chǔ)知識(shí)

功能特點(diǎn)功能特點(diǎn)功能特點(diǎn)數(shù)據(jù)范化詞向量表示分詞基本步驟示例-Word2vec演示用嵌入式詞向量模型建立網(wǎng)頁病毒的語義模型,讓機(jī)器能理解諸如<HTML>、<body>、<script>等HTML語言標(biāo)簽。將出現(xiàn)次數(shù)最多的3500個(gè)詞構(gòu)成詞匯表,其他的詞則標(biāo)記為“UN”,采用Word2vec類建模且詞空間維度為128維。步驟一:統(tǒng)計(jì)詞頻。示例-Word2vec演示步驟二:統(tǒng)計(jì)詞頻。步驟三:word2Vec模型訓(xùn)練場(chǎng)嵌入。5.2.3模型訓(xùn)練在數(shù)據(jù)預(yù)處理完成后,就可選擇相關(guān)模型進(jìn)行訓(xùn)練與測(cè)試。目前深度學(xué)習(xí)可使用的模型較多,本節(jié)將探討常見的三種模型:多層感知機(jī)(MultilayerPerceptron,MLP)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RecursiveNeuralNetwork,RNN)、卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetworks,CNN基礎(chǔ)知識(shí)

功能特點(diǎn)功能特點(diǎn)功能特點(diǎn)模型多層感知機(jī)循環(huán)神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)示例-多層感知機(jī)多層感知機(jī)(MLP)是一種基本的人工神經(jīng)網(wǎng)絡(luò)模型,也是一種前饋神經(jīng)網(wǎng)絡(luò)。它是由多個(gè)神經(jīng)元層組成的,每個(gè)神經(jīng)元層與前一層和后一層之間全連接。步驟一:定義輸入層及各個(gè)神經(jīng)網(wǎng)絡(luò)層參數(shù)。示例-多層感知機(jī)步驟二:構(gòu)建模型。步驟三:進(jìn)行模型訓(xùn)練。示例-循環(huán)神經(jīng)網(wǎng)絡(luò)模型循環(huán)神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱RNN)是一類特殊的人工神經(jīng)網(wǎng)絡(luò),專門用于處理序列數(shù)據(jù)。與傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)不同,RNN具有循環(huán)連接,可以在處理當(dāng)前輸入的同時(shí)記住之前的信息。這種機(jī)制使得RNN在處理具有時(shí)序關(guān)系的數(shù)據(jù),如語音、文本、時(shí)間序列等方面表現(xiàn)出色步驟一:定義輸入層及各個(gè)神經(jīng)網(wǎng)絡(luò)層參數(shù)。示例-循環(huán)神經(jīng)網(wǎng)絡(luò)模型步驟二:構(gòu)建模型。步驟三:進(jìn)行模型訓(xùn)練。示例-卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一類特殊的深度學(xué)習(xí)模型,專門用于處理具有網(wǎng)格結(jié)構(gòu)的數(shù)據(jù),如圖像和視頻。CNN在計(jì)算機(jī)視覺領(lǐng)域取得了顯著的突破,廣泛用于圖像分類、目標(biāo)檢測(cè)、圖像生成等任務(wù)。對(duì)于卷積神經(jīng)網(wǎng)絡(luò)模型,采用包含四個(gè)卷積層、兩個(gè)最大池化層、一個(gè)全連接層的模型,使用Keras實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)的演示代碼如下:步驟一:定義輸入層及卷積層參數(shù)。示例-卷積神經(jīng)網(wǎng)絡(luò)步驟二:構(gòu)建模型。步驟三:進(jìn)行模型訓(xùn)練。示例-卷積神經(jīng)網(wǎng)絡(luò)步驟三:進(jìn)行模型訓(xùn)練。5.2檢測(cè)評(píng)估在深度學(xué)習(xí)模型訓(xùn)練完成之后,可進(jìn)一步測(cè)試評(píng)估其效果,評(píng)估標(biāo)準(zhǔn)可采用Accuracy,Precision等指標(biāo)。例如,采用多層感知機(jī)深度學(xué)習(xí)模型的檢測(cè)演示代碼片段如下:基礎(chǔ)知識(shí)

功能特點(diǎn)功能特點(diǎn)功能特點(diǎn)步驟一:加載模型。5.2檢測(cè)評(píng)估功能特點(diǎn)功能特點(diǎn)功能特點(diǎn)步驟二:按照batchSize劃分?jǐn)?shù)據(jù)集。步驟三:為數(shù)據(jù)貼標(biāo)簽(0,1)。5.2檢測(cè)評(píng)估功能特點(diǎn)功能特點(diǎn)功能特點(diǎn)步驟四:輸出結(jié)果。5.3基于強(qiáng)化學(xué)習(xí)的病毒檢測(cè)優(yōu)缺點(diǎn)

基于強(qiáng)化學(xué)習(xí)的病毒檢測(cè)能夠通過學(xué)習(xí)和優(yōu)化來適應(yīng)不斷變化的惡意軟件形態(tài),提升檢測(cè)的適應(yīng)性和魯棒性;但是該方法在訓(xùn)練過程中可能需要大量樣本和較長(zhǎng)時(shí)間,且模型的可解釋性較差。

所謂強(qiáng)化學(xué)習(xí)(ReinforcementLearning,RL),又稱增強(qiáng)學(xué)習(xí),是機(jī)器學(xué)習(xí)的范式和方法論之一,用于描述和解決智能體(Agent)在與環(huán)境的交互過程中通過學(xué)習(xí)策略以達(dá)成回報(bào)最大化或?qū)崿F(xiàn)特定目標(biāo)的問題?;A(chǔ)知識(shí)示例-DQNAgent

強(qiáng)化學(xué)習(xí)DQNAgent

是強(qiáng)化學(xué)習(xí)庫Keras-RL中的一個(gè)類,用于實(shí)現(xiàn)DeepQ-Network(深度Q網(wǎng)絡(luò))算法的智能體。這個(gè)類負(fù)責(zé)定義和管理智能體的行為,學(xué)習(xí)過程以及與環(huán)境的交互。用于解決離散動(dòng)作空間的馬爾可夫決策問題,其中智能體需要學(xué)習(xí)在不同狀態(tài)下采取最優(yōu)動(dòng)作來最大化累積獎(jiǎng)勵(lì)。步驟一:定義深度學(xué)習(xí)模型。示例-DQNAgent

強(qiáng)化學(xué)習(xí)步驟二:初始化gym環(huán)境。步驟三:初始化策略,記憶體、DQNAgent對(duì)象。示例-DQNAgent

強(qiáng)化學(xué)習(xí)步驟四:模型訓(xùn)練及評(píng)估。6CHAPTERGPT安全防御GPT安全防御代碼漏洞檢測(cè)逆向分析漏洞發(fā)現(xiàn)事件分析與響應(yīng)6.基于ChatGpt的安全防御在網(wǎng)絡(luò)安全攻防領(lǐng)域,ChatGPT猶如一柄技術(shù)雙刃劍,既能輔助攻擊者生成用于社工攻擊的網(wǎng)絡(luò)釣魚郵件和計(jì)算機(jī)病毒(惡意代碼)等,也可助力防御者進(jìn)行

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論