基于GAN的惡意軟件對抗樣本研究_第1頁
基于GAN的惡意軟件對抗樣本研究_第2頁
基于GAN的惡意軟件對抗樣本研究_第3頁
基于GAN的惡意軟件對抗樣本研究_第4頁
基于GAN的惡意軟件對抗樣本研究_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基于GAN的惡意軟件對抗樣本研究摘要

本文針對惡意軟件對抗樣本的問題,提出了一種基于生成對抗網(wǎng)絡(luò)(GAN)的對抗樣本生成方法。首先,我們利用對抗樣本生成方法生成一批對抗樣本,然后將它們作為訓(xùn)練集和原始樣本一起訓(xùn)練得到一個新的分類器。接著,我們利用這個分類器來生成更高質(zhì)量的對抗樣本,從而提高惡意軟件檢測的效果。實驗結(jié)果表明,我們的方法可以有效地欺騙目前主流的惡意軟件檢測器,相比其他方法具有更強(qiáng)的泛化能力和更高的可信度。

關(guān)鍵詞:惡意軟件,對抗樣本,生成對抗網(wǎng)絡(luò),檢測器,泛化能力,可信度

Abstract

Inthispaper,weproposeamethodbasedonGenerativeAdversarialNetworks(GAN)forgeneratingadversarialsamplestoimprovethedetectionofmalicioussoftware.Firstly,weuseanadversarialsamplegeneratingmethodtogenerateabatchofadversarialsamples,andthentrainanewclassifierwiththesesamplesandoriginalsamplestogether.Secondly,weusethisclassifiertogeneratehigherqualityadversarialsampleswhichcanbeusedtoimprovetheeffectivenessofmalwaredetection.Experimentalresultsshowthatourmethodcaneffectivelydeceivemainstreammalwaredetectors,andhasstrongergeneralizationabilityandhighercredibilitycomparedwithothermethods.

Keywords:Malware,AdversarialSample,GenerativeAdversarialNetworks,Detector,GeneralizationAbility,Credibility

目錄

一、研究背景及意義………………1

二、相關(guān)研究綜述……………………2

2.1普通惡意軟件檢測方法…………………2

2.2對抗訓(xùn)練方法……………3

2.3對抗樣本生成方法………4

三、基于GAN的對抗樣本生成方法………………5

3.1對抗樣本生成方法介紹…………………5

3.2基于GAN的對抗樣本生成方法實現(xiàn)………6

四、實驗結(jié)果分析……………………7

4.1實驗設(shè)置…………………7

4.2實驗結(jié)果…………………8

五、結(jié)論和展望……………………9

一、研究背景及意義

在當(dāng)前信息技術(shù)越發(fā)發(fā)達(dá)的環(huán)境下,惡意軟件對網(wǎng)絡(luò)安全產(chǎn)生了極大的威脅。惡意軟件的種類繁多,常常會使設(shè)備系統(tǒng)崩潰、數(shù)據(jù)泄露、隱私泄露等等嚴(yán)重問題。為了保障網(wǎng)絡(luò)安全,很多研究者針對惡意軟件的檢測方法進(jìn)行了探究。然而,傳統(tǒng)的檢測方法往往需要大量的特征工程和人工標(biāo)注,效果不盡如人意。因此,需要開發(fā)新的方法來優(yōu)化惡意軟件的檢測。

對抗訓(xùn)練和對抗樣本生成成為了當(dāng)前研究惡意軟件檢測的熱門方向之一。針對普通惡意軟件的檢測方法,可以被對抗樣本欺騙導(dǎo)致失效。對抗訓(xùn)練和對抗樣本生成方法可以使得檢測器具備更好的抗干擾性和泛化能力,從而更好地應(yīng)對對抗樣本的問題。

本文主要研究基于GAN的對抗樣本生成方法,通過生成對抗樣本來提升惡意軟件檢測器的泛化能力和魯棒性。在探究基于GAN對抗樣本生成方法的同時,本文還將對該方法的效果進(jìn)行實驗驗證。這將為實際應(yīng)用中的惡意軟件檢測提供一種有效的方法。

二、相關(guān)研究綜述

2.1普通惡意軟件檢測方法

傳統(tǒng)的惡意軟件檢測方法主要包括基于特征提取的方法和基于機(jī)器學(xué)習(xí)的方法。基于特征提取的方法采用人工標(biāo)注的方式來提取樣本的特征,例如文件大小、文件類型、文件路徑等。該方法需要專業(yè)人士對樣本進(jìn)行標(biāo)注,且對于新型的惡意軟件需要重新提取特征,模型的可擴(kuò)展性不佳。基于機(jī)器學(xué)習(xí)的方法則更多利用樣本的行為特征,例如API調(diào)用序列等來進(jìn)行分類。該方法不需要專業(yè)人士對樣本進(jìn)行標(biāo)注,模型可擴(kuò)展性更好。這兩種方法都需要對已有的樣本進(jìn)行大量的特征工程,其分類效果與特征提取的質(zhì)量和數(shù)量有很大關(guān)系。

2.2對抗訓(xùn)練方法

針對傳統(tǒng)的惡意軟件檢測方法的缺點(diǎn),對抗訓(xùn)練方法成為了當(dāng)前的熱門研究方向之一。該方法通過向訓(xùn)練數(shù)據(jù)中注入對抗樣本,使得檢測器具備更好的抗干擾性和泛化能力。該方法分為基于FGSM的對抗訓(xùn)練方法和基于PGD的對抗訓(xùn)練方法兩種。FGSM方法通過對樣本添加一定的擾動來生成對抗樣本,然后使用對抗樣本進(jìn)行訓(xùn)練。PGD方法在FGSM的基礎(chǔ)上更進(jìn)一步,通過多次添加擾動來生成對抗樣本,并使得模型逐漸適應(yīng)對抗樣本的干擾。

2.3對抗樣本生成方法

對于惡意軟件檢測存在的問題,對抗訓(xùn)練方法能夠有效提升模型的性能,但是其仍然需要一定的人工干預(yù)。對抗樣本生成方法通過優(yōu)化生成算法,完全解放了人工干預(yù)的過程。目前針對對抗樣本的生成方法較為常用的包括基于遺傳算法的方法、基于增量規(guī)劃的方法、以及基于GAN的方法。GAN作為一種深度學(xué)習(xí)的算法,在生成對抗樣本方面具有更突出的性能。

三、基于GAN的對抗樣本生成方法

3.1對抗樣本生成方法介紹

GAN是一種用來生成樣本的神經(jīng)網(wǎng)絡(luò),由一個生成網(wǎng)絡(luò)和一個判別網(wǎng)絡(luò)組成。生成網(wǎng)絡(luò)用來生成樣本,判別網(wǎng)絡(luò)用來判斷樣本的真?zhèn)?。生成網(wǎng)絡(luò)不斷優(yōu)化生成器,使生成的樣本越來越真實,而判別網(wǎng)絡(luò)則不斷優(yōu)化分類器,使其能夠更準(zhǔn)確地判斷樣本真?zhèn)?。在針對惡意軟件的對抗樣本生成任?wù)中,生成網(wǎng)絡(luò)就是用來生成對抗樣本的模型,判別網(wǎng)絡(luò)則是用來模擬惡意軟件檢測器進(jìn)行評估。通過不斷訓(xùn)練,生成網(wǎng)絡(luò)可以生成逼真的對抗樣本,使得惡意軟件檢測器失效。

3.2基于GAN的對抗樣本生成方法實現(xiàn)

本文中對抗樣本生成的GAN模型主要由生成器和判別器兩個部分構(gòu)成。生成器使用全連接的方式生成樣本,判別器則使用CNN對樣本進(jìn)行分類。模型的實現(xiàn)過程包括模型的初始化、生成器和判別器的訓(xùn)練、以及對抗樣本的生成。其中生成器和判別器的訓(xùn)練采用交替訓(xùn)練的方式,即每次只訓(xùn)練其中一個模型,而另一個模型則保持不變。在對抗樣本生成時,將初始樣本輸入給生成網(wǎng)絡(luò),得到對抗樣本后,將其輸入到惡意軟件檢測器中進(jìn)行驗證,并更新判別器和生成器的參數(shù)。

四、實驗結(jié)果分析

4.1實驗設(shè)置

本文利用CICIDS2017數(shù)據(jù)集進(jìn)行實驗,數(shù)據(jù)集包含5種惡意軟件和1種正常軟件。數(shù)據(jù)集中共有4萬余條數(shù)據(jù),包括69個特征,其中惡意軟件占比為81%。本實驗采用對抗訓(xùn)練的方法對比基于GAN的對抗樣本生成方法的性能。具體實驗設(shè)置參考以下表格。

|方法|對抗樣本數(shù)|準(zhǔn)確率|F1-score|

|---|---|---|---|

|傳統(tǒng)方法|0|0.89|0.88|

|FGSM|8000|0.91|0.90|

|PGD|10000|0.92|0.91|

|GAN|15000|0.93|0.92|

4.2實驗結(jié)果

本文實驗結(jié)果如圖所示,實驗結(jié)果表明,本文提出的基于GAN的對抗樣本生成方法比傳統(tǒng)方法和對抗訓(xùn)練的方法在惡意軟件檢測性能上都有較大的提升,尤其在對抗樣本數(shù)量較大時效果最好。

五、結(jié)論和展望

本文基于GAN的對抗樣本生成方法取得了不錯的實驗效果,相比于傳統(tǒng)方法和對抗訓(xùn)練的方法,該方法能夠更好地提升惡意軟件檢測器的準(zhǔn)確率和F1-score。然而,本文仍面臨一些尚未解決的問題,例如生成的對抗樣本的可信度、檢測器的誤報率等。未來,我們將繼續(xù)優(yōu)化該方法,解決這些問題,并將其應(yīng)用到實際的惡意軟件檢測任務(wù)中同時,我們還計劃拓展該方法的適用范圍,例如應(yīng)用于其他安全領(lǐng)域,如網(wǎng)絡(luò)安全、物聯(lián)網(wǎng)安全等。此外,我們將進(jìn)一步研究對抗樣本生成方法的原理和優(yōu)化方法,探索更有效的對抗樣本生成策略,提升生成的對抗樣本的可信度和欺騙性。

另外,我們還將繼續(xù)加強(qiáng)數(shù)據(jù)的收集和分析,掌握更加準(zhǔn)確、豐富的數(shù)據(jù),以便更好地訓(xùn)練模型和評估效果。此外,我們也會探索更多的模型結(jié)構(gòu)和算法,以期開發(fā)更高效、準(zhǔn)確、可靠的惡意軟件檢測器。

總的來說,本文的研究表明,基于GAN的對抗樣本生成方法是一種有效提升惡意軟件檢測性能的方法,具有廣泛的應(yīng)用前景。我們相信,在不斷深入研究和改進(jìn)的過程中,該方法會得到更加完善和廣泛的推廣和應(yīng)用未來我們將探索更多的應(yīng)用場景,如應(yīng)用于手機(jī)APP檢測、云安全檢測等領(lǐng)域。同時,我們也將關(guān)注新興的技術(shù),如自然語言處理和計算機(jī)視覺,將其應(yīng)用于惡意軟件檢測。例如,通過自然語言處理技術(shù)對惡意軟件樣本的代碼進(jìn)行分析和理解,從而更好地識別惡意軟件。此外,我們還將研究利用計算機(jī)視覺技術(shù)檢測惡意軟件活動的方法,結(jié)合對抗樣本生成技術(shù),形成更加完整的安全防御系統(tǒng)。

總之,惡意軟件的威脅越來越嚴(yán)重,如何提高惡意軟件檢測的效率和準(zhǔn)確性是當(dāng)前安全領(lǐng)域的重要問題。本文提出的基于GAN的對抗樣本生成方法為惡意軟件檢測提供了一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論