




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
[12]所做實(shí)驗(yàn)表明,點(diǎn)擊率預(yù)測(cè)問(wèn)題中離線(xiàn)學(xué)習(xí)的AUC指標(biāo)提升0.275%就會(huì)導(dǎo)致在線(xiàn)點(diǎn)擊率指標(biāo)3.9%的提升。因而,離線(xiàn)模型每一點(diǎn)點(diǎn)的指標(biāo)提升都會(huì)給在線(xiàn)預(yù)測(cè)帶來(lái)很大的幫助。模型分析數(shù)據(jù)標(biāo)準(zhǔn)化方法對(duì)性能的影響在將數(shù)據(jù)放入模型之前需要進(jìn)行處理。對(duì)于連續(xù)的數(shù)值型特征,我們一般有min-max標(biāo)準(zhǔn)化和z-score標(biāo)準(zhǔn)化兩種辦法。本文對(duì)比分析了兩種標(biāo)準(zhǔn)化方法處理后的數(shù)據(jù)在模型中的不同效果,實(shí)驗(yàn)結(jié)果如圖3-9和3-10。觀察圖中結(jié)果,我們可以得出以下結(jié)論。對(duì)于MovieLens-1M數(shù)據(jù)集,使用min-max標(biāo)準(zhǔn)化和z-score標(biāo)準(zhǔn)化方法對(duì)模型性能影響很小。而對(duì)于Criteo數(shù)據(jù)集,z-score可以使模型表現(xiàn)更優(yōu)。由此,可以發(fā)現(xiàn),對(duì)于當(dāng)數(shù)據(jù)量較大且數(shù)值型特征呈現(xiàn)正態(tài)分布時(shí),z-score是更為優(yōu)秀的標(biāo)準(zhǔn)化方法。圖3-9不同標(biāo)準(zhǔn)化方法對(duì)比的AUC比較圖3-10不同標(biāo)準(zhǔn)化方法對(duì)比的Logloss比較深度神經(jīng)網(wǎng)絡(luò)層數(shù)對(duì)性能的影響一般認(rèn)為,深度神經(jīng)網(wǎng)絡(luò)層數(shù)的增加有助于模型學(xué)到特征更復(fù)雜的內(nèi)在關(guān)聯(lián),提升模型擬合函數(shù)的能力。但過(guò)多的網(wǎng)絡(luò)層數(shù)也會(huì)過(guò)擬合的問(wèn)題,使得模型難以收斂,反而降低模型的性能。本文對(duì)比不同網(wǎng)絡(luò)層數(shù)對(duì)模型性能的影響,實(shí)驗(yàn)結(jié)果見(jiàn)圖3-11和3-12。為了突出數(shù)據(jù)的變化情況,我們使用左側(cè)的主坐標(biāo)軸表示MovieLens-1M數(shù)據(jù)集上運(yùn)行的值,右側(cè)的次坐標(biāo)軸表示Criteo數(shù)據(jù)集上運(yùn)行的值??梢园l(fā)現(xiàn),對(duì)于兩個(gè)數(shù)據(jù)集,深度神經(jīng)層數(shù)由1層提升為2層能夠明顯提升模型性能。但是當(dāng)層數(shù)達(dá)到4層之后會(huì)發(fā)生過(guò)擬合的現(xiàn)象,AUC下降,Logloss上升。因此,DeepAFM中深度神經(jīng)網(wǎng)絡(luò)層數(shù)設(shè)置為2或3是較為合理的選擇,圖3-11不同深度神經(jīng)網(wǎng)絡(luò)層數(shù)對(duì)比的AUC比較圖3-12不同深度神經(jīng)網(wǎng)絡(luò)層數(shù)對(duì)比的Logloss比較注意力網(wǎng)絡(luò)嵌入維度對(duì)性能的影響接著觀察不同注意力網(wǎng)絡(luò)嵌入維度對(duì)模型的影響。理論上,隨著嵌入維度的不斷提升,模型能夠更多的有效信息。這里比較了嵌入維度分別為8,16,24,32的注意力網(wǎng)絡(luò)對(duì)模型的性能變化。圖3-13和圖3-14是比較結(jié)果。同樣地,為了強(qiáng)調(diào)性能變化情況,圖中左側(cè)主坐標(biāo)軸表示MovieLens-1M數(shù)據(jù)集的運(yùn)行結(jié)果,次坐標(biāo)軸表示Criteo數(shù)據(jù)集的運(yùn)行結(jié)果。從中我們發(fā)現(xiàn):一開(kāi)始隨著嵌入維度的提升,MovieLens-1M數(shù)據(jù)集和Criteo數(shù)據(jù)集都發(fā)生了性能的提升,模型能夠從數(shù)據(jù)中提取更多的信息。對(duì)于MovieLens-1M數(shù)據(jù)集,嵌入維度為32時(shí)發(fā)生過(guò)擬合,Criteo數(shù)據(jù)集由于數(shù)據(jù)量更大,數(shù)據(jù)更為集中,過(guò)擬合現(xiàn)象不明顯??傮w來(lái)說(shuō),考慮到性能和計(jì)算復(fù)雜性等因素,DeepAFM中注意力網(wǎng)絡(luò)的最
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 聲樂(lè)四級(jí)考試試題及答案
- 精算評(píng)估面試題及答案
- 中國(guó)現(xiàn)代藝術(shù)課件
- 2025年中國(guó)攀登睡墊行業(yè)市場(chǎng)全景分析及前景機(jī)遇研判報(bào)告
- 2025春季開(kāi)學(xué)安全教育第一課
- 職業(yè)性腫瘤概述與防治策略
- 2025年新員工培訓(xùn)計(jì)劃
- 檢驗(yàn)科實(shí)習(xí)生培訓(xùn)
- 環(huán)境健康安全培訓(xùn)
- 采光井工程節(jié)能設(shè)計(jì)與綠色施工合同
- 聲樂(lè)課說(shuō)課課件
- 學(xué)生托管班管理制度
- 2024年山東夏季高中學(xué)業(yè)水平合格考生物試卷真題(含答案)
- 2025年經(jīng)濟(jì)學(xué)基礎(chǔ)知識(shí)測(cè)試試題及答案
- 統(tǒng)編版小學(xué)語(yǔ)文小升初專(zhuān)題訓(xùn)練:根據(jù)課文內(nèi)容填空(含答案)
- 2025年高考軍隊(duì)院校征集和招錄人員政治考核表(原表)
- TCCEAS001-2022建設(shè)項(xiàng)目工程總承包計(jì)價(jià)規(guī)范
- 2024年河北省物理組招生計(jì)劃
- 中華民族共同體概論課件專(zhuān)家版3第三講 文明初現(xiàn)與中華民族起源(史前時(shí)期)
- 工業(yè)清洗劑PPT課件
- 質(zhì)量管理七大手法(英文版)
評(píng)論
0/150
提交評(píng)論