




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
[16]。表2-1模型常見指標實際分類PositiveNegative預(yù)測結(jié)果PositiveTPFPNegativeFNTN(1)查準率(Precision),指預(yù)測結(jié)果中的真正例占所有預(yù)測結(jié)果中的正例的比例,較高的正確率表明,表明該模型具有較好的樣本鑒別能力。(2)召回率(Recall),指預(yù)測結(jié)果中真正例占真正正例的的比例。召回率較高,表明該模型對整個樣品的預(yù)測比率較高,對模型的辨識能力也較強。(3)F1,即正確率與召回率的和諧平均值,用來對模型進行綜合評價。F1值愈高,則表示模式之準確度及可信度愈高。PRF4.3構(gòu)建AttentionLSTM模型文章將注意力機制融入LSTM算法中。首先構(gòu)建LSTM特征模型,實現(xiàn)詞的語義提取,并在此基礎(chǔ)上引入注意機制,注意力機制方法的加權(quán),然后使用Softmax函數(shù),如下圖4-2所示的特定架構(gòu),實現(xiàn)最大限度地對所選屬性進行分類。圖4-2Softmax函數(shù)架構(gòu)建構(gòu)模型過程如下:輸入:輸入的數(shù)據(jù)首先通過嵌入層轉(zhuǎn)換為詞向量x0,x1,x2,…,輸出:句子X的情感分類。在語句鍵中輸入詞矢量x0,x1,x2,…,xi。詞向量進入到LSTM模型中得到隱藏層?j={?0αscore(score在每一時刻,其目的是為輸入的數(shù)據(jù)的特征矢量v進行運算:v最終通過以下公式計算出最終的預(yù)測值:y4.4不同模型的對比試驗為了證明AttentionLSTM模型在影評數(shù)據(jù)中的應(yīng)用效果,使用了SVM、LSTM、Attention?LSTM等模型進行了比較實驗,取得Recall、F1值,作為模型的評價指標。其中,預(yù)處理后的數(shù)據(jù)3.1.4作為實驗的數(shù)據(jù)使用。通過對多個超參試驗中常用的控制變量方法進行對比,選擇了試驗中的試驗超參數(shù),如下表所示:表4-1實驗超參數(shù)參數(shù)參數(shù)值參數(shù)參數(shù)值epchs100Self.in_channels50n_layers2Self.out_chanels128hidden_dim128drop_prob0.5embedding_dim3004.4.1SVM模型的實驗結(jié)果在表4-1的超參量下,通過SVM模型實驗得出的混淆矩陣如下圖4-3所示。圖4-3SVM模型的混淆矩陣由圖可知SVM模型實驗的TP為2789、FN為531、FP為676、TN為689,由此可得SVM模型實驗的Accuracy為0.74236,Precision為0.80490,Recall為0.84006,F(xiàn)1為0.82210。4.3.2LSTM模型的實驗結(jié)果在表4-1的超參量下的LSTM模型實驗得出的混淆矩陣如下圖4-4:圖4-4LSTM模型的混淆矩陣由圖可知AttentionLSTM模型實驗的TP為2213、FN為396、FP為457、TN為682,由此可得AttentionLSTM模型實驗的Accuracy0.77241,Precision為0.82883,Recall為0.84821,F(xiàn)1為0.83840。4.3.3AttentionLSTM模型的實驗結(jié)果在表4-1的超參量下的AttentionLSTM模型實驗得出的混淆矩陣如下圖4-5所示圖4-5AttentionLSTM模型的混淆矩陣由圖可知LSTM模型實驗的TP為2286、FN為323、FP為509、TN為630,由此可得LSTM模型實驗的Accuracy為0.77801,Precision為0.81788,Recall0.87619,F(xiàn)1為0.84603。4.5實驗結(jié)果分析從上文的實驗結(jié)果整理如下表所示:表4-2實驗超參數(shù)ModelAccurayPrecisnRecallF1SVM0.742360.80400.840060.82210LSM0.773410.82830.848210.83840Attlstm0.778010.81780.876190.84603根據(jù)前面實驗結(jié)果,得出以下結(jié)論:通過比較試驗得出的F1值,可以看出,與傳統(tǒng)的支持向量機相比,在更大規(guī)模的樣本上,深度學(xué)習(xí)模型能夠更好地訓(xùn)練出結(jié)果。從表中得結(jié)果來看,AttentionLSTM模型的F1值為0.84603,比LSTM模型的F1值0.83840高0.763%,也是實驗中F1值最高得模型,證明了本文提出得一種將注意力機制融進模型中的AttentionLSTM模型在處理海量數(shù)據(jù)有著較相較于傳統(tǒng)的機器學(xué)習(xí)有著較好的效果。5總結(jié)與展望5.1總結(jié)近些年來,隨著經(jīng)濟的高速發(fā)展,影視行業(yè)也得到了快速發(fā)展。吃飽穿暖后的人們開始重視起精神層面的需求,對影片的質(zhì)量要求更高。因此中國的電影行業(yè)面臨著新挑戰(zhàn)。隨著新冠疫情的結(jié)束,我國電影行業(yè)得到復(fù)蘇,影片的種類及數(shù)量都在增長,而影評網(wǎng)站的評論也變得越來越多,影片制作方要如何從這些海量的評論得出有價值的信息,判斷觀眾的喜好,從而制作出符合電影市場需求的影片。本文以《深海》這部電影為例對此部電影評論進行情感分析。抓取bilibili平臺的評論并對其文本數(shù)據(jù)進行標簽處理、去除停用詞等預(yù)處理操作,本文建構(gòu)了Attention-LSTM模型,并分別與LSTM和SVM模型進行實驗對比,以F1值作為對比實驗的評價標準,實驗結(jié)果表明本文的模型有著較優(yōu)的情感分類性能。5.2展望隨著自然然語言處理技術(shù)的不斷進步,情感分析模型將會越來越精確,能夠更好地理解和處理自然語言的細微差別。未來的研究可以集中在以下幾個方向:模型融合:結(jié)合不同模型的優(yōu)勢,例如將SVM用于特征選擇和初步分類,然后利用LSTM或AttentionLSTM處理更復(fù)雜的序列信息,可能會得到更好的性能。上下文增強:進一步研究如何更有效地整合上下文信息,特別是跨句子或段落的情感關(guān)聯(lián),可能會提升模型在理解整體情感上的準確度??珙I(lǐng)域適應(yīng)性:電影評論情感分析模型可能在特定類型的評價中表現(xiàn)良好,但對于不同領(lǐng)域或語境下的評論可能需要進一步調(diào)整。研究如何讓模型擁有更好的適應(yīng)性和泛化能力是未來發(fā)展的一個重要方向。解釋性和可視化:隨著模型變得越來越復(fù)雜,如何提升它們的解釋性和讓模型的決策過程更加透明,將對于獲得用戶信任和進一步改進模型至關(guān)重要。實時分析:在實現(xiàn)實時或近實時情感分析方面,模型的計算效率和資源消耗也是未來研究的一個重要方面,這對于商業(yè)和實際應(yīng)用尤為重要。這些展望,未來的研究和應(yīng)用將不僅僅關(guān)注模型的性能,也會重視模型的可解釋性、適應(yīng)性以及實時處理能力,以滿足不斷發(fā)展變化的實際需求。參考文獻張延宇.共享經(jīng)濟背景下在線民宿預(yù)訂評價影響因素分析[D].哈爾濱工業(yè)大學(xué),2017.崔連超.互聯(lián)網(wǎng)評論文本情感分析研究[D].山東大學(xué),2016.孟梅.基于BERT-TextCNN-B的電影評論情感分析[D].上海師范大學(xué),2021.李果.基于深度學(xué)習(xí)的國產(chǎn)電影評論情感分析[D].廣西師范大學(xué),2021.張苗.基于深度學(xué)習(xí)的中文評論文本情感分析研究[D].華中科技大學(xué),2020.梁興建,牟定雕.城市攤位可視化管理系統(tǒng)的設(shè)計與實現(xiàn)[J].四川輕化工大學(xué)學(xué)報(自然科學(xué)版),2021,34(04):48-58.丁定生.基于Attention-TreeLSTM的電影評論情感分析研究[D].華中農(nóng)業(yè)大學(xué),2022.DengSY,SinhaAP,ZhaoHM.AdaptingSentimentLexiconstoDomain-SpecificSocialMediaTexts.DecisionSupportSystems,2017,94(2):65-76.PANGB,LEEL,VAITHYANATHANS.Thumbsup?:sentimentclassificationusingmachinelearningtechniques[C]//Proceedingsofthe2002EmpiricalMethodsinNaturalLanguageProcessing.Cambridge,MA:MITPress,2002:79-86程敏.基于文本情感分析和改進的SVM股票趨勢預(yù)測研究[D].鄭州大學(xué),2022.張成博.基于FV-SA-SVM的電影評論情感分析[D].上海師范大學(xué),2020.DOI:10.27312/ki.gshsu.2020.000714.熱克甫·艾則子.基于深度學(xué)習(xí)的文本情感分析關(guān)鍵技術(shù)研究[D].華中科技大學(xué),2023.楊泰然.基于LSTM及新聞情感分析的匯率數(shù)據(jù)預(yù)測研究[D].北京交通大學(xué),2023.DOI:10.26944/ki.gbfju.2022.002368.葉生柱.面向數(shù)據(jù)降維和數(shù)據(jù)不平衡的網(wǎng)絡(luò)入侵檢測方法研究[D].遼寧大學(xué),2023.DOI:10.2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新疆職業(yè)大學(xué)《模擬電子技術(shù)A》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025至2031年中國程控電話交換機用熱敏電阻器行業(yè)投資前景及策略咨詢研究報告
- 2024-2025各個班組三級安全培訓(xùn)考試試題含答案(黃金題型)
- 25年企業(yè)管理人員安全培訓(xùn)考試試題附參考答案(滿分必刷)
- 2024-2025新入職工入職安全培訓(xùn)考試試題附完整答案【易錯題】
- 2025車間員工安全培訓(xùn)考試試題含答案【鞏固】
- 2024-2025職工安全培訓(xùn)考試試題附參考答案(輕巧奪冠)
- 2025至2031年中國磁條擠出機行業(yè)投資前景及策略咨詢研究報告
- 2024-2025安全培訓(xùn)考試試題能力提升
- 2024-2025公司職工安全培訓(xùn)考試試題及答案(奪冠)
- YY-T 0950-2015 氣壓彈道式體外壓力波治療設(shè)備
- GB/T 44218-2024微型揚聲器測量方法
- (正式版)JB∕T 14666-2024 鋼質(zhì)汽車轉(zhuǎn)向節(jié)臂鍛件 工藝規(guī)范
- 《無人機測繪技能訓(xùn)練模塊》課件-模塊7:無人機航測影像獲取
- 人工髖關(guān)節(jié)置換隨訪資料庫模板
- (完整版)12123交管學(xué)法減分考試題及答案
- 腦干的解剖及臨床綜合征
- 人教版高一下學(xué)期期中考試數(shù)學(xué)試卷及答案解析(共五套)
- (高清版)JTG 3810-2017 公路工程建設(shè)項目造價文件管理導(dǎo)則
- FZ∕T 74001-2020 紡織品 針織運動護具
- 人體常見病 知到智慧樹網(wǎng)課答案
評論
0/150
提交評論