《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評論評分_第1頁
《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評論評分_第2頁
《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評論評分_第3頁
《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評論評分_第4頁
《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評論評分_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

單元3分析電影評論評分項目介紹項目一:影評數(shù)據(jù)分析與可視化本項目從某電影網(wǎng)站采集了電影《流浪地球》的部分評論數(shù)據(jù),包括城市、影評內(nèi)容、評分、評論時間、評論點贊數(shù)等,根據(jù)采集的數(shù)據(jù)對電影評論的數(shù)量、點贊數(shù)和評分三個方面進(jìn)行分析,完成數(shù)據(jù)分析可視化,給對科幻電影感興趣的觀影者、電影投資者提供一些參考。01準(zhǔn)備活動點名、復(fù)習(xí)本次課學(xué)習(xí)內(nèi)容、學(xué)習(xí)目標(biāo)介紹學(xué)習(xí)內(nèi)容任務(wù)三分析電影評論評分本任務(wù)從評論評分與城市名稱、評分等級三個方面來分析電影評論評分。通過繪制面積圖、折線圖和詞云圖對電影評論評分情況進(jìn)行分布分析、對比分析,以便全面挖掘該電影的口碑、觀影熱度、觀眾對電影的理解等信息,為觀眾提供觀影參考任務(wù)分解:子任務(wù)1評論評分與城市的關(guān)系分析(面積圖)子任務(wù)2評論評分好評與差評的關(guān)鍵信息分析(詞云圖)學(xué)習(xí)目標(biāo)1、知識(1)掌握matplotlib面積圖的繪制方法(2)掌握jieba分詞

(3)掌握pandas統(tǒng)計詞頻的方法

(4)掌握matplotlib詞云的繪制方法2、技能(1)能使用jieba分詞處理文本(2)能使用matplotlib子庫plotlib根據(jù)數(shù)據(jù)繪制面積圖和詞云圖3、素養(yǎng)(1)嚴(yán)謹(jǐn)認(rèn)真、代碼規(guī)范;(2)數(shù)據(jù)安全、愛國精神;(3)信息檢索能力02發(fā)展活動任務(wù)分析、任務(wù)資訊、任務(wù)實施子任務(wù)1評論評分與城市的關(guān)系分析(面積圖)任務(wù)分析:本任務(wù)需要使用Pandas從CommentInfo.csv文件中讀取數(shù)據(jù),根據(jù)評論評分字段scores和城市名稱字段citys數(shù)據(jù)統(tǒng)計出不同評分及對應(yīng)城市的評論數(shù)量。根據(jù)統(tǒng)計出的不同評分及對應(yīng)城市的評論數(shù)量,取出前五名城市的數(shù)據(jù),使用Matplotlib繪制折線圖和面積圖,要求橫軸為評分,縱軸為評論數(shù)量,顯示不同評分、不同城市的評論數(shù)據(jù)變化趨勢。1.面積圖任務(wù)資訊面積圖對軸和線之間的區(qū)域著色,不僅能夠強(qiáng)調(diào)峰和谷,還能夠強(qiáng)調(diào)高點和低點的持續(xù)時間。高點持續(xù)時間越長,線下面積越大。pyplot模塊可以使用fill_between()函數(shù)和stackplot()函數(shù)繪制面積圖。fill_between()函數(shù)語法格式如下:1.面積圖任務(wù)資訊stackplot()函數(shù)語法格式如下1.面積圖任務(wù)資訊示例:顯示A類產(chǎn)品2022年和2021年季度銷售情況,通過fill_between()函數(shù)繪制面積圖,代碼如下:以上代碼設(shè)置alpha為0.5(半透明),同時繪制了兩條折線圖,能顯示出面積圖的上邊緣,運(yùn)行結(jié)果如圖1-3-2所示1.面積圖任務(wù)資訊示例::顯示A類產(chǎn)品2022年和2021年季度銷售情況,通過stackplot()函數(shù)繪制堆疊面積圖,代碼如下:以上代碼繪制了一個堆疊面積圖,堆疊面積圖有兩個顏色的面積,分別對應(yīng)2022年和2021年的銷售情況,運(yùn)行結(jié)果如圖1-3-3所示。任務(wù)實施步驟:步驟1:初始工作。導(dǎo)入相關(guān)包,Pandas從CommentInfo.csv文件中讀取電影評論數(shù)據(jù),設(shè)置Matplotlib繪圖常用參數(shù)值。步驟2:統(tǒng)計不同評分各城市的評分?jǐn)?shù)量。根據(jù)處理評分字段scores和城市名稱字段citys數(shù)據(jù),統(tǒng)計不同評分及對應(yīng)城市的評分?jǐn)?shù)量,取出評論數(shù)量最多的五個城市的數(shù)據(jù)用于繪圖步驟3:繪制折線圖和面積圖。繪制5條折線圖和5個面積圖,橫軸為評分,縱軸為評論數(shù)量,顯示不同評分、不同城市的評論數(shù)據(jù)變化趨勢。子任務(wù)2評論評分好評與差評的關(guān)鍵信息分析任務(wù)分析:本任務(wù)需要使用Pandas從CommentInfo.csv文件中讀取數(shù)據(jù),根據(jù)評論評分字段scores,按照好評差評標(biāo)準(zhǔn)進(jìn)行分類。對分類的數(shù)據(jù)做jieba分詞后使用WordCloud()繪制好評和差評留言的詞云圖,顯示好評和差評關(guān)鍵字信息。1.詞云圖任務(wù)資訊詞云圖,也叫文字云,即對輸入的一段文字計算詞匯出現(xiàn)的頻率(詞頻),然后根據(jù)詞頻集中顯示高頻詞,簡潔、直觀、高效。詞云圖使人們可以快速感知最突出的文字,迅速抓住重點,了解主旨。制作詞云圖的方法有很多,可以借助第三方網(wǎng)站的在線詞云圖工具,也可以基于Python。這里使用WordCloud制作詞云圖,制作流程如下:1)準(zhǔn)備一段文字。2)使用jieba分詞。3)準(zhǔn)備停用詞。4)WordCloud生成詞云圖示例:簡單分詞,代碼如下:1.詞云圖任務(wù)資訊示例:制作朱自清《春》的詞云圖1.詞云圖任務(wù)資訊修改示例:制作朱自清《春》的詞云圖任務(wù)實施步驟:步驟1:初始工作。導(dǎo)入相關(guān)包,設(shè)置Matplotlib繪圖常用參數(shù)值。步驟2:準(zhǔn)備停用詞。定義stop_words()函數(shù),讀取提供的停用詞文件數(shù)據(jù),按需求定義停用詞。步驟3:定義函數(shù)douban_word_cloud(data_after,title),繪制詞云圖,參數(shù)data_after表示生成詞云圖的文本數(shù)據(jù),參數(shù)title表示生成詞云圖的標(biāo)題步驟4:定義主函數(shù)run(),從文件CommentInfo.csv讀取數(shù)據(jù),根據(jù)評判標(biāo)準(zhǔn)(評分大于等于30的為好評,評分小于30的為差評)把電影評論分為好評和差評,再分別調(diào)用步驟3定義的函數(shù)douban_word_cloud(data_after,title),繪制詞云圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論