《數(shù)據(jù)可視化技術(shù)》 課件 01 分析電影評論數(shù)量、02 分析電影評論點贊數(shù)_第1頁
《數(shù)據(jù)可視化技術(shù)》 課件 01 分析電影評論數(shù)量、02 分析電影評論點贊數(shù)_第2頁
《數(shù)據(jù)可視化技術(shù)》 課件 01 分析電影評論數(shù)量、02 分析電影評論點贊數(shù)_第3頁
《數(shù)據(jù)可視化技術(shù)》 課件 01 分析電影評論數(shù)量、02 分析電影評論點贊數(shù)_第4頁
《數(shù)據(jù)可視化技術(shù)》 課件 01 分析電影評論數(shù)量、02 分析電影評論點贊數(shù)_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

《數(shù)據(jù)可視化技術(shù)》課程介紹課程模塊和項目序號模塊名稱項目名稱學(xué)時1Matplotlib數(shù)據(jù)可視化豆瓣電影數(shù)據(jù)分析與Matplotlib可視化162Echarts數(shù)據(jù)可視化電商銷售數(shù)據(jù)Echarts可視化363Flask+Echarts數(shù)據(jù)可視化高校招生就業(yè)數(shù)據(jù)分析與可視化招聘數(shù)據(jù)分析與可視化44合

計96課程介紹課程目標(biāo)主要面向數(shù)據(jù)可視化工程師崗位,通過學(xué)習(xí)Python、Matplotlib、Flask、Echarts和Web前端技術(shù),將爬取或采集下來的數(shù)據(jù)進行存儲、處理和分析,并以各種圖表的形式進行呈現(xiàn)和展示。重點使用Python進行數(shù)據(jù)分析、Matplotlib和Flask+Echarts進行可視化展現(xiàn),形成圖表,并利用Web頁面展示出來。課程介紹課程考核平時成績(60%)+期末考試(40%)平時成績:學(xué)習(xí)考勤(10%)、綜合素養(yǎng)(10%)、平時訓(xùn)練任務(wù)(40%)期末考試:上機技能測試階段測試(綜合能力)項目介紹本次課開始學(xué)習(xí)項目一:影評數(shù)據(jù)分析與可視化本項目從某電影網(wǎng)站采集了電影《流浪地球》的部分評論數(shù)據(jù),包括城市、影評內(nèi)容、評分、評論時間、評論點贊數(shù)等,根據(jù)采集的數(shù)據(jù)對電影評論的數(shù)量、點贊數(shù)和評分三個方面進行分析,完成數(shù)據(jù)分析可視化,給對科幻電影感興趣的觀影者、電影投資者提供一些參考。單元1分析電影評論數(shù)量01準(zhǔn)備活動點名、復(fù)習(xí)本次課學(xué)習(xí)內(nèi)容、學(xué)習(xí)目標(biāo)介紹學(xué)習(xí)內(nèi)容任務(wù)一分析電影評論數(shù)量本任務(wù)從評論日期、評論者所在城市和星級評分三個方面來分析電影評論數(shù)量。通過繪制折線圖、柱狀圖和餅圖,對電影評論數(shù)量的情況進行對比分析,這有利于全面挖掘該電影的口碑、觀影熱度、觀眾對電影的理解等信息,為觀眾提供觀影參考。子任務(wù)1影評數(shù)量隨日期變化的情況分析(折線圖)任務(wù)分解:子任務(wù)2影評數(shù)量最多的十個城市情況分析(柱形圖)子任務(wù)3評分星級數(shù)量占比情況分析(餅圖)學(xué)習(xí)目標(biāo)1、知識(1)理解數(shù)據(jù)分析以及數(shù)據(jù)分析流程(2)掌握pandas庫的基本操作、數(shù)據(jù)處理基本的選取、統(tǒng)計等函數(shù)(3)掌握matplotlib庫繪制圖形的基本方法,以及折線圖、柱狀圖、餅圖繪制方法2、技能(1)能使用pandas庫讀取文本數(shù)據(jù),按照任務(wù)要求處理數(shù)據(jù)(2)能使用matplotlib子庫plotlib根據(jù)數(shù)據(jù)繪制折線圖、柱狀圖、餅圖3、素養(yǎng)(1)分析問題的能力;(2)團隊溝通能力;(3)培養(yǎng)團隊合作意識。02發(fā)展活動任務(wù)分析、任務(wù)資訊、任務(wù)實施子任務(wù)1:影評數(shù)量隨日期變化的情況分析任務(wù)分析:根據(jù)評論時間字段times提取日期(只提取年月日)數(shù)據(jù)并統(tǒng)計出各日期的評論數(shù)量,繪制折線圖,顯示評論數(shù)量隨日期的變化情況。1.Matplotlib概述任務(wù)資訊Matplotlib是一款用于數(shù)據(jù)可視化的Python軟件包,支持跨平臺運行,它能讓使用3項目1影評數(shù)據(jù)分析與可視化者很輕松地將數(shù)據(jù)圖形化,并且提供多樣化的輸出格式,可以繪制線圖、散點圖、等高線圖、條形圖、柱狀圖、3D圖形,甚至圖形動畫等。常用的數(shù)據(jù)可視化圖表有直方圖、柱狀圖、折線圖、散點圖、餅圖等,如圖1-1-1所示。2.Matplotlib下載與安裝任務(wù)資訊3.pyplot繪圖流程任務(wù)資訊第1步:導(dǎo)入模塊。第2步:準(zhǔn)備數(shù)據(jù)。第3步:畫布子圖。第4步:繪制圖形。第5步:添加標(biāo)簽。第6步:保存顯示。4.折線圖任務(wù)資訊折線圖是以折線的上升或下降來表示統(tǒng)計數(shù)量增減變化的統(tǒng)計圖,它可以直觀地反映數(shù)據(jù)的變化趨勢。pyplot模塊中plot()函數(shù)一般用于繪制線條,包括折線和直線。示例:任務(wù)實施步驟:步驟1:初始工作。導(dǎo)入相關(guān)包,Pandas從CommentInfo.csv文件中讀取電影評論數(shù)據(jù),設(shè)置Matplotlib繪圖的常用參數(shù)值.步驟2:統(tǒng)計各日期的評論數(shù)量。提取評論時間的日期信息,并統(tǒng)計各日期電影評論數(shù)量。步驟3:繪制折線圖。使用Matplotlib繪制折線圖,橫軸為日期,縱軸為日期所對應(yīng)的電影評論數(shù)量,顯示各日期的評論數(shù)量以及變化趨勢。子任務(wù)2影評數(shù)量最多的十個城市情況分析任務(wù)分析:本任務(wù)需要使用Pandas從CommentInfo.csv文件中讀取數(shù)據(jù),統(tǒng)計各城市評論數(shù)量。根據(jù)所統(tǒng)計各城市評論數(shù)量,使用Matplotlib繪制柱狀圖,要求橫軸為城市,縱軸為城市對應(yīng)的電影評論數(shù)量,顯示評論數(shù)量最多的十個城市的情況。1.柱形圖任務(wù)資訊柱狀圖是一種用矩形柱來表示數(shù)據(jù)分類的圖表,柱狀圖可以垂直繪制,也可以水平繪制(水平繪制叫條形圖)。柱狀圖顯示了不同類別之間的比較關(guān)系,它由一系列高度不等的縱向條紋表示數(shù)據(jù)分布的情況。圖表的水平軸x表示被比較的類別,垂直軸Y則表示具體的類別值。pyplot模塊中的bar()函數(shù)用于繪制柱狀圖,barh()函數(shù)用于繪制條形圖。示例:顯示2022年不同種類(A、B、C、D)的銷售數(shù)量,通過bar()函數(shù)繪制柱狀圖,代碼如下:任務(wù)實施步驟:步驟1:初始工作。導(dǎo)入相關(guān)包,Pandas從CommentInfo.csv文件中讀取電影評論數(shù)據(jù),設(shè)置Matplotlib繪圖常用參數(shù)值。步驟2:統(tǒng)計并取出評論數(shù)量最多的十個城市步驟3:繪制柱狀圖。橫軸為城市,縱軸為城市對應(yīng)的電影評論數(shù)量,顯示評論數(shù)量最多的十個城市子任務(wù)3評分星級數(shù)量占比情況分析任務(wù)分析:本任務(wù)需要使用Pandas從CommentInfo.csv文件中讀取數(shù)據(jù),從評論評分字段scores統(tǒng)計各評分的評論數(shù)量。根據(jù)統(tǒng)計出的各評分星級數(shù)量,使用Matplotlib繪制餅圖,顯示各星級評分的占比情況。1.餅圖任務(wù)資訊餅圖用來顯示一個數(shù)據(jù)系列,具體來說,餅圖顯示一個數(shù)據(jù)系列中各項目占項目總和的百分比。餅圖可以清楚地反映部分與部分、部分與整體之間的比例關(guān)系,能直觀地顯示每組數(shù)據(jù)相對于總數(shù)的大小和占比情況。pyplot模塊中的pie()函數(shù)用以繪制餅狀圖,語法格式如下1.餅圖任務(wù)資訊pyplot模塊中的pie()函數(shù)用以繪制餅狀圖,語法格式如下示例:顯示2022年不同種類(A、B、C、D)的銷售數(shù)量的占比情況,通過pie()函數(shù)繪制餅圖,代碼如下任務(wù)實施步驟:步驟1:初始工作。導(dǎo)入相關(guān)包,Pandas從CommentInfo.csv文件中讀取電影評論數(shù)據(jù),設(shè)置Matplotlib繪圖的常用參數(shù)值步驟2:統(tǒng)計各評分的評論數(shù)量。步驟3:繪制餅圖,顯示各評分的占比情況03整合活動總結(jié)、知識點梳理學(xué)習(xí)總結(jié)布置作業(yè):進一步完善任務(wù)。完成拓展題【拓展】分析點贊數(shù)最多的十個評論與星級關(guān)系拓展任務(wù)單元2分析電影評論點贊數(shù)項目介紹項目一:影評數(shù)據(jù)分析與可視化本項目從某電影網(wǎng)站采集了電影《流浪地球》的部分評論數(shù)據(jù),包括城市、影評內(nèi)容、評分、評論時間、評論點贊數(shù)等,根據(jù)采集的數(shù)據(jù)對電影評論的數(shù)量、點贊數(shù)和評分三個方面進行分析,完成數(shù)據(jù)分析可視化,給對科幻電影感興趣的觀影者、電影投資者提供一些參考。01準(zhǔn)備活動點名、復(fù)習(xí)本次課學(xué)習(xí)內(nèi)容、學(xué)習(xí)目標(biāo)介紹學(xué)習(xí)內(nèi)容任務(wù)一分析電影評論點贊數(shù)本任務(wù)從評論點贊數(shù)分布、評論點贊數(shù)對應(yīng)星級、點贊數(shù)日期三個方面來分析電影評論點贊數(shù)。通過繪制直方圖、箱形圖、散點圖和折線圖對電影評論點贊數(shù)情況進行分布分析、對比分析,以便全面了解該電影的口碑、觀影熱度、觀眾對電影的理解等信息,為觀眾提供觀影參考。子任務(wù)1根據(jù)評論點贊數(shù)字段votes繪制直方圖,顯示評論點贊數(shù)分布情況任務(wù)分解:子任務(wù)2根據(jù)評論點贊數(shù)字段votes和評分字段scores繪制箱形圖,顯示評論點贊數(shù)星級分布情況。子任務(wù)3根據(jù)評論日期字段times和點贊數(shù)字段votes繪制散點圖和折線圖,顯示評論點贊數(shù)、評論數(shù)量隨日期變化情況學(xué)習(xí)目標(biāo)1、知識(1)復(fù)習(xí)pandas庫的基本操作、數(shù)據(jù)處理基本的選取、統(tǒng)計等函數(shù)(3)掌握matplotlib庫繪制圖形的基本方法,以及直方圖、箱型圖、散點圖繪制方法2、技能(1)能使用pandas庫讀取文本數(shù)據(jù),按照任務(wù)要求處理數(shù)據(jù)(2)能使用matplotlib子庫plotlib根據(jù)數(shù)據(jù)繪制直方圖、箱型圖、散點圖3、素養(yǎng)(1)分析問題的能力;(2)團隊溝通能力;(3)培養(yǎng)團隊合作意識。02發(fā)展活動任務(wù)分析、任務(wù)資訊、任務(wù)實施子任務(wù)1評論點贊數(shù)分布情況分析(直方圖)任務(wù)分析:本任務(wù)需要使用Pandas從CommentInfo.csv文件中讀取數(shù)據(jù),根據(jù)評論點贊數(shù)字段votes,使用Matplotlib繪制兩個直方圖,顯示評論點贊數(shù)分析情況。第一個直方圖要求橫軸為點贊數(shù)區(qū)間,其范圍為評論點贊數(shù)最小值至最大值之間;縱軸為評論點贊數(shù)。第二個直方圖要求橫軸為點贊數(shù)區(qū)間,范圍為0~5000,縱軸為評論點贊數(shù)。1.子圖任務(wù)資訊一個畫布上默認有一個子圖,Matplotlib圖像組成如圖1-2-1所示??梢詫igure對象理解為畫布;Axes對象表示坐標(biāo)軸區(qū)域,可以認為是子圖,也是真正繪圖的區(qū)域??梢詣?chuàng)建多個畫布,也可以在一個畫布上添加多個子圖。Figure對象允許劃分多個繪圖區(qū)域,每個區(qū)域都是一個Axes對象,每個Axes對象都擁有自己的坐標(biāo)系,即子圖。Figure對象與Axes對象之間的關(guān)系如圖1-2-2所示。1.子圖任務(wù)資訊(1)創(chuàng)建和添加單個子圖:subplot()函數(shù)和add_subplot()方法示例:規(guī)劃兩個子圖,并創(chuàng)建或添加兩個子圖,按照水平排列。2.直方圖任務(wù)資訊直方圖用一系列高度不等的縱向線段來表示數(shù)據(jù)分布的情況。直方圖的橫軸表示數(shù)據(jù)類型,縱軸表示分布情況。直方圖用于概率分布,它顯示了一組數(shù)值序列在給定數(shù)值范圍內(nèi)出現(xiàn)的概率;柱狀圖則用于展示各個類別的頻數(shù)。pyplot模塊中的hist()函數(shù)用以繪制直方圖,語法格式如下2.直方圖任務(wù)資訊示例:顯示A類產(chǎn)品不同價格區(qū)間的銷售數(shù)量,通過hist()函數(shù)繪制直方圖,代碼如下以上代碼通過hist()函數(shù)繪制直方圖,直方圖顯示了8個條柱,顏色為綠色,運行結(jié)果如圖1-2-11所示任務(wù)實施步驟:步驟1:初始工作。導(dǎo)入相關(guān)包,Pandas從CommentInfo.csv文件中讀取電影評論數(shù)據(jù),設(shè)置Matplotlib繪圖常用參數(shù)值。步驟2:獲取所有評論點贊數(shù)以及最大、最小點贊數(shù)。步驟3:繪制直方圖。通過子圖繪制了兩個垂直排列的直方圖。子任務(wù)2評論點贊數(shù)對應(yīng)星級分析任務(wù)分析:在子任務(wù)1的基礎(chǔ)上分析評論點贊數(shù)大于5000的評論的星級情況。本任務(wù)需要使用Pandas從CommentInfo.csv文件中讀取數(shù)據(jù),從評論點贊數(shù)字段votes獲取大于等于5000的評論點贊數(shù)和評分數(shù)據(jù),根據(jù)評論點贊數(shù)和評分數(shù)據(jù),使用Matplotlib繪制箱形圖,顯示評論點贊數(shù)對應(yīng)星級分布情況。1.箱型

圖任務(wù)資訊箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用于顯示一組數(shù)據(jù)分散情況的統(tǒng)計圖,因形狀如箱子而得名。它能顯示出一組數(shù)據(jù)的最大值、最小值、中位數(shù)以及上下四分位數(shù),主要用于反映原始數(shù)據(jù)分布的特征,還可以進行多組數(shù)據(jù)分布特征的比較。在箱形圖中,從上四分位數(shù)到下四分位數(shù)繪制一個盒子,然后用一條垂直觸須(形象地稱為“盒須”)穿過盒子的中間。上垂線延伸至上邊緣(最大值),下垂線延伸至下邊緣(最小值)。箱形圖結(jié)構(gòu)如圖1-2-12所示。圖1-2-12中標(biāo)示了每條線所表示的含義,主要包含6個數(shù)據(jù)節(jié)點。一組數(shù)據(jù)按從大到小排列,分別計算出上邊緣、上四分位數(shù)(Q3)、中位數(shù)、下四分位數(shù)(Q1)、下邊緣,以及異常值1.箱型

圖任務(wù)資訊pyplot模塊中的boxplot()函數(shù)用以繪制箱形圖,語法格式如下:示例:A產(chǎn)品2022年和2021年銷售價格情況分析,通過boxplot()函數(shù)繪制箱形圖,代碼如下以上代碼繪制了箱形圖,分別表示A產(chǎn)品2022年和2021年產(chǎn)品銷售價格分布情況,運行結(jié)果如圖1-2-13所示。任務(wù)實施步驟:步驟1:初始工作。導(dǎo)入相關(guān)包,Pandas從CommentInfo.csv文件中讀取電影評論數(shù)據(jù),設(shè)置Matplotlib繪圖常用參數(shù)值步驟2:獲取評論點贊數(shù)大于等于5000的評論評分和點贊數(shù)。步驟3:繪制箱形圖。按星級分別繪制五個箱形圖,顯示評論點贊數(shù)對應(yīng)星級的分布情況。子任務(wù)3評論點贊數(shù)、評論數(shù)量隨日期變化的情況分析任務(wù)分析:本任務(wù)需要使用Pandas從CommentInfo.csv文件中讀取數(shù)據(jù),處理times字段提取日期信息,并按日期排序,對處理后的數(shù)據(jù)使用Matplotlib繪制散點圖,再按日期統(tǒng)計發(fā)布的評論數(shù)量并繪制折線圖。散點圖和折線圖要求共橫軸,橫軸為日期,左邊縱軸為電影評論點贊數(shù),右邊縱軸為評論數(shù)量,從而顯示評論點贊數(shù)、評論數(shù)量隨日期變化的情況。1.散點圖任務(wù)資訊散點圖用于在水平軸和垂直軸上繪制數(shù)據(jù)點,用點表示變量之間的關(guān)系。它可以展現(xiàn)因變量隨自變量變化的趨勢,用于觀察變量之間的關(guān)系。pyplot模塊中的scatter()函數(shù)用于繪制散點圖。語法格式如下常用參數(shù)含義如下:x,y:長度相同的數(shù)組,也就是我們即將繪制散點圖的輸入數(shù)據(jù)。這兩個參數(shù)是必選的。s:點的大小,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論