Python數(shù)據(jù)可視化(微課版) 課件 第5章 Python關(guān)系數(shù)據(jù)可視化_第1頁
Python數(shù)據(jù)可視化(微課版) 課件 第5章 Python關(guān)系數(shù)據(jù)可視化_第2頁
Python數(shù)據(jù)可視化(微課版) 課件 第5章 Python關(guān)系數(shù)據(jù)可視化_第3頁
Python數(shù)據(jù)可視化(微課版) 課件 第5章 Python關(guān)系數(shù)據(jù)可視化_第4頁
Python數(shù)據(jù)可視化(微課版) 課件 第5章 Python關(guān)系數(shù)據(jù)可視化_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

主講人:AiPPT時間:20XX.XXPOWERPOINTDESIGN202XPowerPointDesign------------------Python關(guān)系數(shù)據(jù)可視化目錄CONTENTS01關(guān)系數(shù)據(jù)在大數(shù)據(jù)中的應(yīng)用02數(shù)據(jù)分布性的可視化03習題04實訓:Seaborn繪圖與主題更改--------------PowerPointDesign關(guān)系數(shù)據(jù)在大數(shù)據(jù)中的應(yīng)用01PARTPOWERPOINTDESIGN關(guān)系數(shù)據(jù)價值關(guān)系數(shù)據(jù)在大數(shù)據(jù)中用于找到變量間聯(lián)系,發(fā)掘事物背后因果關(guān)系。通過探索變量相關(guān)性,進而探索隱藏的因果關(guān)系。分析數(shù)據(jù)時,可從整體觀察,也可關(guān)注數(shù)據(jù)分布,如數(shù)據(jù)間是否存在重疊或毫不相干,以及各分布數(shù)據(jù)的相關(guān)關(guān)系。數(shù)據(jù)可視化后,圖表所表達的意義至關(guān)重要。關(guān)系數(shù)據(jù)具有關(guān)聯(lián)性和分布性。關(guān)聯(lián)性指數(shù)據(jù)間相互聯(lián)系和影響,如股市中不同股票之間的相關(guān)性;分布性指數(shù)據(jù)在一個或多個維度上的分布情況,如通過直方圖展示單個變量的分布情況。關(guān)系數(shù)據(jù)特性大數(shù)據(jù)挖掘與變量關(guān)聯(lián)散點圖散點圖用于展示兩個變量之間的關(guān)系,通過點的分布判斷相關(guān)性。一般有三種關(guān)系:正相關(guān)、負相關(guān)和不相關(guān)。正相關(guān)時,橫軸數(shù)據(jù)和縱軸數(shù)據(jù)變化趨勢相同;負相關(guān)時,變化趨勢相反;不相關(guān)時散點排列雜亂無章。使用散點圖時要注意:當要在不考慮時間的情況下比較大量數(shù)據(jù)點時,常使用散點圖;即便自變量為連續(xù)性變量,仍然可以使用散點圖;如果在散點圖中有多個序列,考慮將每個點的標記形狀更改為方形、三角形、菱形或其他形狀;散點圖中包含的數(shù)據(jù)越多,比較的效果就越好。散點圖矩陣散點圖矩陣借助兩變量散點圖的作圖方法,是一個大的圖形方陣,其每一個非主對角元素的位置上是對應(yīng)行的變量與對應(yīng)列的變量的散點圖,而主對角元素位置上是各變量名。借助散點圖矩陣可以清晰地看到所研究多個變量兩兩之間的相關(guān)關(guān)系。氣泡圖氣泡圖和散點圖相比,多了一個維度的數(shù)據(jù)。氣泡圖就是將散點圖中沒有大小的“點“變成有大小的“圓”,圓的大小就可以用來表示多出的那一維數(shù)據(jù)的大小。氣泡圖讓我們可以同時比較三個變量。一個具體的例子是二手車的價格由車齡和里程來決定,可以看出,兩個指標越小,氣泡越大,代表價格越高,反之則反。如果使用Python繪制氣泡圖,只需要在散點圖的代碼上進行一些簡單的修改。數(shù)據(jù)關(guān)聯(lián)性的可視化--------------PowerPointDesign數(shù)據(jù)分布性的可視化02PARTPOWERPOINTDESIGN莖葉圖定義與優(yōu)點莖葉圖又稱“枝葉圖”,是由20世紀早期的英國統(tǒng)計學家阿瑟·鮑利(ArthurBowley)設(shè)計。莖葉圖的思路是將數(shù)組中的數(shù)按位數(shù)進行比較,將數(shù)的大小基本不變或變化不大的位作為一主干(莖),將變化大的位的數(shù)作為分枝(葉),列在主干的后面。莖葉圖的優(yōu)點是統(tǒng)計圖上沒有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到。莖葉圖中的數(shù)據(jù)還可以隨時記錄,隨時添加,方便記錄與表示。莖葉圖缺點與繪制莖葉圖的缺點是只便于表示個位之前相差不大的數(shù)據(jù),而且莖葉圖只方便記錄兩組的數(shù)據(jù)。莖葉圖十分直觀且簡單,可以使用Excel方便的進行繪制。莖葉圖直方圖又稱質(zhì)量分布圖,是數(shù)值數(shù)據(jù)分布的精確圖形表示。直方圖中的柱形高度表示的是數(shù)值頻率,柱形的寬度是取值區(qū)間。水平軸和垂直軸與一般的柱形圖不同,它是連續(xù)的;一般的柱形圖的水平軸是分離的。我們可以使用seaborn庫來進行直方圖的繪制,相關(guān)代碼如下。繪制得到的圖表如圖5-8所示。直方圖定義與繪制直方圖密度圖可用它對分布的細節(jié)變化進行可視化處理。當直方圖分段變多時,分段之間的組距就會縮短,此時依著直方圖畫出的折線就會逐漸變成一條光滑的曲線,這條曲線就稱為總體的密度分布曲線。這條曲線可以反映數(shù)據(jù)分布的密度情況。01我們可以使用seaborn庫來進行密度圖的繪制,相關(guān)代碼如下。繪制得到的圖表如圖5-10所示。02密度圖定義與繪制密度圖--------------PowerPointDesign習題03PARTPOWERPOINTDESIGNB.關(guān)聯(lián)性大數(shù)據(jù)分析中,探索變量的哪種關(guān)系是挖掘背后可能隱藏因果關(guān)系的重要一步?D.維度關(guān)系選擇題內(nèi)容C.分布性A.時間序列關(guān)系在數(shù)據(jù)關(guān)聯(lián)性可視化中,使用哪種圖可以展示兩個變量之間的關(guān)系?選擇題氣泡圖是在散點圖基礎(chǔ)上增加了一個維度的數(shù)據(jù)表示。()散點圖不能用于表示兩個以上的變量之間的關(guān)系。()莖葉圖在顯示數(shù)據(jù)分布時,會丟失原始數(shù)據(jù)信息。()判斷題內(nèi)容關(guān)系數(shù)據(jù)在大數(shù)據(jù)中的應(yīng)用主要不包括數(shù)據(jù)的時間序列分析。()直方圖的柱形高度表示的是數(shù)值的頻率。()判斷題大數(shù)據(jù)的一個重要價值是可以幫助我們找到變量之間的________。散點圖可以用于發(fā)現(xiàn)數(shù)據(jù)和________之間的關(guān)聯(lián)關(guān)系。莖葉圖最初是由________設(shè)計的。在使用Python繪制氣泡圖時,可以通過設(shè)置s參數(shù)來調(diào)整________的大小。密度圖可以反映數(shù)據(jù)分布的________情況。填空題內(nèi)容填空題描述數(shù)據(jù)關(guān)聯(lián)性可視化的目的是什么?問答題內(nèi)容散點圖矩陣的基本框架是怎樣的?如何使用Python繪制氣泡圖?直方圖在數(shù)據(jù)分布性可視化中起到什么作用?密度圖與直方圖有什么不同,它們分別適用于什么場景?問答題請設(shè)計一個實驗,使用莖葉圖和直方圖分別展示同一數(shù)據(jù)集,比較它們在表示數(shù)據(jù)分布特性時的優(yōu)勢和不足。給定一組數(shù)據(jù),如何使用散點圖判斷兩個變量之間是否存在相關(guān)性?應(yīng)用題內(nèi)容應(yīng)用題--------------PowerPointDesign實訓:Seaborn繪圖與主題更改04PARTPOWERPOINTDESIGN01在Python環(huán)境中使用Seaborn庫創(chuàng)建多種類型的圖表,并嘗試應(yīng)用不同的主題和樣式來改變圖表的外觀。目標是熟悉Seaborn的基本繪圖功能和主題更改選項,從而提高數(shù)據(jù)可視化的表達力。需求說明內(nèi)容需求說明(3)主題應(yīng)用:探索并應(yīng)用Seaborn的不同主題(如dark,whitegrid等),觀察和比較這些主題對圖表外觀的影響。(4)樣式自定義:嘗試調(diào)整圖表的更多樣式選項,如顏色、字體大小和圖表元素的布局。(1)環(huán)境準備:確保Python環(huán)境已正確安裝,并通過pip安裝Seaborn庫。(2)基本繪圖:按照Seaborn的文檔,創(chuàng)建

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論