《數(shù)據(jù)可視化》教學(xué)課件03第三章 數(shù)據(jù)可視化圖表基礎(chǔ)_第1頁
《數(shù)據(jù)可視化》教學(xué)課件03第三章 數(shù)據(jù)可視化圖表基礎(chǔ)_第2頁
《數(shù)據(jù)可視化》教學(xué)課件03第三章 數(shù)據(jù)可視化圖表基礎(chǔ)_第3頁
《數(shù)據(jù)可視化》教學(xué)課件03第三章 數(shù)據(jù)可視化圖表基礎(chǔ)_第4頁
《數(shù)據(jù)可視化》教學(xué)課件03第三章 數(shù)據(jù)可視化圖表基礎(chǔ)_第5頁
已閱讀5頁,還剩80頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

朱曉峰DT時(shí)代

數(shù)據(jù)可視化導(dǎo)論第三章數(shù)據(jù)可視化圖表基礎(chǔ)19世紀(jì)上半葉的歐洲,伴隨工業(yè)迅速發(fā)展的是城市的擴(kuò)張和人口的增長,但是公共管理并未能與時(shí)俱進(jìn),城市居民極易受到傳染病的侵害。1831年10月,英國第一次爆發(fā)亞洲霍亂,奪走了5萬余生命。在1848–1849和1853–1854年的霍亂流行中,死亡人數(shù)更多?;魜y傳播因何而來又如何傳播?可視化最終給出了答案。【導(dǎo)讀案例】霍亂地圖與傳染病的可視化研究【導(dǎo)讀案例】霍亂地圖與傳染病的可視化研究Snow采用了點(diǎn)圖方式,圖中心東西方向的街道即為Broad大街,黑點(diǎn)表示死亡的地點(diǎn)。死亡發(fā)生地都在街道中部一處水源(公共水泵)周圍本章目錄Directory123基本圖表新型圖表傳統(tǒng)圖表1.1柱狀圖1.2條形圖1.3折線圖1.4散點(diǎn)圖1.5餅圖1.6地圖1基本圖表用于展示多個(gè)分類的數(shù)據(jù)變化和同類別各變量之間的比較情況,適用對象為對比分類數(shù)據(jù),局限在于分類過多則無法展示數(shù)據(jù)特點(diǎn)。1.1柱狀圖1.1柱狀圖1.1柱狀圖提問:此圖反映哪些規(guī)律?1.1柱狀圖——(1)堆積柱狀圖1.1柱狀圖——(2)百分比堆積柱狀圖1.1柱狀圖——(3)雙向柱狀圖5個(gè)主要城市的平均房屋成本提問:哪個(gè)城市變化最大?

適合在同一個(gè)軸上顯示不同分組的各個(gè)分類1.1柱狀圖——(4)分組柱狀圖1.1柱狀圖——(5)個(gè)性化柱狀圖1.1柱狀圖——(5)個(gè)性化柱狀圖

作業(yè):除了已經(jīng)看到的個(gè)性化柱狀圖,還有哪些?1.1柱狀圖——(6)注意事項(xiàng)避免3D,避免空值用于展示多個(gè)分類的數(shù)據(jù)變化和同類別各變量之間的比較情況,適用對象為對比分類數(shù)據(jù),局限在于分類過多則無法展示數(shù)據(jù)特點(diǎn)。1.2條形圖亞洲2008提問:不同時(shí)間各州的人口條形圖?1.2條形圖用于展示數(shù)據(jù)隨時(shí)間或有序類別的波動(dòng)情況的趨勢變化。適用對象為有序的類別,比如時(shí)間,也適用于數(shù)據(jù)量比較大的場景。

局限之處在于無序的類別無法展示數(shù)據(jù)特點(diǎn)。1.3折線形圖1.3折線形圖美國二戰(zhàn)后一段時(shí)間內(nèi),各階層財(cái)富一度是同步增長的,但80年代后差距不斷擴(kuò)大(3條曲線從上到下:真實(shí)收入位于全社會(huì)95百分位、中位數(shù)、20百分位的人群的收入增長速度)用于發(fā)現(xiàn)各變量之間的關(guān)系,適用于存在大量數(shù)據(jù)點(diǎn),而且結(jié)果更精準(zhǔn)的場景下,比如回歸分析。不足之處在于數(shù)據(jù)量小的時(shí)候會(huì)比較混亂。1.4散點(diǎn)圖用來展示各類別占比,比如男女比例。適用于了解數(shù)據(jù)的分布情況,適用反映部分與整體的關(guān)系。

不足在于分類過多,則扇形越小,無法展現(xiàn)圖表。1.5餅圖

相似圖表有環(huán)形圖(挖空的餅圖,中間區(qū)域可以展現(xiàn)數(shù)據(jù)或者文本信息)。1.5餅圖1.5餅圖——環(huán)形圖1.5餅圖——注意事項(xiàng)1.6地圖表達(dá)地球(或其他天體)上各種事物的空間分布、組合、聯(lián)系、數(shù)量和質(zhì)量特征及在時(shí)間中的發(fā)展變化狀態(tài)繪制的圖形?;诘貓D的英國脫歐公投時(shí)各地投票率分析1.6地圖百度地圖的北京通勤圖2.1雷達(dá)圖2.2面積圖2.3漏斗圖2.4氣泡圖2.5瀑布圖2.6南丁格爾玫瑰圖2.7馬賽克圖2.8樹狀圖2.9子彈圖2.10甘特圖2.11直方圖2.12箱線圖2.13維恩圖2.14復(fù)合圖2傳統(tǒng)圖表雷達(dá)圖(RadarChart),又被稱為網(wǎng)絡(luò)圖、蜘蛛圖、極坐標(biāo)圖或者星圖。將多個(gè)分類的數(shù)據(jù)量映射到坐標(biāo)軸上,對比某項(xiàng)目不同屬性的特點(diǎn)。適合了解同類別的不同屬性的綜合情況,以及比較不同類別的相同屬性差異。2.1雷達(dá)圖最近購買時(shí)間、購買頻率和購買商品種類可以用來評價(jià)用戶的忠誠度,平均每次交易額和單詞最高交易額可以用來衡量用戶的消費(fèi)能力。用戶1雖然購買頻率和購買的廣度不高,但其消費(fèi)的能力較強(qiáng)用戶2是頻繁購買用戶,對網(wǎng)站有一定的忠誠度,但其消費(fèi)能力一般。2.1雷達(dá)圖提問:用戶1和用戶2有什么不同?2.1雷達(dá)圖作業(yè):這張雷達(dá)圖反映了什么?1班女生負(fù)責(zé)回答,并簡要解釋說明。2.2面積圖面積圖(Areachart),又稱區(qū)域圖,是指將排列在工作表的列或行中的數(shù)據(jù)繪制到面積圖中,強(qiáng)調(diào)數(shù)量隨時(shí)間而變化的程度,也可用于引起人們對總值趨勢的注意。通過顯示所繪制的值的總和,面積圖還可以顯示部分與整體的關(guān)系。堆積面積圖(三維)、百分比堆積面積圖(三維)、三維簇狀面積圖等2.2面積圖——注意事項(xiàng)當(dāng)數(shù)據(jù)值相距很遠(yuǎn)時(shí),區(qū)域是模糊不清的,不適合使用面積圖。乍一看,很可能會(huì)誤以為圖表上顯示三種不同的顏色2.3漏斗圖漏斗圖是一種直觀表現(xiàn)業(yè)務(wù)流程中轉(zhuǎn)化情況的圖表形式,用梯形面積表示某個(gè)環(huán)節(jié)業(yè)務(wù)量與上一個(gè)環(huán)節(jié)之間的差異。漏斗圖適用于業(yè)務(wù)流程比較規(guī)范、周期長、環(huán)節(jié)多的流程分析,通過漏斗各環(huán)節(jié)業(yè)務(wù)數(shù)據(jù)的比較,能夠直觀地發(fā)現(xiàn)問題所在。漏斗圖還可以用來展示各步驟(如網(wǎng)站購買)的轉(zhuǎn)化率,適用于業(yè)務(wù)流程多的流程分析。2.3漏斗圖「訪問」到「咨詢」環(huán)節(jié)數(shù)據(jù)明顯減少用氣泡代替散點(diǎn)圖的數(shù)值點(diǎn),面積大小代表數(shù)值大小。氣泡圖和散點(diǎn)圖都不使用分類軸,水平軸和垂直軸都是數(shù)值軸。某種角度而言,氣泡圖是散點(diǎn)圖的變體——散點(diǎn)圖只需要繪制X軸和Y軸;氣泡圖,還需繪制Z值表示氣泡的大小,即氣泡圖允許在圖表中額外加入一個(gè)表示大小的變量。2.4氣泡圖2.4氣泡圖美國各大戰(zhàn)爭中的死亡人數(shù)與新冠疫情死亡人數(shù)對比2.5瀑布圖瀑布圖是由麥肯錫顧問公司所獨(dú)創(chuàng)的圖表類型,因?yàn)樾嗡破俨剂魉Q之為瀑布圖。瀑布圖具有自上而下的流暢效果,也可以稱為階梯圖(CascadeChart)或橋圖(BridgeChart)。瀑布圖適合用于表達(dá)各項(xiàng)數(shù)據(jù)與各項(xiàng)數(shù)據(jù)總和的比例,或者用于顯示各項(xiàng)數(shù)據(jù)間的比較。比如評估公司利潤、比較產(chǎn)品收益、突出顯示項(xiàng)目的預(yù)算變更、分析一段時(shí)間內(nèi)的庫存或銷售情況、顯示一段時(shí)間內(nèi)產(chǎn)品價(jià)值變化等。2.5瀑布圖大年初一我國電影票房組成2.6南丁格爾玫瑰圖2.6南丁格爾玫瑰圖又名雞冠花圖(CoxcombChart)或極坐標(biāo)區(qū)域圖。使用扇形的半徑表示數(shù)據(jù)的大小,各扇形的角度則保持一致。對照餅圖,由于半徑和面積的關(guān)系是平方的關(guān)系,南丁格爾玫瑰圖會(huì)將數(shù)據(jù)的比例大小夸大,尤其適合對比大小相近的數(shù)值。2.7馬賽克圖馬賽克圖,也叫做不等寬柱狀,是一個(gè)展示不同分類數(shù)據(jù)的多變量數(shù)據(jù)大小的圖表。根據(jù)不同變量,矩形方塊會(huì)被填充不同的顏色,以區(qū)分?jǐn)?shù)據(jù)。它能夠很好的展示出2個(gè)或者多個(gè)分類型變量的關(guān)系可以定義為用圖像的方式展示分類型數(shù)據(jù)。2.8樹狀圖樹狀圖,也稱為樹枝狀圖,是枚舉法的一種表達(dá)方式。用數(shù)據(jù)樹為圖形表現(xiàn)形式,以父子層次結(jié)構(gòu)來表示親緣關(guān)系。樹狀圖主要是把分類總單位擺在圖上樹枝頂部,然后根據(jù)需要,從總單位中分出幾個(gè)單支,而這些分支,可以作為獨(dú)立的單位,繼續(xù)向下分類,以此類推。樹狀圖中,可以很清晰的看出分支和總單位的部分和整體的關(guān)系,以及這些分枝之間的相互關(guān)系。2.8樹狀圖分公司效率優(yōu)化嵌套圖2.9子彈圖子彈圖(BulletGraph)是一個(gè)可視化實(shí)際與目標(biāo)完成情況的圖表,它的外形很像子彈射出后帶出的軌道,所以叫做子彈圖。2.10甘特圖甘特圖,又稱為橫道圖、條狀圖(Barchart)。內(nèi)在思想簡單,基本是一條線條圖,橫軸表示時(shí)間,縱軸表示活動(dòng)(項(xiàng)目),線條表示在整個(gè)期間上計(jì)劃和實(shí)際的活動(dòng)完成情況。它直觀地表明任務(wù)計(jì)劃在什么時(shí)候進(jìn)行,及實(shí)際進(jìn)展與計(jì)劃要求的對比。2.10甘特圖2.11直方圖直方圖,顯示在連續(xù)間隔,或者是特定時(shí)間段內(nèi)數(shù)據(jù)分布情況的圖表,經(jīng)常被用在統(tǒng)計(jì)學(xué)領(lǐng)域。直方圖描述的是一組數(shù)據(jù)的頻次分布,例如把年齡分成“0-5,5-10,……,80-85”17個(gè)組,統(tǒng)計(jì)一下中國人口年齡的分布情況。直方圖有助于知道數(shù)據(jù)的分布情況,諸如眾數(shù)、中位數(shù)的大致位置、數(shù)據(jù)是否存在缺口或者異常值。2.11直方圖直方圖示意圖箱線圖(Box-plot)又稱為盒須圖、盒式圖或箱形圖,

顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計(jì)圖。因形狀如箱子而得名。常見于品質(zhì)管理。它主要用于反映原始數(shù)據(jù)分布的特征,還可以進(jìn)行多組數(shù)據(jù)分布特征的比較。2.12箱線圖2.12箱線圖提問:哪門課好?哪門課差?韋恩圖(VennDiagram),也叫溫氏圖、維恩圖、范氏圖,是用于顯示集合重疊區(qū)域的關(guān)系圖表,常用于數(shù)學(xué)、統(tǒng)計(jì)學(xué)、邏輯學(xué)等領(lǐng)域。通過圖形與圖形(通常是圓形或者橢圓形)之間的層疊,韋恩圖表示集合與集合之間的相交關(guān)系,或者是不同集合交叉的可能性。2.13韋恩圖2.14復(fù)合圖復(fù)合圖就是指以兩個(gè)或兩個(gè)以上的圖表組合在一起來展現(xiàn)數(shù)據(jù)的圖表類型。有些時(shí)候人們所掌握的數(shù)據(jù)包含的信息太多,只通過單一的圖表不能很好的展現(xiàn)數(shù)據(jù)所表達(dá)的信息。

結(jié)合柱狀圖和折線圖在同一個(gè)圖表展現(xiàn)數(shù)據(jù),適用于要同時(shí)展現(xiàn)兩個(gè)項(xiàng)目數(shù)據(jù)特點(diǎn)的場景中。

但是,柱線圖有柱狀圖和折線圖兩者的缺陷。2.14復(fù)合圖——(1)柱線圖2.14復(fù)合圖——(2)堆積面積圖+百分比堆積柱形圖2.14復(fù)合圖——(3)面積圖+折線圖

2.14復(fù)合圖——(4)柱圖、餅圖、折線圖混合3.1熱力圖(Heatmap)3.2詞云(Wordcloud)3.3桑基圖(Sankeydiagram)3.4弦圖(Chorddiagram)3.5矩形樹圖(Treemap)3.6河流圖(Streamgraph)3.7旭日圖(Sunburstchart)3.8玉玦圖(Radial/CircleBarChart)3.9儀表盤3.10其他圖表3新型圖表3.1熱力圖熱力圖(Heatmap),也可以稱為熱圖、熱量表(HeatTable)、密度表(DensityTable)主要用于展示數(shù)據(jù)的分布情況。3.1熱力圖標(biāo)準(zhǔn)的熱力圖將兩個(gè)連續(xù)數(shù)據(jù)分別映射到x、y軸,第三個(gè)連續(xù)數(shù)據(jù)映射到顏色。熱力圖是三維柱狀圖的俯視圖。3.1熱力圖熱力圖+地圖=熱力地圖。直觀地顯示測量值在整個(gè)地理區(qū)域(國家、省份、州、人口普查區(qū)等)內(nèi)的變化情況,也可以顯示區(qū)域內(nèi)變化程度。3.1熱力圖景區(qū)熱力圖氣象熱力圖3.1熱力圖房產(chǎn)熱力圖該網(wǎng)頁被瀏覽者關(guān)注的區(qū)域3.1熱力圖網(wǎng)站熱力圖3.1熱力圖網(wǎng)站熱力圖以特殊高亮的形式顯示用戶頁面點(diǎn)擊位置或用戶所在頁面位置的圖示。直觀地觀察到用戶的總體訪問情況和點(diǎn)擊偏好。3.2詞云圖詞云(Wordcloud),又稱文字云、標(biāo)簽云(TagCloud)、關(guān)鍵詞云(KeywordCloud),是文本數(shù)據(jù)的視覺表示,由詞匯組成類似云的彩色圖形。早期,詞云圖被廣泛用作各種信息資源(如博客和小門戶)的導(dǎo)航工具,幫助突出顯示具有快速訪問鏈接的最受歡迎標(biāo)簽。3.2詞云圖通過詞云圖,讀者可以快速感知最突出的文字。UI設(shè)計(jì)師的技能要求多為熟練掌握PS和Flash3.2詞云圖除了小說、經(jīng)典、文學(xué)等傳統(tǒng)熱度詞,當(dāng)代青年在外國小說、美學(xué)、繪本、漫畫、詩有較高的熱度。3.2詞云圖

作業(yè):除了已經(jīng)看到的特殊形狀的詞云,還有哪些?2班女生負(fù)責(zé)1-2個(gè),同時(shí)提供鏈接地址和簡要解釋說明3.3?;鶊D?;鶊D(Sankeydiagram)主要由邊、流量和支點(diǎn)組成,其中邊代表了流動(dòng)的數(shù)據(jù),流量代表了流動(dòng)數(shù)據(jù)的具體數(shù)值,節(jié)點(diǎn)代表了不同分類。邊的寬度與流量成比例地顯示,邊越寬,數(shù)值越大。3.3?;鶊D最左邊的支點(diǎn)代表了不同的資金來源,包括社會(huì)、個(gè)人稅收等。右邊是支出,包括交通、環(huán)境保護(hù)、住房、教育、文化等各領(lǐng)域。法國公共管理部門收支情況

自行思考,零花錢去哪里了,能否用?;鶊D繪制?3.3?;鶊D?;鶊D能利用不同顏色很好地把不同的分類數(shù)據(jù)區(qū)分開來。不同的支點(diǎn)就像發(fā)帶一樣,把多如發(fā)絲的邊按照流向“束”起來。大量數(shù)據(jù)經(jīng)過不同的支點(diǎn)再分類后重新出發(fā),流向下一個(gè)分類。3.4弦圖弦圖(Chorddiagram),是一種可視化數(shù)據(jù)關(guān)系的圖表,展示了數(shù)據(jù)之間帶有權(quán)重的關(guān)系。弦圖的名稱來自幾何學(xué)的術(shù)語“弦”(chord)。由于幾何學(xué)中,圓的“弦”是端點(diǎn)均落在圓上的線段。3.5矩形樹圖矩形樹圖(Treemap),把樹狀結(jié)構(gòu)轉(zhuǎn)化為平面矩形的狀態(tài),雖然長得一點(diǎn)都不像“樹”,但能表示數(shù)據(jù)間的層級關(guān)系,還可以展示數(shù)據(jù)的權(quán)重關(guān)系。3.5矩形樹圖最簡單的矩形樹圖只展示一個(gè)類別的數(shù)據(jù)占比,每個(gè)矩形的面積代表了各數(shù)據(jù)在整體中的比重。雙一流學(xué)科建設(shè)情況3.5矩形樹圖矩形樹圖還可以表示兩個(gè)層級的數(shù)據(jù)結(jié)構(gòu),不同類別的數(shù)據(jù)通常用不同顏色展示。OEC(TheObservatoryofEconomicComplexity)用一個(gè)大型的矩形樹圖展示了具有兩個(gè)層級關(guān)系的數(shù)據(jù)結(jié)構(gòu)。3.6河流圖河流圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論