數(shù)據(jù)分析與可視化 課件Chapter2 數(shù)據(jù)可視化_第1頁(yè)
數(shù)據(jù)分析與可視化 課件Chapter2 數(shù)據(jù)可視化_第2頁(yè)
數(shù)據(jù)分析與可視化 課件Chapter2 數(shù)據(jù)可視化_第3頁(yè)
數(shù)據(jù)分析與可視化 課件Chapter2 數(shù)據(jù)可視化_第4頁(yè)
數(shù)據(jù)分析與可視化 課件Chapter2 數(shù)據(jù)可視化_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)分析與可視化第二章數(shù)據(jù)可視化2.1利用數(shù)據(jù)可視化創(chuàng)造有趣的故事2.2可視化的一些最佳實(shí)踐2.3Python中的可視化工具2.4交互式可視化和布局第二章數(shù)據(jù)可視化2《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化GapminderWorld數(shù)據(jù)讀者驅(qū)動(dòng)的敘述的經(jīng)典例子它收集了國(guó)際經(jīng)濟(jì)、環(huán)境、健康、技術(shù)等方面的超過(guò)600個(gè)數(shù)據(jù)指標(biāo),并提供了可以用來(lái)研究現(xiàn)實(shí)世界問(wèn)題并發(fā)現(xiàn)發(fā)展模式、趨勢(shì)和相關(guān)性的工具2.1利用數(shù)據(jù)可視化創(chuàng)造有趣的故事3《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化例:交互式氣泡圖2.1利用數(shù)據(jù)可視化創(chuàng)造有趣的故事4《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化GapminderWorld數(shù)據(jù)實(shí)例可視化技術(shù)領(lǐng)域(1)科學(xué)可視化:這涉及具有固有物理實(shí)體的科學(xué)性的數(shù)據(jù)(2)信息可視化:這涉及抽象數(shù)據(jù)(空間或非空間)執(zhí)行任務(wù)(1)直觀地表示數(shù)據(jù)以幫助提升數(shù)據(jù)分析效果。(2)直觀地展示模型、數(shù)據(jù)解釋、想法、假設(shè)和洞察力。(3)為用戶的假設(shè)找到佐證或反證,以幫助改進(jìn)他們的模型。(4)幫助用戶組織和分享他們的想法。2.1利用數(shù)據(jù)可視化創(chuàng)造有趣的故事5《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化常用可視化方法(1)比較和排序。(2)相關(guān)性。(3)分布。(4)局部與整體的關(guān)系。(5)隨時(shí)間變化的趨勢(shì)。2.2可視化的一些最佳實(shí)踐6《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化比較和排序傳統(tǒng)方式為使用條形圖,但不總是最佳方式例:創(chuàng)造性的可視化展示的方式2.2可視化的一些最佳實(shí)踐7《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化基于GapminderWorld數(shù)據(jù)的非洲GDP排名前12國(guó)家數(shù)據(jù)的可視化展示相關(guān)性相關(guān)矩陣用于同時(shí)研究多個(gè)變量之間的依賴關(guān)系,矩陣中的元素代表變量之間的相關(guān)系數(shù)例:構(gòu)建簡(jiǎn)單散點(diǎn)圖2.2可視化的一些最佳實(shí)踐8《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化不同性別大學(xué)生GPA與運(yùn)動(dòng)和看電視時(shí)長(zhǎng)的關(guān)系例:構(gòu)建散點(diǎn)圖,數(shù)據(jù)之間的關(guān)聯(lián)通過(guò)帶縮放和顏色的圖進(jìn)行展示2.2可視化的一些最佳實(shí)踐9《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化用散點(diǎn)圖表示數(shù)據(jù)的相關(guān)矩陣?yán)河脽釄D表述數(shù)據(jù)的相關(guān)矩陣2.2可視化的一些最佳實(shí)踐10《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化用熱圖表示數(shù)據(jù)的相關(guān)矩陣分布分布分析顯示定量值在其范圍內(nèi)的分布情況常用圖表:直方圖(Histogram)和箱線圖(BoxPlot)直方圖的形狀很大程度上取決于指定的框(bin)的大小和位置;箱線圖非常適合用于顯示多個(gè)分布2.2可視化的一些最佳實(shí)踐11《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化例:用直方圖和箱線圖表述數(shù)據(jù)的相關(guān)矩陣2.2可視化的一些最佳實(shí)踐12《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化學(xué)生成績(jī)分布情況直方圖學(xué)生成績(jī)分布情況箱線圖局部與整體的關(guān)系餅圖通常用于展示局部與整體的關(guān)系分組條形圖適用于將類(lèi)別中的每個(gè)元素與其他元素進(jìn)行比較,以及跨類(lèi)別比較元素堆積柱形圖適合顯示總數(shù),直觀地聚合一個(gè)組中的所有類(lèi)別,其缺點(diǎn)是使比較各個(gè)類(lèi)別的大小變得更加困難。堆疊也能夠表示局部與整體的關(guān)系2.2可視化的一些最佳實(shí)踐13《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化例:堆積柱形圖2.2可視化的一些最佳實(shí)踐14《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化水果消耗情況隨時(shí)間變化的趨勢(shì)例:展示一段時(shí)間內(nèi)的趨勢(shì)2.2可視化的一些最佳實(shí)踐15《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化可穿戴設(shè)備創(chuàng)業(yè)公司投資情況通用軟件工具:即集成開(kāi)發(fā)環(huán)境(IntegratedDevelopmentEnvironment,IDE)特定軟件組合:即Python繪圖庫(kù),如Bokeh、IPython、matplotlib、NetworkX、SciPy和NumPy、scikit-learn和Seaborn2.3Python中的可視化工具16《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化EnthoughtCanopy有在伯克利軟件套件(BerkeleySoftwareDistribution,BSD)開(kāi)源許可協(xié)議下發(fā)布的免費(fèi)版本同時(shí)包括高級(jí)文本編輯器、集成的IPython(交互式Python)控制臺(tái)、圖形包管理器和在線文檔鏈接2.3Python中的可視化工具17《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化2.3Python中的可視化工具18《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化Canopy分析環(huán)境Anaconda和IPython基于Conda的應(yīng)用程序。Conda是一個(gè)用于查找和安裝軟件包的應(yīng)用程序,包含系統(tǒng)級(jí)庫(kù)、Python模塊、可運(yùn)行程序或其他組件的二進(jìn)制tarballAnaconda包含sypder-app(一個(gè)科學(xué)的Python開(kāi)發(fā)環(huán)境),和一個(gè)IPython查看器2.3Python中的可視化工具19《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化2.3Python中的可視化工具20《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化Anaconda用戶界面IPython

提供了一個(gè)增強(qiáng)的交互式Pythonshell附加功能:

(1)制表符補(bǔ)全:制表符補(bǔ)全涉及變量、函數(shù)、方法、屬性和文件名的補(bǔ)全。制表符補(bǔ)全是通過(guò)GNUReadline實(shí)現(xiàn)的,非常便捷。接觸GNUReadline后,很難再愿意使用常規(guī)的命令行界面(CommandLineInterface,CLI)

(2)命令歷史記錄功能:該功能發(fā)布命令歷史記錄,可以完整記錄以前使用的命令2.3Python中的可視化工具21《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化交互式的可視化遵循兩個(gè)標(biāo)準(zhǔn)(1)人工輸入:對(duì)信息的由視覺(jué)表示的某些方面的控制必須可供人控制使用(2)響應(yīng)時(shí)間短:人所做的更改必須能夠及時(shí)“納入”可視化2.4交互式可視化和布局22《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化是否美觀是衡量布局方法強(qiáng)弱的標(biāo)準(zhǔn)之一為了使布局更具可讀性,圖結(jié)構(gòu)需要具有層次結(jié)構(gòu)或?qū)ΨQ(chēng)性,布局的一個(gè)關(guān)鍵因素是空間的利用常用布局方法:(1) 環(huán)狀布局(CircularLayout)(2) 放射狀布局(RadialLayout)(3) 氣球式布局(BalloonLayout)2.4交互式可視化和布局23《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化環(huán)狀布局

環(huán)狀布局可以使用幾種不同的組合(定性和定量)在單個(gè)可視化圖表中顯示例:利用環(huán)狀布局在有限的空間內(nèi)直觀地展示復(fù)雜的關(guān)系2.4交互式可視化和布局24《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化環(huán)狀布局示例放射狀布局

放射狀一種徑向空間填充可視化技術(shù),其根節(jié)點(diǎn)位于圓心,不同層次的節(jié)點(diǎn)被放置在半徑不同的同心圓上,節(jié)點(diǎn)到圓心的距離對(duì)應(yīng)于它的深度2.4交互式可視化和布局25《數(shù)據(jù)分析與可視化》第二章數(shù)據(jù)可視化例:隨著層次的增加,徑向樹(shù)會(huì)將更多的節(jié)點(diǎn)分布在更大的區(qū)域上2.4交互式可視化和布局

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論