版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第10章 數(shù)據(jù)可視化目 錄1數(shù)據(jù)可視化概述可視化工具介紹數(shù)據(jù)可視化的未來2310.1.1 數(shù)據(jù)可視化概述數(shù)據(jù)可視化,是關(guān)于數(shù)據(jù)視覺表現(xiàn)形式的科學(xué)技術(shù)研究??梢暬夹g(shù)是利用計(jì)算機(jī)圖形學(xué)及圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換為圖形或圖像形式顯示到屏幕上,并進(jìn)行交互處理的理論、方法和技術(shù)。數(shù)據(jù)可視化可以通過豐富的視覺效果,把數(shù)據(jù)以更直觀生動,更容易理解的方式呈現(xiàn)給用戶,可以更好地提升數(shù)據(jù)分析的效率和效果。數(shù)據(jù)可視化是大數(shù)據(jù)分析的最后環(huán)節(jié),也是非常關(guān)鍵的一個(gè)環(huán)節(jié)。1、數(shù)據(jù)可視化基本概念數(shù)據(jù)通常是比較枯燥的,人們對于大小、顏色、圖形等會更加具有興趣。數(shù)據(jù)可視化主要是借助于圖形化手段,清晰有效地傳達(dá)與溝通信息。數(shù)據(jù)可
2、視化技術(shù)主要包括以下幾個(gè)基本概念:(1)數(shù)據(jù)空間:是由n維屬性和m個(gè)元素組成的數(shù)據(jù)集所構(gòu)成的多維信息空間;(2)數(shù)據(jù)開發(fā):是指利用一定的算法和工具對數(shù)據(jù)進(jìn)行定量的推演和計(jì)算;1、數(shù)據(jù)可視化基本概念(3)數(shù)據(jù)分析:指對多維數(shù)據(jù)進(jìn)行切片、切塊、旋轉(zhuǎn)等動作剖析數(shù)據(jù),從而能從多角度多側(cè)面觀察數(shù)據(jù);(4)數(shù)據(jù)可視化:是指將大型數(shù)據(jù)集中的數(shù)據(jù)以圖形圖像形式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息的處理過程。可視化技術(shù)應(yīng)用標(biāo)準(zhǔn)應(yīng)該包含以下四個(gè)方面:(1)直觀化。將數(shù)據(jù)直觀、形象的呈現(xiàn)出來。(2)關(guān)聯(lián)化。突出的呈現(xiàn)出數(shù)據(jù)之間的關(guān)聯(lián)性。(3)藝術(shù)性。使數(shù)據(jù)的呈現(xiàn)更具有藝術(shù)性,更加符合審美規(guī)則。(4)交互性
3、。實(shí)現(xiàn)用戶與數(shù)據(jù)的交互,方便用戶控制數(shù)據(jù)。數(shù)據(jù)可視化技術(shù)的基本思想,是將數(shù)據(jù)中每一個(gè)數(shù)據(jù)項(xiàng)作為單個(gè)圖元元素表示,大量的數(shù)據(jù)集構(gòu)成數(shù)據(jù)圖像,同時(shí)將數(shù)據(jù)的各個(gè)屬性值以多維數(shù)據(jù)的形式表示,可以從不同的維度觀察數(shù)據(jù),從而對數(shù)據(jù)進(jìn)行更深入的觀察和分析。2、數(shù)據(jù)可視化的發(fā)展歷程圖10-1 經(jīng)度差異統(tǒng)計(jì)圖圖10-2 反映霍亂患者分布于水井分布的地圖圖10-3 南丁格爾的“雞冠花圖”10.1.2 可視化工具介紹Excel統(tǒng)計(jì)圖形如下圖所示。二、信息圖表工具1、EChartsECharts,Enterprise Charts的縮寫,商業(yè)級數(shù)據(jù)圖表,百度的一個(gè)開源數(shù)據(jù)可視化工具,純 Javascript 的圖表庫
4、2、D3D3的全稱是Data Driven Document,一個(gè)用于實(shí)時(shí)交互式大據(jù)可視化的js庫。 由于這不是一個(gè)工具, 所以在使用它來處理數(shù)據(jù)之前,需要對Javascript有一個(gè)很好的理解。 JavaScript文件的后綴名通常為.js,故 D3 也常使用 D3.js的稱呼。D3 提供了各種簡單易用的函數(shù),將生成可視化的復(fù)雜步驟精簡到了幾個(gè)簡單的函數(shù),只需要輸入幾個(gè)簡單的數(shù)據(jù),就能夠轉(zhuǎn)換為各種絢麗的圖形。3、TableauTableau是桌面系統(tǒng)中相對簡單的商業(yè)智能工具軟件,適合企業(yè)進(jìn)行日常數(shù)據(jù)報(bào)表和數(shù)據(jù)可視化分析工作。Tableau可以與Amazon AWS,MySQL,Hadoop,
5、Teradata和SAP協(xié)作,使之成為一個(gè)能夠創(chuàng)建詳細(xì)圖形和展示直觀數(shù)據(jù)的多功能工具。 這樣高級管理人員和中間鏈管理人員能夠基于包含大量信息且容易讀懂的Tableau圖形作出基礎(chǔ)決策。三、地圖工具1、Modest MapsModest Maps是一個(gè)小型、可擴(kuò)展、交互式的免費(fèi)庫,提供了一套查看衛(wèi)星地圖的API,只有10KB大小,可以用它創(chuàng)建在線地圖,設(shè)計(jì)者可以按照自己的設(shè)想定制,滿足用戶需求。Modest Maps是網(wǎng)站中整合地圖應(yīng)用的理想選擇。三、地圖工具2、Leaflet Leaflet 是一個(gè)為建設(shè)移動設(shè)備友好的互動地圖,而開發(fā)的現(xiàn)代的、開源的 JavaScript 庫,具有開發(fā)人員開發(fā)
6、在線地圖的大部分功能。Leaflet 設(shè)計(jì)堅(jiān)持簡便、高性能和可用性好的思想,在所有主要桌面和移動平臺能高效運(yùn)作,支持插件擴(kuò)展。四、高級語言分析工具數(shù)據(jù)可視化并非是一門簡單的學(xué)科,可以由編程語言根據(jù)規(guī)則實(shí)現(xiàn)的。接下來簡單介紹一些實(shí)現(xiàn)數(shù)據(jù)可視化的編程性語言。(1)R R是用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開放的軟件,是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具。其主要功能包括數(shù)據(jù)存儲和處理系統(tǒng),數(shù)組運(yùn)算工具(強(qiáng)大的向量、矩陣運(yùn)算方面),完整連貫的統(tǒng)計(jì)分析工具,優(yōu)秀的統(tǒng)計(jì)制圖功能,簡便而強(qiáng)大的編程語言,可操縱數(shù)據(jù)的輸入和輸出,可實(shí)現(xiàn)分支、循環(huán)和用戶可自定義功能。
7、(2)PythonPython既有通用編程語言的強(qiáng)大功能,也有特定領(lǐng)域腳本語言(比如 MATLAB 或 R)的易用性。Python 包含數(shù)據(jù)加載、統(tǒng)計(jì)分析、自然語言處理、圖像處理、可視化分析等各種功能的庫。這個(gè)大型工具箱為數(shù)據(jù)科學(xué)家提供了大量的通用功能和專用功能。本教程在第11章詳細(xì)介紹。(3)WekaWeka是一款免費(fèi)的、基于Java環(huán)境的、開源的機(jī)器學(xué)習(xí)以及數(shù)據(jù)挖掘軟件,不但可以對數(shù)據(jù)進(jìn)行預(yù)處理,分類,回歸、聚類、關(guān)聯(lián)規(guī)則及數(shù)據(jù)分析,還可以在新的交互式界面上進(jìn)行可視化。10.1.3 數(shù)據(jù)可視化的未來1、數(shù)據(jù)可視化面臨的挑戰(zhàn)隨著大數(shù)據(jù)技術(shù)的日益發(fā)展,數(shù)據(jù)可視化技術(shù)也日漸成熟,但還是面臨著一些
8、挑戰(zhàn):(1)視覺噪聲。在分析的數(shù)據(jù)集中,大多數(shù)數(shù)據(jù)具備很強(qiáng)的相關(guān)性,不能將其分離作為獨(dú)立對象顯示。(2)大型圖像感知。數(shù)據(jù)可視化不止受限于設(shè)備硬件條件,也受限于現(xiàn)實(shí)世界的感受。10.1.3 數(shù)據(jù)可視化的未來1、數(shù)據(jù)可視化面臨的挑戰(zhàn)(3)信息丟失。減少可視數(shù)據(jù)集的方法可行,但會丟失信息。(4)高性能要求。靜態(tài)可視化對性能要求不高,但動態(tài)可視化對性能要求較高。(5)高速圖像變換。用戶不能對數(shù)據(jù)強(qiáng)化變化后迅速做出反應(yīng)。10.1.3 數(shù)據(jù)可視化的未來1、數(shù)據(jù)可視化面臨的挑戰(zhàn)(3)信息丟失。減少可視數(shù)據(jù)集的方法可行,但會丟失信息。(4)高性能要求。靜態(tài)可視化對性能要求不高,但動態(tài)可視化對性能要求較高。(5)高速圖像變換。用戶不能對數(shù)據(jù)強(qiáng)化變化后迅
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個(gè)人家政服務(wù)長期合作協(xié)議
- 二零二五版馬賽克個(gè)性化定制服務(wù)合同4篇
- 2025版天然氣供應(yīng)合同爭議解決機(jī)制范本模板3篇
- 二零二五年度環(huán)保設(shè)施建設(shè)合同樣本4篇
- 2025年度全國牛羊肉批發(fā)市場聯(lián)動購銷合同
- 二零二五版林木種子繁殖與推廣合同4篇
- 2025年度高層住宅勞務(wù)作業(yè)分包合同實(shí)施細(xì)則
- 2025年度離婚后知識產(chǎn)權(quán)歸屬及使用合同3篇
- 2025版工業(yè)用地購置與房屋租賃合同
- 二零二五年度企業(yè)品牌形象設(shè)計(jì)合同-@-1
- 貴州省2024年中考英語真題(含答案)
- 施工項(xiàng)目平移合同范本
- 家具生產(chǎn)車間規(guī)章制度
- (高清版)JTGT 3360-01-2018 公路橋梁抗風(fēng)設(shè)計(jì)規(guī)范
- 胰島素注射的護(hù)理
- 云南省普通高中學(xué)生綜合素質(zhì)評價(jià)-基本素質(zhì)評價(jià)表
- 2024年消防產(chǎn)品項(xiàng)目營銷策劃方案
- 聞道課件播放器
- 03軸流式壓氣機(jī)b特性
- 五星級酒店收入測算f
- 大數(shù)據(jù)與人工智能ppt
評論
0/150
提交評論