《大數(shù)據(jù)》配套之八:第7章大數(shù)據(jù)可視化課件_第1頁(yè)
《大數(shù)據(jù)》配套之八:第7章大數(shù)據(jù)可視化課件_第2頁(yè)
《大數(shù)據(jù)》配套之八:第7章大數(shù)據(jù)可視化課件_第3頁(yè)
《大數(shù)據(jù)》配套之八:第7章大數(shù)據(jù)可視化課件_第4頁(yè)
《大數(shù)據(jù)》配套之八:第7章大數(shù)據(jù)可視化課件_第5頁(yè)
已閱讀5頁(yè),還剩79頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

全國(guó)高校標(biāo)準(zhǔn)教材《云計(jì)算》姊妹篇,剖析大數(shù)據(jù)核心技術(shù)和實(shí)戰(zhàn)應(yīng)用大數(shù)據(jù)劉鵬主編張燕張重生張志立副主編BIGDATA全國(guó)高校標(biāo)準(zhǔn)教材《云計(jì)算》姊妹篇,剖析大數(shù)據(jù)核心技術(shù)和實(shí)戰(zhàn)應(yīng)劉鵬教授,清華大學(xué)博士?,F(xiàn)任南京大數(shù)據(jù)研究院院長(zhǎng)、中國(guó)信息協(xié)會(huì)大數(shù)據(jù)分會(huì)副會(huì)長(zhǎng)、中國(guó)大數(shù)據(jù)技術(shù)與應(yīng)用聯(lián)盟副理事長(zhǎng)。主持完成科研項(xiàng)目25項(xiàng),發(fā)表論文80余篇,出版專業(yè)書籍15本。獲部級(jí)科技進(jìn)步二等獎(jiǎng)4項(xiàng)、三等獎(jiǎng)4項(xiàng)。主編的《云計(jì)算》被全國(guó)高校普遍采用,被引用量在國(guó)內(nèi)計(jì)算機(jī)圖書類排名居前。創(chuàng)辦了知名的中國(guó)云計(jì)算()和中國(guó)大數(shù)據(jù)()網(wǎng)站。曾率隊(duì)奪得2002PennySort國(guó)際計(jì)算機(jī)排序比賽冠軍,兩次奪得全國(guó)高??萍急荣愖罡擢?jiǎng),并三次奪得清華大學(xué)科技比賽最高獎(jiǎng)。榮獲“全軍十大學(xué)習(xí)成才標(biāo)兵”(排名第一)、南京“十大杰出青年”、江蘇省中青年科學(xué)技術(shù)帶頭人、清華大學(xué)“學(xué)術(shù)新秀”等稱號(hào)。劉鵬教授,清華大學(xué)博士。現(xiàn)任南京大數(shù)據(jù)研究院第七章大數(shù)據(jù)概念與應(yīng)用7.1

數(shù)據(jù)可視化基礎(chǔ)7.2大數(shù)據(jù)可視化方法7.3大數(shù)據(jù)可視化軟件與工具習(xí)題全國(guó)高校標(biāo)準(zhǔn)教材《云計(jì)算》姊妹篇,剖析大數(shù)據(jù)核心技術(shù)和實(shí)戰(zhàn)應(yīng)用of413第七章大數(shù)據(jù)概念與應(yīng)用7.1數(shù)據(jù)可視化基礎(chǔ)7.2大數(shù)據(jù)7.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化of414

大數(shù)據(jù)可視化核心問(wèn)題

隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,尤其是移動(dòng)互聯(lián)技術(shù)的發(fā)展,網(wǎng)絡(luò)空間的數(shù)據(jù)量呈現(xiàn)出爆炸式增長(zhǎng)。如何從這些數(shù)據(jù)中快速獲取自己想要的信息,并以一種直觀、形象的方式展現(xiàn)出來(lái)?這就是大數(shù)據(jù)可視化要解決的核心問(wèn)題。數(shù)據(jù)可視化解釋

數(shù)據(jù)可視化,最早可追溯到20世紀(jì)50年代,它是一門關(guān)于數(shù)據(jù)視覺(jué)表現(xiàn)形式的科學(xué)技術(shù)研究。數(shù)據(jù)可視化是一個(gè)處于不斷演變之中的概念,其邊界在不斷地?cái)U(kuò)大,主要指的是技術(shù)上較為高級(jí)的技術(shù)方法,而這些技術(shù)方法允許利用圖形圖像處理、計(jì)算機(jī)視覺(jué)及用戶界面,通過(guò)表達(dá)、建模,以及對(duì)立體、表面、屬性及動(dòng)畫的顯示,對(duì)數(shù)據(jù)加以可視化解釋。本章重點(diǎn)講解

與立體建模之類的特殊技術(shù)方法相比,數(shù)據(jù)可視化所涵蓋的技術(shù)方法要廣泛得多。本章將重點(diǎn)對(duì)大數(shù)據(jù)可視化的基礎(chǔ)知識(shí)、基本概念及大數(shù)據(jù)可視化的常用工具進(jìn)行詳細(xì)講解。7.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化of414大數(shù)據(jù)可7.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化可視化的基本特征易懂性必然性片面性專業(yè)性數(shù)據(jù)可視化的片面性特征要求可視化模式不能替代數(shù)據(jù)本身,只能作為數(shù)據(jù)表達(dá)的一種特定形式專業(yè)化特征是人們從可視化模型中提取專業(yè)知識(shí)的環(huán)節(jié),它是數(shù)據(jù)可視化應(yīng)用的最后流程可視化可以使得碎片化的數(shù)據(jù)轉(zhuǎn)換為具有特定結(jié)構(gòu)的知識(shí),從而為決策支持提供幫助大數(shù)據(jù)所產(chǎn)生的數(shù)據(jù)量必然要求人們對(duì)數(shù)據(jù)進(jìn)行歸納總結(jié),對(duì)數(shù)據(jù)的結(jié)構(gòu)和形式進(jìn)行轉(zhuǎn)換處理of4157.1.1可視化的基本特征7.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化可視化的易懂性必然性7.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化7.1.2可視化的目標(biāo)和作用數(shù)據(jù)可視化的作用主要包括數(shù)據(jù)表達(dá)、數(shù)據(jù)操作和數(shù)據(jù)分析3個(gè)方面,它是以可視化技術(shù)支持計(jì)算機(jī)輔助數(shù)據(jù)認(rèn)識(shí)的3個(gè)基本階段。數(shù)據(jù)表達(dá)數(shù)據(jù)表達(dá)是通過(guò)計(jì)算機(jī)圖形圖像技術(shù)來(lái)更加友好地展示數(shù)據(jù)信息,方便人們閱讀、理解和運(yùn)用數(shù)據(jù)。常見(jiàn)的形式如文本、圖表、圖像、二維圖形、三維模型、網(wǎng)絡(luò)圖、樹結(jié)構(gòu)、符號(hào)和電子地圖等。數(shù)據(jù)操作數(shù)據(jù)操作是以計(jì)算機(jī)提供的界面、接口、協(xié)議等條件為基礎(chǔ)完成人與數(shù)據(jù)的交互需求,數(shù)據(jù)操作需要友好的人機(jī)交互技術(shù)、標(biāo)準(zhǔn)化的接口和協(xié)議支持來(lái)完成對(duì)多數(shù)據(jù)集合或者分布式的操作。數(shù)據(jù)分析數(shù)據(jù)可視化可以有效地表達(dá)數(shù)據(jù)的各類特征,幫助人們推理和分析數(shù)據(jù)背后的客觀規(guī)律,進(jìn)而獲得相關(guān)知識(shí),提高人們認(rèn)識(shí)數(shù)據(jù)的能力和利用數(shù)據(jù)的水平。of4167.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化7.1.2可視化的目7.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化7.1.3數(shù)據(jù)可視化流程數(shù)據(jù)獲取主動(dòng)式是以明確的數(shù)據(jù)需求為目的,如衛(wèi)星影像、測(cè)繪工程等;被動(dòng)式是以數(shù)據(jù)平臺(tái)為基礎(chǔ),由數(shù)據(jù)平臺(tái)的活動(dòng)者提供數(shù)據(jù)來(lái)源,如電子商務(wù)、網(wǎng)絡(luò)論壇等。數(shù)據(jù)處理數(shù)據(jù)處理是指對(duì)原始的數(shù)據(jù)進(jìn)行質(zhì)量分析、預(yù)處理和計(jì)算等步驟。數(shù)據(jù)處理的目標(biāo)是保證數(shù)據(jù)的準(zhǔn)確性、可用性。12可視化模式可視化模式是數(shù)據(jù)的一種特殊展現(xiàn)形式,常見(jiàn)的可視化模式有標(biāo)簽云、序列分析、網(wǎng)絡(luò)結(jié)構(gòu)、電子地圖等??梢暬J降倪x取決定了可視化方案的雛形??梢暬瘧?yīng)用可視化應(yīng)用主要根據(jù)用戶的主觀需求展開(kāi),最主要的應(yīng)用方式是用來(lái)觀察和展示,通過(guò)觀察和人腦分析進(jìn)行推理和認(rèn)知,輔助人們發(fā)現(xiàn)新知識(shí)或者得到新結(jié)論。34of4177.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化7.1.3數(shù)據(jù)可視化第七章大數(shù)據(jù)概念與應(yīng)用7.1

數(shù)據(jù)可視化基礎(chǔ)7.2大數(shù)據(jù)可視化方法7.3大數(shù)據(jù)可視化軟件與工具習(xí)題全國(guó)高校標(biāo)準(zhǔn)教材《云計(jì)算》姊妹篇,剖析大數(shù)據(jù)核心技術(shù)和實(shí)戰(zhàn)應(yīng)用of418第七章大數(shù)據(jù)概念與應(yīng)用7.1數(shù)據(jù)可視化基礎(chǔ)7.2大數(shù)據(jù)7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.1文本可視化

標(biāo)簽云of419如圖所示是一種稱為標(biāo)簽云(WordClouds或TagClouds)的典型的文本可視化技術(shù)。它將關(guān)鍵詞根據(jù)詞頻或其他規(guī)則進(jìn)行排序,按照一定規(guī)律進(jìn)行布局排列,用大小、顏色、字體等圖形屬性對(duì)關(guān)鍵詞進(jìn)行可視化。一般用字號(hào)大小代表該關(guān)鍵詞的重要性,該技術(shù)多用于快速識(shí)別網(wǎng)絡(luò)媒體的主題熱度。7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.1文本可視7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.1動(dòng)態(tài)文本時(shí)序信息可視化

有些文本的形成和變化過(guò)程與時(shí)間是緊密相關(guān)的,因此,如何將動(dòng)態(tài)變化的文本中時(shí)間相關(guān)的模式與規(guī)律進(jìn)行可視化展示,是文本可視化的重要內(nèi)容。引入時(shí)間軸是一類主要方法,常見(jiàn)的技術(shù)以河流圖居多。河流圖按照其展示的內(nèi)容可以劃分為主題河流圖、文本河流圖及事件河流圖等。of41107.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.1動(dòng)態(tài)文本7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.2網(wǎng)絡(luò)圖可視化

(1)Nodal研究人員及其組織機(jī)構(gòu)社會(huì)網(wǎng)絡(luò)圖

(2)基于節(jié)點(diǎn)連接的圖和樹可視化方法of41117.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.2網(wǎng)絡(luò)圖可7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.2網(wǎng)絡(luò)圖可視化

of4112(3)基于空間填充的樹可視化(4)基于邊捆綁的大規(guī)模密集圖可視化7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.2網(wǎng)絡(luò)圖可7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.3時(shí)空數(shù)據(jù)可視化

流式地圖結(jié)合了捆綁技術(shù)的流式地圖結(jié)合了密度圖技術(shù)的流式地圖of41137.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.3時(shí)空數(shù)據(jù)7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.3時(shí)空數(shù)據(jù)可視化

時(shí)空立方體融合散點(diǎn)圖與密度圖技術(shù)的時(shí)空立方體融合堆積圖技術(shù)的時(shí)空立方體

of41147.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.3時(shí)空數(shù)據(jù)7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.4多維數(shù)據(jù)可視化

of41151、散點(diǎn)圖(

ScatterPlot)散點(diǎn)圖(ScatterPlot)是最為常用的多維可視化方法。二維散點(diǎn)圖將多個(gè)維度中的兩個(gè)維度屬性值集合映射至兩條軸,在二維軸確定的平面內(nèi)通過(guò)圖形標(biāo)記的不同視覺(jué)元素來(lái)反映其他維度屬性值。二維散點(diǎn)圖能夠展示的維度十分有限,研究者將其擴(kuò)展到三維空間,通過(guò)可旋轉(zhuǎn)的ScatterPlot方塊(dice)擴(kuò)展了可映射維度的數(shù)目,如圖所示。散點(diǎn)圖適合對(duì)有限數(shù)目的較為重要的維度進(jìn)行可視化,通常不適于需要對(duì)所有維度同時(shí)進(jìn)行展示的情況。7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.4多維數(shù)據(jù)7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.4多維數(shù)據(jù)可視化

2、投影(Projection)投影是能夠同時(shí)展示多維的可視化方法之一。VaR將各維度屬性列集合通過(guò)投影函數(shù)映射到一個(gè)方塊形圖形標(biāo)記中,并根據(jù)維度之間的關(guān)聯(lián)度對(duì)各個(gè)小方塊進(jìn)行布局。基于投影的多維可視化方法一方面反映了維度屬性值的分布規(guī)律,同時(shí)也直觀地展示了多維度之間的語(yǔ)義關(guān)系。of41167.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.4多維數(shù)據(jù)7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.4多維數(shù)據(jù)可視化

3、平行坐標(biāo)(ParallelCoordinates)平行坐標(biāo)是研究和應(yīng)用最為廣泛的一種多維可視化技術(shù),將維度與坐標(biāo)軸建立映射,在多個(gè)平行軸之間以直線或曲線映射表示多維信息。

平行坐標(biāo)多維可視化技術(shù)集成了散點(diǎn)圖和柱狀圖的平行坐標(biāo)工具平行坐標(biāo)圖聚簇可視化of41177.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.4多維數(shù)據(jù)第七章大數(shù)據(jù)概念與應(yīng)用7.1

數(shù)據(jù)可視化基礎(chǔ)7.2大數(shù)據(jù)可視化方法7.3大數(shù)據(jù)可視化軟件與工具習(xí)題全國(guó)高校標(biāo)準(zhǔn)教材《云計(jì)算》姊妹篇,剖析大數(shù)據(jù)核心技術(shù)和實(shí)戰(zhàn)應(yīng)用of4118第七章大數(shù)據(jù)概念與應(yīng)用7.1數(shù)據(jù)可視化基礎(chǔ)7.2大數(shù)據(jù)7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.1Excel利用Excel的可視化規(guī)則實(shí)現(xiàn)數(shù)據(jù)的可視化展示Excel圖表樣式利用Excel圖表中的折線圖制作的“工資”和“年齡”數(shù)據(jù)展示Excel是MicrosoftOffice的組件之一,是由Microsoft為Windows和AppleMacintosh操作系統(tǒng)的計(jì)算機(jī)編寫和運(yùn)行的一款表格計(jì)算軟件。Excel是微軟辦公套裝軟件的一個(gè)重要組成部分,它可以進(jìn)行各種數(shù)據(jù)的處理、統(tǒng)計(jì)分析、數(shù)據(jù)可視化顯示及輔助決策操作,廣泛地應(yīng)用于管理、統(tǒng)計(jì)、財(cái)經(jīng)、金融等眾多領(lǐng)域。of41197.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.1E7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2ProcessingProcessing在數(shù)據(jù)可視化領(lǐng)域有著廣泛的應(yīng)用,可制作信息圖形、信息可視化、科學(xué)可視化和統(tǒng)計(jì)圖形等。下面通過(guò)一個(gè)簡(jiǎn)單實(shí)例來(lái)認(rèn)識(shí)一下如何利用Processing實(shí)現(xiàn)數(shù)據(jù)的可視化展示。StateNameLocation-xLocation-yvalueAlabama(AL)4392700.1Alaska(AK)94325-5.3Arizona(AZ)1482413Arkansas(AR)3682477California(CA)5617611Colorado(CO)2201831.5Washington(WA)92382.2WestVirginia(WV)4961785.4Wisconsin(WI)3921033.1Wyoming(WY)207125-6

美國(guó)各州GDP增長(zhǎng)率(數(shù)據(jù)隨機(jī)生成)of41207.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2P7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2Processing第一步,聲明(初始化)變量,代碼如下:PImagemapImage;TablelocationTable;TablenameTable;introwCount;

TabledataTable;floatdataMin=MAX_FLOAT;floatdataMax=MIN_FLOAT;of41217.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2P7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2Processing

第二步,初始化畫布,加載(生成)數(shù)據(jù),代碼如下:voidsetup(){size(640,400);mapImage=loadImage("map.png");//加載地圖locationTable=newTable("locations.tsv");//加載位置信息nameTable=newTable("names.tsv");//加載名稱信息rowCount=locationTable.getRowCount();

dataTable=newTable("random.tsv");//加載隨機(jī)數(shù)據(jù)for(introw=0;row<rowCount;row++){floatvalue=dataTable.getFloat(row,1);if(value>dataMax){dataMax=value;}if(value<dataMin){dataMin=value;}}PFontfont=loadFont("Univers-Bold-12.vlw");textFont(font);

smooth();noStroke();}of41227.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2P7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2Processing第三步,調(diào)用繪制函數(shù)繪制圖形,代碼如下:voiddraw(){background(255);image(mapImage,0,0);

for(introw=0;row<rowCount;row++){Stringabbrev=dataTable.getRowName(row);floatx=locationTable.getFloat(abbrev,1);floaty=locationTable.getFloat(abbrev,2);drawData(x,y,abbrev);}}

voiddrawData(floatx,floaty,Stringabbrev){floatvalue=dataTable.getFloat(abbrev,1);floatradius=0;if(value>=0){radius=map(value,0,dataMax,1.5,15);fill(#333366);//blue}else{radius=map(value,0,dataMin,1.5,15);fill(#ec5166);//red}ellipseMode(RADIUS);ellipse(x,y,radius,radius);

if(dist(x,y,mouseX,mouseY)<radius+2){fill(0);textAlign(CENTER);Stringname=nameTable.getString(abbrev,1);text(name+""+value,x,y-radius-4);}}7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2P7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.3NodeXLNodeXL不僅具備常見(jiàn)的分析功能,如計(jì)算中心性、PageRank值、網(wǎng)絡(luò)連通度、聚類系數(shù)等,還能對(duì)暫時(shí)性網(wǎng)絡(luò)進(jìn)行處理。在布局方面,NodeXL主要采用力導(dǎo)引布局方式。NodeXL的一大特色是可視化交互能力強(qiáng),具有圖像移動(dòng)、變焦和動(dòng)態(tài)查詢等交互功能。其另一特色是可直接與互聯(lián)網(wǎng)相連,用戶可通過(guò)插件或直接導(dǎo)入E-mail或微博網(wǎng)頁(yè)中的數(shù)據(jù)。準(zhǔn)備數(shù)據(jù)步驟生成頂點(diǎn)生成網(wǎng)絡(luò)圖of41247.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.3N7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41251、準(zhǔn)備數(shù)據(jù)從開(kāi)始菜單中打開(kāi)一個(gè)NodeXL的模板,在“Edges”工作表中輸入準(zhǔn)備好的數(shù)據(jù),如圖所示。每條邊包含兩個(gè)Vertex及其相關(guān)的屬性(Color、Width、Label等)。ResearchersResearchOrganizationNatasaMilic-FraylingMicrosoftResearchCambridgeMarcSmithConnectedActionConsultingGroupBenShneidermanUniversityofMarylandDerekHansenBrighamYoungUniversityCodyDunneUniversityofMarylandEduardaMendesRodriguesUniversityofPortoUdayanKhouranaUniversityofMarylandJureLeskovecStanfordUniversityBernieHoganOxfordInternetInstituteItaiHimelboimUniversityofGeorgiaLibbyHemphillIllinoisInstituteofTechnologyRobertAcklandAustralianNationalUniversityScottGolderCornellUniversityVladimirBarashMorningsideAnalyticsNodeXL主要研究人員及其所在研究組織在“Edge”工作表中輸入邊的信息7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41257.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41262、生成頂點(diǎn)在“Edge”工作表中錄入邊的信息后,打開(kāi)“GraphMetrics”對(duì)話框,勾選所有可選項(xiàng),單擊“CalculateMetri”按鈕,此時(shí)系統(tǒng)會(huì)自動(dòng)識(shí)別出所有的頂點(diǎn)信息,并將其記錄在“Vertex”工作表中,同時(shí)還可以得到圖形度量方面的有關(guān)數(shù)值,例如,圖形類型、頂點(diǎn)個(gè)數(shù)、邊數(shù)目、重復(fù)的邊數(shù)目、總邊數(shù)、圖形密度等數(shù)據(jù)。然后,打開(kāi)“AutofillColumns”對(duì)話框,設(shè)置自動(dòng)填充的選項(xiàng)值(這些值來(lái)自計(jì)算出的圖形度量數(shù)據(jù))。用戶也可以在“Vertex”工作表中對(duì)每個(gè)頂點(diǎn)的屬性進(jìn)行自定義設(shè)置,使得最終的網(wǎng)絡(luò)圖呈現(xiàn)出不同的樣式。本例中設(shè)置每個(gè)頂點(diǎn)“Shape”屬性值為“Image”,“ImageFile”輸入頂點(diǎn)的圖片地址(也可以是URL)。“GraphMetrics”對(duì)話框“AutofillColumns”對(duì)話框系統(tǒng)生成的“Vertex”工作表數(shù)據(jù)7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41267.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41273、生成網(wǎng)絡(luò)圖上述兩個(gè)步驟設(shè)置完畢后,單擊“RefreshGraph”按鈕即可看到最終的網(wǎng)絡(luò)圖。從網(wǎng)絡(luò)圖中可以清楚地看到參與NodeXL研究的組織機(jī)構(gòu)(內(nèi)層節(jié)點(diǎn))及研究人員(外層節(jié)點(diǎn))。使用可以得到圖形度量方面的有關(guān)數(shù)值,這些數(shù)值清晰明了,獲得的基本數(shù)值有圖形類型、頂點(diǎn)個(gè)數(shù)、邊數(shù)目、重復(fù)的邊數(shù)目、總邊數(shù)、圖形密度等數(shù)據(jù)。最終的網(wǎng)絡(luò)圖7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41277.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.4EChartsECharts自2013年6月正式發(fā)布1.0版本以來(lái),在短短兩年多的時(shí)間,功能不斷完善,截至目前,ECharts已經(jīng)可以支持包括折線圖(區(qū)域圖)、柱狀圖(條狀圖)、散點(diǎn)圖(氣泡圖)、K線圖、餅圖(環(huán)形圖)、雷達(dá)圖(填充雷達(dá)圖)、和弦圖、力導(dǎo)向布局圖、地圖、儀表盤、漏斗圖、事件河流圖12類圖表,同時(shí)提供標(biāo)題、詳情氣泡、圖例、值域、數(shù)據(jù)區(qū)域、時(shí)間軸、工具箱7個(gè)可交互組件,支持多圖表、組件的聯(lián)動(dòng)和混搭展現(xiàn)。ECharts制作的圖表of41287.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.4E7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of4129ECharts圖表工具為用戶提供了詳細(xì)的幫助文檔,這些文檔不僅介紹了每類圖表的使用方法,還詳細(xì)介紹了各類組件的使用方法,每類圖表都提供了豐富的實(shí)例。用戶在使用時(shí)可以參考實(shí)例提供的代碼,稍加修改就可以滿足自己的圖表展示需求。接下來(lái)結(jié)合ECharts提供的一個(gè)2010年世界人口分布圖的實(shí)例來(lái)詳細(xì)介紹一下ECharts的使用方法。如圖所示是2010年世界人口數(shù)據(jù)。國(guó)

家人口數(shù)量China1

359

821

465India1

205

624

648UnitedStatesofAmerica312

247

116UnitedKingdom62

066

350……2010年世界人口數(shù)據(jù)7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41297.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of4130實(shí)現(xiàn)代碼:option={title:{text:'WorldPopulation(2010)',subtext:'fromUnitedNations,Totalpopulation,bothsexescombined,asof1July(thousands)',sublink:'/wpp/Excel-Data/population.htm',left:'center',top:'top'},tooltip:{trigger:'item',formatter:function(params){varvalue=(params.value+'').split('.');value=value[0].replace(/(\d{1,3})(?=(?:\d{3})+(?!\d))/g,'$1,')+'.'+value[1];returnparams.seriesName+'<br/>'++':'+value;}},toolbox:{show:true,orient:'vertical',left:'right',top:'center',feature:{mark:{show:true},dataView:{show:true,readOnly:false},restore:{show:true},saveAsImage:{show:true}}},visualMap:{min:0,max:1000000,text:['High','Low'],realtime:false,calculable:true,color:['orangered','yellow','lightskyblue']},series:[{name:'WorldPopulation(2010)',type:'map',mapType:'world',//world、china、europe等roam:true,itemStyle:{emphasis:{label:{show:true}}},data:[//此處是我們要展示的數(shù)據(jù)(如果是網(wǎng)絡(luò)動(dòng)態(tài)數(shù)據(jù),可以在程序中用json數(shù)據(jù)實(shí)時(shí)傳遞過(guò)來(lái){name:'China',value:1359821.465},{name:'India',value:1205624.648},{name:'UnitedStatesofAmerica',value:312247.116},……]}]};7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41307.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of4131上方的圖所示是利用ECharts展示的可交互的世界人口分布圖。用戶通過(guò)將鼠標(biāo)移入不同的國(guó)家(地區(qū))內(nèi)部,即可查看到該國(guó)家(地區(qū))的人口數(shù)量;左下角的垂直滾動(dòng)條可以用于設(shè)置地圖上可視數(shù)據(jù)的最大值和最小值,用戶可以通過(guò)調(diào)整滑塊來(lái)展示某個(gè)區(qū)間的數(shù)據(jù)。例如,下方圖所示為人口數(shù)量超過(guò)1億的國(guó)家(地區(qū))分布情況。利用ECharts展示的可交互的世界人口分布圖人口數(shù)量超過(guò)1億的國(guó)家(地區(qū))分布情況7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41317.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of4132通過(guò)對(duì)ECharts案例代碼的分析,當(dāng)用戶需要在地圖上展示自己的數(shù)據(jù)時(shí),只需要更改相關(guān)的幾個(gè)屬性值即可。如圖所示是借助ECharts制作的許昌學(xué)院2015年新生生源分布圖。在上面的實(shí)例代碼基礎(chǔ)上要實(shí)現(xiàn)這個(gè)實(shí)際問(wèn)題的圖表展示非常簡(jiǎn)單,只需要更改代碼中的兩處即可:一處是地圖類型(mapType),將字符串“world”改為“china”;另一處是數(shù)據(jù)(Data),這個(gè)根據(jù)具體的需求,將數(shù)據(jù)傳入ECharts工具中。借助ECharts制作的2015年新生生源分布圖(按省、直轄市、自治區(qū)統(tǒng)計(jì))7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41321數(shù)據(jù)可視化有哪些基本特征?2簡(jiǎn)述可視化技術(shù)支持計(jì)算機(jī)輔助數(shù)據(jù)認(rèn)識(shí)的3個(gè)基本階段。3數(shù)據(jù)可視化對(duì)數(shù)據(jù)的綜合運(yùn)用有哪幾個(gè)步驟?4簡(jiǎn)述數(shù)據(jù)可視化的應(yīng)用。5簡(jiǎn)述文本可視化的意義。6網(wǎng)絡(luò)(圖)可視化有哪些主要形式?7多數(shù)據(jù)可視化主要應(yīng)用在哪種場(chǎng)景?8大數(shù)據(jù)可視化軟件和工具有哪些?9如何應(yīng)用Excel表格功能實(shí)現(xiàn)數(shù)據(jù)的可視化展示?10查閱相關(guān)資料,實(shí)例演示Processing的使用。11查閱相關(guān)資料,實(shí)例演示Nodal的使用。12查閱相關(guān)資料,實(shí)例演示EChart的使用。習(xí)題:1數(shù)據(jù)可視化有哪些基本特征?習(xí)題:大數(shù)據(jù)實(shí)驗(yàn)平臺(tái):提供Hadoop、HBase、Hive、Spark、Storm等大數(shù)據(jù)集群實(shí)驗(yàn)環(huán)境和快速搭建服務(wù)從入門到實(shí)戰(zhàn),幫助用戶構(gòu)建大數(shù)據(jù)課程和實(shí)訓(xùn)體系提供配套教程、課件和視頻大數(shù)據(jù)實(shí)驗(yàn)平臺(tái):提供Hadoop、HB大數(shù)據(jù)資料和交流中心大數(shù)據(jù)資料和交流中心云計(jì)算資料和交流中心云計(jì)算資料和交流中心《大數(shù)據(jù)》配套之八:第7章大數(shù)據(jù)可視化課件《大數(shù)據(jù)》配套之八:第7章大數(shù)據(jù)可視化課件BDRack大數(shù)據(jù)實(shí)驗(yàn)一體機(jī)虛擬出百套集群,并行開(kāi)展大數(shù)據(jù)實(shí)驗(yàn)預(yù)裝各種流行云計(jì)算和大數(shù)據(jù)平臺(tái)提供配套實(shí)驗(yàn)教程、課件、PPT和培訓(xùn)BDRack大數(shù)據(jù)實(shí)驗(yàn)一體機(jī)虛擬出百套集群,并行開(kāi)展大數(shù)據(jù)實(shí)學(xué)習(xí)大數(shù)據(jù)必須關(guān)注的公眾號(hào)知名微信公眾號(hào)推薦劉鵬看未來(lái)云計(jì)算頭條云創(chuàng)大數(shù)據(jù)中國(guó)大數(shù)據(jù)微信號(hào):chinacloudnj微信號(hào):cstorbigdata資源豐富、分析深入、更新及時(shí)的云計(jì)算知識(shí)共享平臺(tái)。微信號(hào):lpoutlook微信號(hào):cStor_cn國(guó)內(nèi)大數(shù)據(jù)企業(yè)。提供云存儲(chǔ)、云數(shù)據(jù)庫(kù)、云視頻、云傳輸產(chǎn)品和解決方案。眼光決定成敗,與劉鵬教授看未來(lái)。劉鵬,清華博士,《云計(jì)算》作者。分享大數(shù)據(jù)技術(shù),剖析大數(shù)據(jù)案例,討論大數(shù)據(jù)話題。學(xué)習(xí)大數(shù)據(jù)必須關(guān)注的公眾號(hào)知名微信公眾號(hào)推薦劉鵬看未來(lái)云計(jì)算運(yùn)用大數(shù)據(jù),精彩你生活免費(fèi)大數(shù)據(jù)App推薦運(yùn)用大數(shù)據(jù),精彩你生活免費(fèi)大數(shù)據(jù)App推薦感謝聆聽(tīng)感謝聆聽(tīng)全國(guó)高校標(biāo)準(zhǔn)教材《云計(jì)算》姊妹篇,剖析大數(shù)據(jù)核心技術(shù)和實(shí)戰(zhàn)應(yīng)用大數(shù)據(jù)劉鵬主編張燕張重生張志立副主編BIGDATA全國(guó)高校標(biāo)準(zhǔn)教材《云計(jì)算》姊妹篇,剖析大數(shù)據(jù)核心技術(shù)和實(shí)戰(zhàn)應(yīng)劉鵬教授,清華大學(xué)博士?,F(xiàn)任南京大數(shù)據(jù)研究院院長(zhǎng)、中國(guó)信息協(xié)會(huì)大數(shù)據(jù)分會(huì)副會(huì)長(zhǎng)、中國(guó)大數(shù)據(jù)技術(shù)與應(yīng)用聯(lián)盟副理事長(zhǎng)。主持完成科研項(xiàng)目25項(xiàng),發(fā)表論文80余篇,出版專業(yè)書籍15本。獲部級(jí)科技進(jìn)步二等獎(jiǎng)4項(xiàng)、三等獎(jiǎng)4項(xiàng)。主編的《云計(jì)算》被全國(guó)高校普遍采用,被引用量在國(guó)內(nèi)計(jì)算機(jī)圖書類排名居前。創(chuàng)辦了知名的中國(guó)云計(jì)算()和中國(guó)大數(shù)據(jù)()網(wǎng)站。曾率隊(duì)奪得2002PennySort國(guó)際計(jì)算機(jī)排序比賽冠軍,兩次奪得全國(guó)高??萍急荣愖罡擢?jiǎng),并三次奪得清華大學(xué)科技比賽最高獎(jiǎng)。榮獲“全軍十大學(xué)習(xí)成才標(biāo)兵”(排名第一)、南京“十大杰出青年”、江蘇省中青年科學(xué)技術(shù)帶頭人、清華大學(xué)“學(xué)術(shù)新秀”等稱號(hào)。劉鵬教授,清華大學(xué)博士?,F(xiàn)任南京大數(shù)據(jù)研究院第七章大數(shù)據(jù)概念與應(yīng)用7.1

數(shù)據(jù)可視化基礎(chǔ)7.2大數(shù)據(jù)可視化方法7.3大數(shù)據(jù)可視化軟件與工具習(xí)題全國(guó)高校標(biāo)準(zhǔn)教材《云計(jì)算》姊妹篇,剖析大數(shù)據(jù)核心技術(shù)和實(shí)戰(zhàn)應(yīng)用of4145第七章大數(shù)據(jù)概念與應(yīng)用7.1數(shù)據(jù)可視化基礎(chǔ)7.2大數(shù)據(jù)7.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化of4146

大數(shù)據(jù)可視化核心問(wèn)題

隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,尤其是移動(dòng)互聯(lián)技術(shù)的發(fā)展,網(wǎng)絡(luò)空間的數(shù)據(jù)量呈現(xiàn)出爆炸式增長(zhǎng)。如何從這些數(shù)據(jù)中快速獲取自己想要的信息,并以一種直觀、形象的方式展現(xiàn)出來(lái)?這就是大數(shù)據(jù)可視化要解決的核心問(wèn)題。數(shù)據(jù)可視化解釋

數(shù)據(jù)可視化,最早可追溯到20世紀(jì)50年代,它是一門關(guān)于數(shù)據(jù)視覺(jué)表現(xiàn)形式的科學(xué)技術(shù)研究。數(shù)據(jù)可視化是一個(gè)處于不斷演變之中的概念,其邊界在不斷地?cái)U(kuò)大,主要指的是技術(shù)上較為高級(jí)的技術(shù)方法,而這些技術(shù)方法允許利用圖形圖像處理、計(jì)算機(jī)視覺(jué)及用戶界面,通過(guò)表達(dá)、建模,以及對(duì)立體、表面、屬性及動(dòng)畫的顯示,對(duì)數(shù)據(jù)加以可視化解釋。本章重點(diǎn)講解

與立體建模之類的特殊技術(shù)方法相比,數(shù)據(jù)可視化所涵蓋的技術(shù)方法要廣泛得多。本章將重點(diǎn)對(duì)大數(shù)據(jù)可視化的基礎(chǔ)知識(shí)、基本概念及大數(shù)據(jù)可視化的常用工具進(jìn)行詳細(xì)講解。7.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化of414大數(shù)據(jù)可7.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化可視化的基本特征易懂性必然性片面性專業(yè)性數(shù)據(jù)可視化的片面性特征要求可視化模式不能替代數(shù)據(jù)本身,只能作為數(shù)據(jù)表達(dá)的一種特定形式專業(yè)化特征是人們從可視化模型中提取專業(yè)知識(shí)的環(huán)節(jié),它是數(shù)據(jù)可視化應(yīng)用的最后流程可視化可以使得碎片化的數(shù)據(jù)轉(zhuǎn)換為具有特定結(jié)構(gòu)的知識(shí),從而為決策支持提供幫助大數(shù)據(jù)所產(chǎn)生的數(shù)據(jù)量必然要求人們對(duì)數(shù)據(jù)進(jìn)行歸納總結(jié),對(duì)數(shù)據(jù)的結(jié)構(gòu)和形式進(jìn)行轉(zhuǎn)換處理of41477.1.1可視化的基本特征7.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化可視化的易懂性必然性7.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化7.1.2可視化的目標(biāo)和作用數(shù)據(jù)可視化的作用主要包括數(shù)據(jù)表達(dá)、數(shù)據(jù)操作和數(shù)據(jù)分析3個(gè)方面,它是以可視化技術(shù)支持計(jì)算機(jī)輔助數(shù)據(jù)認(rèn)識(shí)的3個(gè)基本階段。數(shù)據(jù)表達(dá)數(shù)據(jù)表達(dá)是通過(guò)計(jì)算機(jī)圖形圖像技術(shù)來(lái)更加友好地展示數(shù)據(jù)信息,方便人們閱讀、理解和運(yùn)用數(shù)據(jù)。常見(jiàn)的形式如文本、圖表、圖像、二維圖形、三維模型、網(wǎng)絡(luò)圖、樹結(jié)構(gòu)、符號(hào)和電子地圖等。數(shù)據(jù)操作數(shù)據(jù)操作是以計(jì)算機(jī)提供的界面、接口、協(xié)議等條件為基礎(chǔ)完成人與數(shù)據(jù)的交互需求,數(shù)據(jù)操作需要友好的人機(jī)交互技術(shù)、標(biāo)準(zhǔn)化的接口和協(xié)議支持來(lái)完成對(duì)多數(shù)據(jù)集合或者分布式的操作。數(shù)據(jù)分析數(shù)據(jù)可視化可以有效地表達(dá)數(shù)據(jù)的各類特征,幫助人們推理和分析數(shù)據(jù)背后的客觀規(guī)律,進(jìn)而獲得相關(guān)知識(shí),提高人們認(rèn)識(shí)數(shù)據(jù)的能力和利用數(shù)據(jù)的水平。of41487.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化7.1.2可視化的目7.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化7.1.3數(shù)據(jù)可視化流程數(shù)據(jù)獲取主動(dòng)式是以明確的數(shù)據(jù)需求為目的,如衛(wèi)星影像、測(cè)繪工程等;被動(dòng)式是以數(shù)據(jù)平臺(tái)為基礎(chǔ),由數(shù)據(jù)平臺(tái)的活動(dòng)者提供數(shù)據(jù)來(lái)源,如電子商務(wù)、網(wǎng)絡(luò)論壇等。數(shù)據(jù)處理數(shù)據(jù)處理是指對(duì)原始的數(shù)據(jù)進(jìn)行質(zhì)量分析、預(yù)處理和計(jì)算等步驟。數(shù)據(jù)處理的目標(biāo)是保證數(shù)據(jù)的準(zhǔn)確性、可用性。12可視化模式可視化模式是數(shù)據(jù)的一種特殊展現(xiàn)形式,常見(jiàn)的可視化模式有標(biāo)簽云、序列分析、網(wǎng)絡(luò)結(jié)構(gòu)、電子地圖等??梢暬J降倪x取決定了可視化方案的雛形??梢暬瘧?yīng)用可視化應(yīng)用主要根據(jù)用戶的主觀需求展開(kāi),最主要的應(yīng)用方式是用來(lái)觀察和展示,通過(guò)觀察和人腦分析進(jìn)行推理和認(rèn)知,輔助人們發(fā)現(xiàn)新知識(shí)或者得到新結(jié)論。34of41497.1數(shù)據(jù)可視化基礎(chǔ)第七章大數(shù)據(jù)可視化7.1.3數(shù)據(jù)可視化第七章大數(shù)據(jù)概念與應(yīng)用7.1

數(shù)據(jù)可視化基礎(chǔ)7.2大數(shù)據(jù)可視化方法7.3大數(shù)據(jù)可視化軟件與工具習(xí)題全國(guó)高校標(biāo)準(zhǔn)教材《云計(jì)算》姊妹篇,剖析大數(shù)據(jù)核心技術(shù)和實(shí)戰(zhàn)應(yīng)用of4150第七章大數(shù)據(jù)概念與應(yīng)用7.1數(shù)據(jù)可視化基礎(chǔ)7.2大數(shù)據(jù)7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.1文本可視化

標(biāo)簽云of4151如圖所示是一種稱為標(biāo)簽云(WordClouds或TagClouds)的典型的文本可視化技術(shù)。它將關(guān)鍵詞根據(jù)詞頻或其他規(guī)則進(jìn)行排序,按照一定規(guī)律進(jìn)行布局排列,用大小、顏色、字體等圖形屬性對(duì)關(guān)鍵詞進(jìn)行可視化。一般用字號(hào)大小代表該關(guān)鍵詞的重要性,該技術(shù)多用于快速識(shí)別網(wǎng)絡(luò)媒體的主題熱度。7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.1文本可視7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.1動(dòng)態(tài)文本時(shí)序信息可視化

有些文本的形成和變化過(guò)程與時(shí)間是緊密相關(guān)的,因此,如何將動(dòng)態(tài)變化的文本中時(shí)間相關(guān)的模式與規(guī)律進(jìn)行可視化展示,是文本可視化的重要內(nèi)容。引入時(shí)間軸是一類主要方法,常見(jiàn)的技術(shù)以河流圖居多。河流圖按照其展示的內(nèi)容可以劃分為主題河流圖、文本河流圖及事件河流圖等。of41527.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.1動(dòng)態(tài)文本7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.2網(wǎng)絡(luò)圖可視化

(1)Nodal研究人員及其組織機(jī)構(gòu)社會(huì)網(wǎng)絡(luò)圖

(2)基于節(jié)點(diǎn)連接的圖和樹可視化方法of41537.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.2網(wǎng)絡(luò)圖可7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.2網(wǎng)絡(luò)圖可視化

of4154(3)基于空間填充的樹可視化(4)基于邊捆綁的大規(guī)模密集圖可視化7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.2網(wǎng)絡(luò)圖可7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.3時(shí)空數(shù)據(jù)可視化

流式地圖結(jié)合了捆綁技術(shù)的流式地圖結(jié)合了密度圖技術(shù)的流式地圖of41557.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.3時(shí)空數(shù)據(jù)7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.3時(shí)空數(shù)據(jù)可視化

時(shí)空立方體融合散點(diǎn)圖與密度圖技術(shù)的時(shí)空立方體融合堆積圖技術(shù)的時(shí)空立方體

of41567.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.3時(shí)空數(shù)據(jù)7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.4多維數(shù)據(jù)可視化

of41571、散點(diǎn)圖(

ScatterPlot)散點(diǎn)圖(ScatterPlot)是最為常用的多維可視化方法。二維散點(diǎn)圖將多個(gè)維度中的兩個(gè)維度屬性值集合映射至兩條軸,在二維軸確定的平面內(nèi)通過(guò)圖形標(biāo)記的不同視覺(jué)元素來(lái)反映其他維度屬性值。二維散點(diǎn)圖能夠展示的維度十分有限,研究者將其擴(kuò)展到三維空間,通過(guò)可旋轉(zhuǎn)的ScatterPlot方塊(dice)擴(kuò)展了可映射維度的數(shù)目,如圖所示。散點(diǎn)圖適合對(duì)有限數(shù)目的較為重要的維度進(jìn)行可視化,通常不適于需要對(duì)所有維度同時(shí)進(jìn)行展示的情況。7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.4多維數(shù)據(jù)7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.4多維數(shù)據(jù)可視化

2、投影(Projection)投影是能夠同時(shí)展示多維的可視化方法之一。VaR將各維度屬性列集合通過(guò)投影函數(shù)映射到一個(gè)方塊形圖形標(biāo)記中,并根據(jù)維度之間的關(guān)聯(lián)度對(duì)各個(gè)小方塊進(jìn)行布局?;谕队暗亩嗑S可視化方法一方面反映了維度屬性值的分布規(guī)律,同時(shí)也直觀地展示了多維度之間的語(yǔ)義關(guān)系。of41587.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.4多維數(shù)據(jù)7.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.4多維數(shù)據(jù)可視化

3、平行坐標(biāo)(ParallelCoordinates)平行坐標(biāo)是研究和應(yīng)用最為廣泛的一種多維可視化技術(shù),將維度與坐標(biāo)軸建立映射,在多個(gè)平行軸之間以直線或曲線映射表示多維信息。

平行坐標(biāo)多維可視化技術(shù)集成了散點(diǎn)圖和柱狀圖的平行坐標(biāo)工具平行坐標(biāo)圖聚簇可視化of41597.2大數(shù)據(jù)可視化方法第七章大數(shù)據(jù)可視化7.2.4多維數(shù)據(jù)第七章大數(shù)據(jù)概念與應(yīng)用7.1

數(shù)據(jù)可視化基礎(chǔ)7.2大數(shù)據(jù)可視化方法7.3大數(shù)據(jù)可視化軟件與工具習(xí)題全國(guó)高校標(biāo)準(zhǔn)教材《云計(jì)算》姊妹篇,剖析大數(shù)據(jù)核心技術(shù)和實(shí)戰(zhàn)應(yīng)用of4160第七章大數(shù)據(jù)概念與應(yīng)用7.1數(shù)據(jù)可視化基礎(chǔ)7.2大數(shù)據(jù)7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.1Excel利用Excel的可視化規(guī)則實(shí)現(xiàn)數(shù)據(jù)的可視化展示Excel圖表樣式利用Excel圖表中的折線圖制作的“工資”和“年齡”數(shù)據(jù)展示Excel是MicrosoftOffice的組件之一,是由Microsoft為Windows和AppleMacintosh操作系統(tǒng)的計(jì)算機(jī)編寫和運(yùn)行的一款表格計(jì)算軟件。Excel是微軟辦公套裝軟件的一個(gè)重要組成部分,它可以進(jìn)行各種數(shù)據(jù)的處理、統(tǒng)計(jì)分析、數(shù)據(jù)可視化顯示及輔助決策操作,廣泛地應(yīng)用于管理、統(tǒng)計(jì)、財(cái)經(jīng)、金融等眾多領(lǐng)域。of41617.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.1E7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2ProcessingProcessing在數(shù)據(jù)可視化領(lǐng)域有著廣泛的應(yīng)用,可制作信息圖形、信息可視化、科學(xué)可視化和統(tǒng)計(jì)圖形等。下面通過(guò)一個(gè)簡(jiǎn)單實(shí)例來(lái)認(rèn)識(shí)一下如何利用Processing實(shí)現(xiàn)數(shù)據(jù)的可視化展示。StateNameLocation-xLocation-yvalueAlabama(AL)4392700.1Alaska(AK)94325-5.3Arizona(AZ)1482413Arkansas(AR)3682477California(CA)5617611Colorado(CO)2201831.5Washington(WA)92382.2WestVirginia(WV)4961785.4Wisconsin(WI)3921033.1Wyoming(WY)207125-6

美國(guó)各州GDP增長(zhǎng)率(數(shù)據(jù)隨機(jī)生成)of41627.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2P7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2Processing第一步,聲明(初始化)變量,代碼如下:PImagemapImage;TablelocationTable;TablenameTable;introwCount;

TabledataTable;floatdataMin=MAX_FLOAT;floatdataMax=MIN_FLOAT;of41637.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2P7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2Processing

第二步,初始化畫布,加載(生成)數(shù)據(jù),代碼如下:voidsetup(){size(640,400);mapImage=loadImage("map.png");//加載地圖locationTable=newTable("locations.tsv");//加載位置信息nameTable=newTable("names.tsv");//加載名稱信息rowCount=locationTable.getRowCount();

dataTable=newTable("random.tsv");//加載隨機(jī)數(shù)據(jù)for(introw=0;row<rowCount;row++){floatvalue=dataTable.getFloat(row,1);if(value>dataMax){dataMax=value;}if(value<dataMin){dataMin=value;}}PFontfont=loadFont("Univers-Bold-12.vlw");textFont(font);

smooth();noStroke();}of41647.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2P7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2Processing第三步,調(diào)用繪制函數(shù)繪制圖形,代碼如下:voiddraw(){background(255);image(mapImage,0,0);

for(introw=0;row<rowCount;row++){Stringabbrev=dataTable.getRowName(row);floatx=locationTable.getFloat(abbrev,1);floaty=locationTable.getFloat(abbrev,2);drawData(x,y,abbrev);}}

voiddrawData(floatx,floaty,Stringabbrev){floatvalue=dataTable.getFloat(abbrev,1);floatradius=0;if(value>=0){radius=map(value,0,dataMax,1.5,15);fill(#333366);//blue}else{radius=map(value,0,dataMin,1.5,15);fill(#ec5166);//red}ellipseMode(RADIUS);ellipse(x,y,radius,radius);

if(dist(x,y,mouseX,mouseY)<radius+2){fill(0);textAlign(CENTER);Stringname=nameTable.getString(abbrev,1);text(name+""+value,x,y-radius-4);}}7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.2P7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.3NodeXLNodeXL不僅具備常見(jiàn)的分析功能,如計(jì)算中心性、PageRank值、網(wǎng)絡(luò)連通度、聚類系數(shù)等,還能對(duì)暫時(shí)性網(wǎng)絡(luò)進(jìn)行處理。在布局方面,NodeXL主要采用力導(dǎo)引布局方式。NodeXL的一大特色是可視化交互能力強(qiáng),具有圖像移動(dòng)、變焦和動(dòng)態(tài)查詢等交互功能。其另一特色是可直接與互聯(lián)網(wǎng)相連,用戶可通過(guò)插件或直接導(dǎo)入E-mail或微博網(wǎng)頁(yè)中的數(shù)據(jù)。準(zhǔn)備數(shù)據(jù)步驟生成頂點(diǎn)生成網(wǎng)絡(luò)圖of41667.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.3N7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41671、準(zhǔn)備數(shù)據(jù)從開(kāi)始菜單中打開(kāi)一個(gè)NodeXL的模板,在“Edges”工作表中輸入準(zhǔn)備好的數(shù)據(jù),如圖所示。每條邊包含兩個(gè)Vertex及其相關(guān)的屬性(Color、Width、Label等)。ResearchersResearchOrganizationNatasaMilic-FraylingMicrosoftResearchCambridgeMarcSmithConnectedActionConsultingGroupBenShneidermanUniversityofMarylandDerekHansenBrighamYoungUniversityCodyDunneUniversityofMarylandEduardaMendesRodriguesUniversityofPortoUdayanKhouranaUniversityofMarylandJureLeskovecStanfordUniversityBernieHoganOxfordInternetInstituteItaiHimelboimUniversityofGeorgiaLibbyHemphillIllinoisInstituteofTechnologyRobertAcklandAustralianNationalUniversityScottGolderCornellUniversityVladimirBarashMorningsideAnalyticsNodeXL主要研究人員及其所在研究組織在“Edge”工作表中輸入邊的信息7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41257.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41682、生成頂點(diǎn)在“Edge”工作表中錄入邊的信息后,打開(kāi)“GraphMetrics”對(duì)話框,勾選所有可選項(xiàng),單擊“CalculateMetri”按鈕,此時(shí)系統(tǒng)會(huì)自動(dòng)識(shí)別出所有的頂點(diǎn)信息,并將其記錄在“Vertex”工作表中,同時(shí)還可以得到圖形度量方面的有關(guān)數(shù)值,例如,圖形類型、頂點(diǎn)個(gè)數(shù)、邊數(shù)目、重復(fù)的邊數(shù)目、總邊數(shù)、圖形密度等數(shù)據(jù)。然后,打開(kāi)“AutofillColumns”對(duì)話框,設(shè)置自動(dòng)填充的選項(xiàng)值(這些值來(lái)自計(jì)算出的圖形度量數(shù)據(jù))。用戶也可以在“Vertex”工作表中對(duì)每個(gè)頂點(diǎn)的屬性進(jìn)行自定義設(shè)置,使得最終的網(wǎng)絡(luò)圖呈現(xiàn)出不同的樣式。本例中設(shè)置每個(gè)頂點(diǎn)“Shape”屬性值為“Image”,“ImageFile”輸入頂點(diǎn)的圖片地址(也可以是URL)?!癎raphMetrics”對(duì)話框“AutofillColumns”對(duì)話框系統(tǒng)生成的“Vertex”工作表數(shù)據(jù)7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41267.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41693、生成網(wǎng)絡(luò)圖上述兩個(gè)步驟設(shè)置完畢后,單擊“RefreshGraph”按鈕即可看到最終的網(wǎng)絡(luò)圖。從網(wǎng)絡(luò)圖中可以清楚地看到參與NodeXL研究的組織機(jī)構(gòu)(內(nèi)層節(jié)點(diǎn))及研究人員(外層節(jié)點(diǎn))。使用可以得到圖形度量方面的有關(guān)數(shù)值,這些數(shù)值清晰明了,獲得的基本數(shù)值有圖形類型、頂點(diǎn)個(gè)數(shù)、邊數(shù)目、重復(fù)的邊數(shù)目、總邊數(shù)、圖形密度等數(shù)據(jù)。最終的網(wǎng)絡(luò)圖7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41277.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.4EChartsECharts自2013年6月正式發(fā)布1.0版本以來(lái),在短短兩年多的時(shí)間,功能不斷完善,截至目前,ECharts已經(jīng)可以支持包括折線圖(區(qū)域圖)、柱狀圖(條狀圖)、散點(diǎn)圖(氣泡圖)、K線圖、餅圖(環(huán)形圖)、雷達(dá)圖(填充雷達(dá)圖)、和弦圖、力導(dǎo)向布局圖、地圖、儀表盤、漏斗圖、事件河流圖12類圖表,同時(shí)提供標(biāo)題、詳情氣泡、圖例、值域、數(shù)據(jù)區(qū)域、時(shí)間軸、工具箱7個(gè)可交互組件,支持多圖表、組件的聯(lián)動(dòng)和混搭展現(xiàn)。ECharts制作的圖表of41707.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化7.3.4E7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of4171ECharts圖表工具為用戶提供了詳細(xì)的幫助文檔,這些文檔不僅介紹了每類圖表的使用方法,還詳細(xì)介紹了各類組件的使用方法,每類圖表都提供了豐富的實(shí)例。用戶在使用時(shí)可以參考實(shí)例提供的代碼,稍加修改就可以滿足自己的圖表展示需求。接下來(lái)結(jié)合ECharts提供的一個(gè)2010年世界人口分布圖的實(shí)例來(lái)詳細(xì)介紹一下ECharts的使用方法。如圖所示是2010年世界人口數(shù)據(jù)。國(guó)

家人口數(shù)量China1

359

821

465India1

205

624

648UnitedStatesofAmerica312

247

116UnitedKingdom62

066

350……2010年世界人口數(shù)據(jù)7.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of41297.3大數(shù)據(jù)可視化軟件與工具第七章大數(shù)據(jù)可視化of4172實(shí)現(xiàn)代碼:option={title:{text:'WorldPopulation(2010)',subtext:'fromUnitedNations,Totalpopulation,bothsexescombined,asof1July(thousands)',sublink:'/wpp/Excel-Data/population.htm',left:'center',top:'top'},tooltip:{trigger:'item',formatter:function(params){varvalue=(params.value+'').split('.');value=value[0].replace(/(\d{1,3})(?=(?:\d{3})+(?!\d))/g,'$1,')+'.'+value[1];returnparams.seriesName+'<br/>'++':'+value;}},toolbox:{sho

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論