版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第四章數(shù)據(jù)可視化基礎第 2 頁竢實揚華,自強不息目 錄CONTENT1數(shù)據(jù)可視化基本框架可視化的基本圖表可視化理論發(fā)展可視化中的數(shù)據(jù)可視化設計原則3524第 3 頁竢實揚華,自強不息數(shù)據(jù)可視化不僅是一門包含各種算法的技術,還是一個具有方法論的學科。實際應用中需要采用系統(tǒng)化的思維設計數(shù)據(jù)可視化方法與工具。本節(jié)通過對數(shù)據(jù)可視化的基本流程和可視化設計所遵循的多層次模型的討論,介紹數(shù)據(jù)可視化的基本框架。4.1數(shù)據(jù)可視化基本框架“”第 4 頁竢實揚華,自強不息4.1.1數(shù)據(jù)可視化流程圖4.1 科學可視化的早期可視化流水線科學可視化和信息可視化分別設計了可視化流程的參考結構模型,并被廣泛應用于數(shù)據(jù)可視化系
2、統(tǒng)中。如圖4.1所示,是科學可視化的早期可視化流水線,它描述了從數(shù)據(jù)空間到可視化空間的映射,包含串行處理數(shù)據(jù)的各個階段:數(shù)據(jù)分析、數(shù)據(jù)濾波、數(shù)據(jù)的可視映射和繪制。這個流水線實際上是數(shù)據(jù)處理和圖形繪制的嵌套組合。第 5 頁竢實揚華,自強不息4.1.1數(shù)據(jù)可視化流程圖4.2 信息可視化參考流程如圖4.2展示了Card, Mackinlay和Shneiderman描述的信息可視化流程模型:將流水線改進成回路且用戶的交互可以出現(xiàn)在流程的任何階段。后繼幾乎所有著名的信息可視化系統(tǒng)和工具包都支持這個模型,而且絕大多數(shù)系統(tǒng)在基礎層都兼容,只存在細微的實現(xiàn)差異。第 6 頁竢實揚華,自強不息由Jark Van
3、Wijk等人提出的可視化循環(huán)模型模式探索第 7 頁竢實揚華,自強不息圖4.4 由C.Stolte等人提出的可視化循環(huán)模型第 8 頁竢實揚華,自強不息4.1.1數(shù)據(jù)可視化流程圖4.5 Daniel Keim等人提出的 可視化分析學標準流程可視分析學的基本流程則通過人機交互將自動和可視分析方法緊密結合。如圖4.5所示,展示了一個典型的可視化流程圖和每個步驟中的過渡形式。這個流水線的起點是輸入的數(shù)據(jù),終點是提煉的知識。從數(shù)據(jù)到知識有兩個途徑:交互的可視化方法和自動的數(shù)據(jù)挖掘方法。兩個途徑的中間結果分別是對數(shù)據(jù)的交互可視化結果和從數(shù)據(jù)中提煉的數(shù)據(jù)模型。用戶既可以對可視化結果進行交互的修正,也可以調節(jié)參
4、數(shù)以修正模型。第 9 頁竢實揚華,自強不息數(shù)據(jù)可視化流程中的核心要素包括三個方面。4.1.1數(shù)據(jù)可視化流程數(shù)據(jù)可視化的基礎是數(shù)據(jù)表示與變換。為了允許有效的可視化、分析和記錄,輸入數(shù)據(jù)必須從原始狀態(tài)變換到一種便于計算機處理的結構化數(shù)據(jù)表示形式。有效表示海量數(shù)據(jù)的主要挑戰(zhàn)是:采用具有可伸縮性和擴展性的方法,以便忠實地保持數(shù)據(jù)的特性和內容;將不同類型、不同來源的信息合成一個統(tǒng)一的表示,使得數(shù)據(jù)分析人員能及時聚焦于數(shù)據(jù)的本質。數(shù)據(jù)表示與變換第 10 頁竢實揚華,自強不息將數(shù)據(jù)以一種直觀、容易理解的方式呈現(xiàn)給用戶。數(shù)據(jù)可視化的核心內容是從巨大的呈現(xiàn)多樣性空間中選擇最合適的編碼形式。判斷某個視覺編碼是否合
5、適的因素:感知與認知系統(tǒng)的特性、數(shù)據(jù)本身的屬性和目標任務。大量的數(shù)據(jù)采集通常是以流的形式實時獲取,針對靜態(tài)數(shù)據(jù)發(fā)展起來的可視化顯示方法不能直接拓展到動態(tài)數(shù)據(jù)。不僅要求可視化結果有一定的時間連貫性,還要求可視化方法達到高效以便給出實時反饋。需要強大的計算平臺(分布式計算)、顯示平臺(一億像素顯示器)和交互模式(體感交互、可穿戴交互)數(shù)據(jù)的可視化呈現(xiàn)第 11 頁竢實揚華,自強不息汽車品牌和所屬國家。上:錯誤的柱狀圖;下:正確的散點圖柱狀圖主要用于表達數(shù)值信息而不是分類信息,圖中雪弗蘭對應縱軸上中國、德國、美國等多個國家,并不合理。第 12 頁竢實揚華,自強不息對數(shù)據(jù)進行可視化和分析的目的是解決目標
6、任務。目標任務可分為:生成假設、驗證假設和視覺呈現(xiàn)。通過可視化能達到目標任務。交互是通過可視的手段輔助分析決策的直接推動力。適用于海量數(shù)據(jù)可視化的交互技術還是一個難題,其核心挑戰(zhàn)是新型的可支持用戶分析決策的交互方法。涵蓋底層的交互方式與硬件、復雜的交互理念與流程,克服不同類型的顯示環(huán)境和不同任務帶來的可擴充性用戶交互第 13 頁竢實揚華,自強不息4.1.2數(shù)據(jù)可視化設計圖4.4 可視化設計的層次嵌套模型迭代式逐步求精過程數(shù)據(jù)可視化的設計簡化為四個級聯(lián)的層次。第一層(最外層):問題刻畫層??坍嬚鎸嵱脩舻膯栴}。第二層:抽象層。將特定領域的任務和數(shù)據(jù)映射到抽象且通用的任務及數(shù)據(jù)類型。第三層:編碼層。
7、設計與數(shù)據(jù)類型相關的視覺編碼及交互方法。(核心)第四層(最內層):算法實現(xiàn)層。創(chuàng)建正確完成系統(tǒng)設計的算法。第 14 頁竢實揚華,自強不息數(shù)據(jù)可視化將數(shù)據(jù)變換為易于感知的可視編碼。為了精準地通過數(shù)據(jù)的可視表達傳播信息,需要研究數(shù)據(jù)的分類機器對應的可視編碼方法4.2可視化中的數(shù)據(jù)“”第 15 頁竢實揚華,自強不息4.2.1 數(shù)據(jù)認知人們對數(shù)據(jù)的認知,一般都經(jīng)過從數(shù)據(jù)模型到概念模型的過程,最后得到數(shù)據(jù)在實際中的具體語義。數(shù)據(jù)模型是對數(shù)據(jù)的底層描述及相關的操作。在處理數(shù)據(jù)時,最初接觸的是數(shù)據(jù)模型。概念模型是對數(shù)據(jù)的高層次描述,對應于人們對數(shù)據(jù)的具體認知。概念模型的建立跟實際應用緊密相關。對數(shù)據(jù)進行進一
8、步處理之前,需要定義數(shù)據(jù)的概念和它們之間的聯(lián)系。同時定義數(shù)據(jù)的語義和它們所代表的含義。例如,一組數(shù)據(jù):7.8、12.5、14.3首先被看成一組浮點數(shù)據(jù),可以應用;“白、黃、黑”視為一組根據(jù)顏色分類的數(shù)據(jù)。第一組數(shù)據(jù)給從概念模型出發(fā)定義為某天的氣溫值,從而賦予具體語義,并進行下一步分析;第二組數(shù)據(jù)表示為一組人群中的不同膚色。第 16 頁竢實揚華,自強不息4.2.2數(shù)據(jù)類型表4.1 賽跑比賽排名數(shù)據(jù)根據(jù)數(shù)據(jù)分析要求,不同的應用可以采用不同的數(shù)據(jù)分析方法。例如,根據(jù)數(shù)據(jù)模型,可以分為浮點數(shù)、整數(shù)、字符等;根據(jù)概念模型,可以定義數(shù)據(jù)所對應的實際意義或者對象,例如汽車、摩托車、自行車等分類數(shù)據(jù)。在科學計
9、算中,通常根據(jù)測量標度,將數(shù)據(jù)分為四類(見表4.1):類別型數(shù)據(jù)(性別)、有序型數(shù)據(jù)(排名)、區(qū)間型數(shù)據(jù)和比值型數(shù)據(jù)。在數(shù)據(jù)可視化中,我們通常并不區(qū)分區(qū)間型數(shù)據(jù)和比值型數(shù)據(jù),將數(shù)據(jù)類型進一步精簡為三種:類別型數(shù)據(jù)、有序型數(shù)據(jù)和數(shù)值型數(shù)據(jù)。排名姓名時間性別1小趙3分10秒男2小錢3分12秒男3小孫3分18秒男4小李3分40秒女5小周3分52秒男6小吳4分10秒女第 17 頁竢實揚華,自強不息類別型數(shù)據(jù):用于區(qū)分物體。例如,男性女性,蘋果香蕉橘子等。這些類別可以用于區(qū)分一組對象,但是無法提供對象的定量數(shù)據(jù)。有序型數(shù)據(jù):用來表示對象的順序關系。例如,排名為1的運動員比排名為2的運動員跑得更快。根據(jù)對
10、象順序,并不一定能得到準確的定量比較。例如,小趙和小錢的跑步成績差別并不一定等于小周和小吳間的差別,雖然都是相差1.無法進行定量差別比較。區(qū)間型數(shù)據(jù):用戶得到對象間的定量比較。相比有序型數(shù)據(jù),能提供詳細的定量信息。例如,10度和20度的差別50度和60度的差別。但是,區(qū)間型數(shù)據(jù)基于任意的起始點,所以只能得到對象的相對差別,并不能定義對象的絕對值。例如,0度并不表示沒有任何溫度。比值型數(shù)據(jù):用于比較數(shù)值間的比例關系。比值型數(shù)據(jù)基于真正意義上的0點,可以用來精確的定義比例4厘米的物體比2厘米的物體長2倍。跑步成績屬于比值型數(shù)據(jù)。第 18 頁竢實揚華,自強不息不同數(shù)據(jù)類型使用不同的操作算子區(qū)分度算子
11、:= 類別型數(shù)據(jù)、有序型數(shù)據(jù)、區(qū)間型數(shù)據(jù)、比值型數(shù)據(jù)序別算子: 有序型數(shù)據(jù)、區(qū)間型數(shù)據(jù)、比值型數(shù)據(jù)加減算子:+ 區(qū)間型數(shù)據(jù)、比值型數(shù)據(jù)乘除算子: 比值型數(shù)據(jù)不同數(shù)據(jù)類型對應不同的操作集合和統(tǒng)計計算數(shù)據(jù)類型進一步精簡為三種:類別型數(shù)據(jù)、有序型數(shù)據(jù)和數(shù)值型數(shù)據(jù)。基礎的可視化設計和編碼一般針對這三種,復雜型數(shù)據(jù)通常是這三類數(shù)據(jù)的組合或變化。第 19 頁竢實揚華,自強不息不同類型的數(shù)據(jù)及其所對應的操作計算第 20 頁竢實揚華,自強不息統(tǒng)計圖表是最早的數(shù)據(jù)可視化形式之一,作為基本的可視化元素仍然被非常廣泛地使用。對于很多復雜的大型可視化系統(tǒng)來說,這類圖表更是作為基本的組成元素而不可缺少。本節(jié)介紹一些基本
12、圖表及其屬性和適用的場景。通過實例介紹,讀者能了解和認識可視化設計所遵循的準則。4.3可視化的基本圖表“”第 21 頁竢實揚華,自強不息01數(shù)據(jù)軌跡02柱狀圖03直方圖04餅圖4 餅圖餅圖采用了餅干的隱喻,用環(huán)狀方式呈現(xiàn)各分量在整體中的比例。這種分塊方式是環(huán)狀樹圖等可視表達的基礎。2 柱狀圖柱狀圖采用長方形的形狀和顏色編碼數(shù)據(jù)的屬性。堆疊圖(stacked graph):柱狀圖的每根直柱內部用像素編碼。3 直方圖直方圖是對數(shù)據(jù)集的某個數(shù)據(jù)屬性的頻率統(tǒng)計。雙直方圖將兩個數(shù)據(jù)集的頻率統(tǒng)計信息(即直方圖)分別沿橫軸對稱呈現(xiàn)。直方圖可以擴展到多維。1 數(shù)據(jù)軌跡數(shù)據(jù)軌跡是一種標準的單變量數(shù)據(jù)呈現(xiàn)方法:x
13、軸顯示自變量;y軸顯示因變量。可直觀呈現(xiàn)數(shù)據(jù)分布、離群值、均值的偏移等。4.3.1 原始數(shù)據(jù)繪圖用于可視化原始數(shù)據(jù)的屬性值,直觀呈現(xiàn)數(shù)據(jù)特征,代表性(九種)第 22 頁竢實揚華,自強不息數(shù)據(jù)軌跡Twitter輿情系統(tǒng)根據(jù)用詞的貶褒程度對公司的打分。比較了美國網(wǎng)絡影視服務和租賃商的分數(shù),為多個數(shù)據(jù)集的單變量數(shù)據(jù)軌跡,日期是自變量,分數(shù)是因變量。股票K線圖,時間是自變量,股指是因變量第 23 頁竢實揚華,自強不息柱狀圖標準柱狀圖堆疊圖,不同國家的不同能源消耗量第 24 頁竢實揚華,自強不息直方圖直方圖(histogram)VS 柱狀圖(bar chart):直方圖的各個部分之和等于單位整體,而柱狀
14、圖的各個部分之和沒有限制。第 25 頁竢實揚華,自強不息直方圖雙直方圖第 26 頁竢實揚華,自強不息5 等值線圖等值線圖使用相等數(shù)值的數(shù)據(jù)點連線來表示數(shù)據(jù)的連續(xù)分布和變化規(guī)律。等值線圖中的曲線是空間中具有相同數(shù)值的數(shù)據(jù)點在平面上的投影。平面地圖山的地形等高線、等溫線、等濕閑等都是等值線圖在不同領域的應用。6 走勢圖走勢圖是一種緊湊簡潔的數(shù)據(jù)趨勢表達方式,它通常以折線圖為基礎,用來表示數(shù)據(jù)隨某一變量(時間、空間)變化趨勢。大小與文本相仿,往往直接嵌入在文本或表格中。7 散點圖散點圖是表示二維數(shù)據(jù)的標準方法。在散點圖中,所有數(shù)據(jù)以點的形式出現(xiàn)在笛卡爾坐標系中,每個點所對應的橫縱坐標即代表該數(shù)據(jù)在坐
15、標軸所表示維度上的屬性值大小。散點圖矩陣是展現(xiàn)高維數(shù)據(jù)屬性分布,可以通過尺寸、形狀和顏色等編碼信息。8 維恩圖維恩圖使用平面上的封閉圖形來表示數(shù)據(jù)集合間的關系。維恩圖在一張平面上表示集合間的所有邏輯關系,被廣泛用于集合關系展示。4.3.1 原始數(shù)據(jù)繪圖05060708第 27 頁竢實揚華,自強不息二維高斯分布的立體圖和平面等值線圖第 28 頁竢實揚華,自強不息走勢圖走勢圖常用于商業(yè)數(shù)據(jù)表達,如股票走勢、市場行情等。和數(shù)據(jù)軌跡圖類似,但是尺寸更小。第 29 頁竢實揚華,自強不息散點圖矩陣第 30 頁竢實揚華,自強不息維恩圖四集合維恩圖的不同畫法319 熱力圖(Heat map)熱力圖使用顏色來表
16、達位置相關的二維數(shù)值數(shù)據(jù)大小。這些數(shù)據(jù)常以矩陣或方格形式整齊排列,或在地圖上按一定的位置關系排列,每個數(shù)據(jù)點的顏色編碼數(shù)據(jù)大小,如圖4.17所示:第 31 頁竢實揚華,自強不息4.3.1 原始數(shù)據(jù)繪圖圖4.17 使用熱力圖表示杭州市公共自行車租車點的繁忙程度(由紅色至綠色遞減)第 32 頁竢實揚華,自強不息4.3.2簡單統(tǒng)計值標繪圖4.6 盒須圖的標準表示(左圖)及其若干變種盒須圖是John Tukey發(fā)明的通過標繪簡單的統(tǒng)計值來呈現(xiàn)一維和二維數(shù)據(jù)分布的一種方法。它的基本形式是用一個長方形盒子表示數(shù)據(jù)的大致范圍(數(shù)據(jù)值范圍的25%75),并在盒子中用橫線標明均值的位置。同時,在盒子上部和下部分
17、別用兩根橫線標注最大值和最小值。盒須圖在實驗數(shù)據(jù)的分析中非常有用。針對二維數(shù)據(jù),標準的一維盒須圖可擴充為二維盒須圖。(見圖4.6)第 33 頁竢實揚華,自強不息第 34 頁竢實揚華,自強不息4.3.3 多視圖協(xié)調關聯(lián)多視圖協(xié)調關聯(lián)(multiple coordinated views)將不同種類的繪圖組合起來,每個繪圖單元可以展現(xiàn)數(shù)據(jù)某個方面的屬性,并且通常允許用戶進行交互分析,提升用戶對數(shù)據(jù)的模式識別能力。在多視圖協(xié)調關聯(lián)應用中,“選擇”操作作為一種探索辦法,可以是對某個對象和屬性進行“取消選擇”的過程,也可以是選擇屬性的子集或對象的子集,以查看每個部分之間的關系的過程。第 35 頁竢實揚華
18、,自強不息探索式基因可視分析過程MizBee的設計基于知覺原則,包括幾種技術,如邊緣捆綁和分層,以增強與接近度,大小,相似性和方向相關的保護關系的視覺提示。第 36 頁竢實揚華,自強不息如圖所示,總結了根據(jù)分析需求可采用的統(tǒng)計可視化方法。圖 基本的統(tǒng)計圖表可視化方法和適用規(guī)則第 37 頁竢實揚華,自強不息可視化的首要任務是準確地展示和傳達數(shù)據(jù)所包含的信息。在此前提下,針對特定的用戶對象,設計者可以根據(jù)用戶的預期和需求,提供有效輔助手段以方便用戶理解數(shù)據(jù),從而完成有效的可視化。4.4可視化設計原則“”第 38 頁竢實揚華,自強不息設計一個可視化視圖包括三個主要步驟:確定數(shù)據(jù)到圖形元素(即標記)和
19、視覺通道的映射;視圖的選擇與用戶交互控制的設計;數(shù)據(jù)的篩選,即確定在有限的可視化視圖空間中選擇適當容量的信息進行編碼,以避免在數(shù)據(jù)量過大情況下產(chǎn)生的視覺混亂。即可視化結果中要保持合理的信息密度。為提高可視化結果的有效性,可視化設計還包括顏色、標記、動畫的設計等。第 39 頁竢實揚華,自強不息4.4.1數(shù)據(jù)到可視化的直觀映射圖 基本數(shù)據(jù)類型適用的可視化編碼方式(優(yōu)先級自上而下)在選擇合適的數(shù)據(jù)到可視化元素(標記和視覺通道)的映射時,設計者首先需要考慮的是數(shù)據(jù)的語義和可視化用戶的個性特征。一般而言,可視化的一個核心作用是使用戶在最短的時間內獲取數(shù)據(jù)的整體信息和大部分細節(jié)信息,這通過直接觀察數(shù)據(jù)顯然
20、無法完成。數(shù)據(jù)到可視化元素的映射需充分利用已有的先驗知識,從而降低人們對信息的感知和認知所需要的時間。對于基本數(shù)據(jù)類型,可以通過使用不同的視覺編碼通道來表達數(shù)據(jù)及其之間的關系。(見圖)第 40 頁竢實揚華,自強不息4.4.1數(shù)據(jù)到可視化的直觀映射圖4.9 使用散點圖的形式可視化行星到太陽的距離和行星公轉時間實際應用中的數(shù)據(jù)通常是基礎數(shù)據(jù)類型的實例和組合,其可視化方法一般為采用基于不同視覺編碼通道的組合。如圖4.9所示的可視化設計使用的是散點圖,在點標記的選擇上設計者使用了眾所周知的一些紋理貼圖以表示不同的行星,用橫軸表示距離,縱軸表示公轉時間,同時使用了標簽對各行星的數(shù)據(jù)進行標注。第 41 頁
21、竢實揚華,自強不息可視化系統(tǒng)也可以向用戶提供一些靈活特性。例如,左圖將時間和空間分別映射為橫軸和縱軸,可以呈現(xiàn)時空演化的事件。圖:復活節(jié)前一周耶穌活動記錄可視化。全周時間沿橫軸從左到右布局,灰色長塊區(qū)域表現(xiàn)了空間,不同顏色的管道線的位置遠近編碼了人物之間的互動。第 42 頁竢實揚華,自強不息4.4.2 視圖選擇與交互設計對于簡單的數(shù)據(jù),使用一個基本的可視化視圖就可以展現(xiàn)數(shù)據(jù)的所有信息;對于復雜的數(shù)據(jù),就需要使用較為復雜的可視化視圖,甚至為此發(fā)明新的視圖,以有效的展示數(shù)據(jù)中所包含的信息。一般而言,一個成功的可視化首先需要考慮的是被用戶所廣泛認可并熟悉的視圖設計。此外,可視化系統(tǒng)還必須提供一系列的
22、交互手段,使得用戶可以按照自己滿意的方式修改視圖的呈現(xiàn)形式。第 43 頁竢實揚華,自強不息數(shù)據(jù)縮放和裁剪工具在對數(shù)據(jù)進行可視映射之前,用戶通常會對數(shù)據(jù)進行縮放并對可視化數(shù)據(jù)的范圍進行必要的裁剪,從而控制最終可視化的數(shù)據(jù)內容。LOD控制細節(jié)層次(level-of-detail)控制有助于在不同的條件下隱藏或者突出數(shù)據(jù)的細節(jié)部分。0504滾動與縮放當數(shù)據(jù)無法在當前有限的分辨率下完整展示時,滾動與縮放是非常有效的交互方式。顏色映射的控制調色盤是可視化系統(tǒng)的基本配置。同樣,允許用戶修改或者制作新的調色盤也能增加可視化系統(tǒng)的易用性和靈活性。數(shù)據(jù)映射方式的控制在可視化設計時,設計者首先需要確定一個直觀且易
23、于理解的數(shù)據(jù)到可視化的映射。(見后圖)02034.4.2 視圖選擇與交互設計視圖的交互主要包括以下一些方面:01第 44 頁竢實揚華,自強不息4.4.2 視圖選擇與交互設計實際使用過程中,用戶仍有可能需要轉換到另一種映射方式來觀察他們感興趣的其他特征。因此,完善的可視化系統(tǒng)在提供默認的數(shù)據(jù)映射方式前提下,仍需保留用戶對數(shù)據(jù)映射方式的控制交互。如圖所示,可視化使用了兩種不同的數(shù)據(jù)映射方式展示了同一個數(shù)據(jù)。圖 用散點圖和平行坐標圖對一個4維數(shù)據(jù)進行可視化第 45 頁竢實揚華,自強不息4.4.3 信息密度數(shù)據(jù)的篩選在確定了數(shù)據(jù)到可視化元素的映射和視圖與交互的設計后,信息可視化設計的另一個關鍵挑戰(zhàn)是:
24、設計者必須決定可視化視圖所需要包含的信息量。(數(shù)據(jù)墨水比是衡量信息可視化的表達效果)失敗的可視化案例主要存在兩種極端情況:第一種極端情況是可視化展示了過少的數(shù)據(jù)信息;可視化只是輔助用戶認識和理解數(shù)據(jù)的工具,可視化過少的數(shù)據(jù)信息并不能給用戶理解數(shù)據(jù)帶來好處。第二種極端情況是設計者試圖表達和傳遞過多的信息。包含過多信息增加視覺復雜度,造成用戶難以理解。第 46 頁竢實揚華,自強不息4.4.4美學因素圖 一個不完整的可視化結果與一個完整的可視化結果在可視化設計中,僅僅完成上述三個步驟仍然無法形成有效的可視化,用戶可能仍然無法從可視化結果中獲取足夠的信息,以判斷和理解可視化所包含的內容。例如,左圖只是
25、簡單地完成了數(shù)據(jù)到可視化(位置和顏色)的映射,然而在用戶看來,它僅僅是幾條不同顏色的曲線;右圖則是一個較完整的可視化,通過增加坐標軸、顏色和尺寸等的標注和說明,用戶就能知道這10條曲線的信息含義。第 47 頁竢實揚華,自強不息4.4.4美學因素圖 一個不完整的可視化結果與一個完整的可視化結果圖展示了網(wǎng)格及其標注是否被合理使用的例子。在(a)和(c)中,分別由于網(wǎng)格的過多使用和過少使用,使得可視化結果在缺少數(shù)據(jù)表達的精確性的同時也缺失了美觀性,而(b)中通過網(wǎng)格的合理使用,數(shù)據(jù)所映射的點能夠被用戶很好地理解。第 48 頁竢實揚華,自強不息4.4.4美學因素圖4.13 網(wǎng)格間距的正確使用例子網(wǎng)格所
26、表示的區(qū)間的均勻性對于用戶對可視化的理解也非常重要。圖4.13左圖所示的可視化結果中由于設計者使用了不均勻的網(wǎng)格間距(橫軸)和非零的起始位置(縱軸),使得用戶對可視化結果的理解很難忠于原始數(shù)據(jù)所包含的信息。第 49 頁竢實揚華,自強不息可視化中,顏色是使用最廣泛的視覺通道,也是經(jīng)常被過度甚至錯誤使用的一個重要的視覺參數(shù)。使用錯誤的顏色映射表或者視圖使用很多不同的顏色表示大量數(shù)據(jù)屬性,都可能導致可視化結果的視覺混亂。另外,由于人的感知判斷是基于相對判斷的,特別對顏色的感知,因此進行顏色選取的時候也需要特別謹慎。在某些可視化領域,可視化的設計者還要考慮色覺障礙用戶的因素,使得可視化結果對這些用戶依
27、然能夠起到信息的表達與傳遞的功能。第 50 頁竢實揚華,自強不息4.4.4美學因素圖4.14 可視化元素的平衡分布在可視化設計的方法學中,提高可視化的美學性方法主要有:聚焦:設計者必須通過適當?shù)募夹g手段將用戶的注意力集中到可視化結果中的最重要區(qū)域。(前向注意力)平衡:平衡原則要求可視化的設計空間必須被有效地利用,盡量使重要元素置于可視化設計空間的中心或中心附近,同時確保元素在可視化設計空間中的平衡分布。簡單:簡單原則要求設計者盡量避免在可視化中包含過多的造成混亂的圖形元素,也要盡量避免使用過于復雜的世界效果。最終找到可視化結果美學特征與傳達的信息含量的平衡。在圖4.14中,左圖將主要的可視化元
28、素置于視圖空間的右上角,違背了平衡原則。4.4.5動畫與過渡 信息可視化的結果主要以兩種形式存在:可視化視圖與可視化系統(tǒng)。前者通常是圖像,是相關人員進行交流的載體形式;后者則創(chuàng)建了一個終端用戶(包括設計者和一般用戶)與數(shù)據(jù)進行交互的系統(tǒng)環(huán)境,使得用戶可以根據(jù)自己的意圖選擇合適的可視化映射和可視化信息密度,并通過系統(tǒng)提供的交互生成最終的可視化視圖或可視化視圖序列。 動畫與過濾效果是可視化系統(tǒng)中常用的技術,它通常被用于增加可視化結果視圖的豐富性與可理解性,或增加用戶交互的反饋效果。例如,對于時變的科學數(shù)據(jù),采用科學可視化方法逐楨繪制每個時刻的數(shù)據(jù),可重現(xiàn)動態(tài)的物理或化學演化規(guī)律。在可視化系統(tǒng)中,動
29、畫與過渡效果的功能可概括如下:第 52 頁竢實揚華,自強不息4.4.5 動畫與過渡 1. 用時間換取空間,在有限的屏幕空間中展示更多的數(shù)據(jù)當數(shù)據(jù)包含多個維度時,需要通過多個視覺通道編碼不同的維度信息,此時如果采用動畫的方式編碼隨著時間演進而產(chǎn)生的數(shù)據(jù)值變化,則可以在有限的視圖空間上展示更多的信息,同時也確保任何單一時刻時可視化結果對有限視圖空間的充分利用。案例:兒童死亡率與收入的關系與變化(GapminderFlash_MDG4_07jan09)第 53 頁竢實揚華,自強不息2. 輔助不同可視化視圖之間的轉換與跟蹤,或者輔助不同可視化視覺通道的變換用戶在瀏覽可視化數(shù)據(jù)的過程中需要在不同的視圖之
30、間進行切換,使用動畫效果輔助視圖切換過程有助于用戶跟蹤在不同可視化視圖中出現(xiàn)的相同元素。采用動畫切換技術,可以減輕視圖變換給用戶帶來的“沖擊”,避免用戶在轉換過程縱迷失,方便用戶跟蹤數(shù)據(jù)的信息。從柱狀圖過渡成餅圖的動畫序列的幾幀截圖,避免兩種可視化編碼切換所帶來的視覺“沖擊”第 54 頁竢實揚華,自強不息3. 增加用戶在可視化系統(tǒng)中交互的反饋效果 實時的反饋效果有助于用戶獲得對其所做操作的確認,以避免用戶盲目地重復操作。例如,一個簡單的進度條可讓用戶知道處理進展;當用戶鼠標經(jīng)過散點圖的某個點時,物體在很短的時間內(200ms)產(chǎn)生一個光暈動畫,表示該物體能被點選或進行其他操作。4. 引起觀察者
31、注意力 動畫作為視覺通道包括了運動的方向、運動的速度和閃爍的頻率等。由于閃爍等動畫效果很難被人眼忽視,因此,當有特別重要的信息需要被觀察者捕捉時,對標記進行閃爍是一個不錯的選擇。也正因為如此,在可視化中動畫作為視覺通道必須小心謹慎地使用。第 55 頁竢實揚華,自強不息4.4.6可視化隱喻在解釋或者介紹人們不熟悉的事物和概念的時候,常常將其與一個人們所熟悉的事物進行比較來幫助理解,這樣的手法稱為隱喻(metaphor)。隱喻的設計包含三個層面:隱喻本體、隱喻喻體和可視化變量。本體和喻體之間存在某種關聯(lián)或相似性。在可視化中也常常使用這樣的方法,將需要介紹的事物和概念用人們所熟知的事物的視覺形態(tài)來呈
32、現(xiàn)。時間隱喻和空間隱喻是可視化隱喻中最常見的兩類方式。選取合適的源域和喻體表示時間和空間概念,能創(chuàng)造最佳的可視和交互效果。第 56 頁竢實揚華,自強不息第 57 頁竢實揚華,自強不息4.4.7 顏色與透明度顏色在數(shù)據(jù)可視化領域通常被用于編碼數(shù)據(jù)的分類或定序屬性。當顏色的兩種數(shù)據(jù)編碼規(guī)則在用戶所見的視圖空間中存在相互遮掩時,可視化的設計者必須從中選擇一種予以顯示。為了便于用戶在觀察和探索數(shù)據(jù)可視化時從整體進行把握,可以給顏色增加一個表示不透明度的分量通道,通常也稱為通道,用于表示離觀察者更近的顏色對背景顏色的透過程度。當顏色的值為1時,表示不透過任何背景顏色,即顏色是不透明的;當顏色的值為0時,
33、表示該顏色是透明的;當顏色的值介于0和1之間時,表示該顏色可以透過一部分背景的顏色,從而實現(xiàn)當前顏色和背景顏色的混合,創(chuàng)造出可視化的上下文效果。顏色混合可以在一定程度上避免兩種數(shù)據(jù)編碼規(guī)則的遮擋問題,便于抓住數(shù)據(jù)的特征,提高用戶的交互體驗。但也容易導致顏色視覺通道的失效,要慎用顏色混合。第 58 頁竢實揚華,自強不息 對于一門學科而言,目前可視化還處于發(fā)展階段,研究者在不斷探索和發(fā)展可視化理論,試圖建立不同的模型,對可視化進行規(guī)則的描述。4.5可視化理論發(fā)展“”第 59 頁竢實揚華,自強不息4.5.1 圖形符號學表 Bertin的圖形詞匯Bertin使用符號學來描述圖形,提出了信息的可視化編碼
34、原則,并嚴格地定義了二維圖形及其對信息的表達過程。他將圖形系統(tǒng)嚴格區(qū)分為內容(所要表達的信息和數(shù)據(jù))和載體(圖形符號)。在此框架下,圖形(可視化)由傳輸不同信息的圖形符號組成。圖形符號用視覺變量描述,包括位置變量和視網(wǎng)膜變量。如表4.2所示:基于基本元素(點線面)的組合可以產(chǎn)生各類圖形的視網(wǎng)膜變量。在此基礎上,視網(wǎng)膜變量可以表達不同層次的組織,且變量之間存在關聯(lián)性、選擇性、有序性和定量性。圖形符號點、線和面位置變量二維平面上的位置視網(wǎng)膜變量尺寸、數(shù)值、紋理、顏色、方向和形狀第 60 頁竢實揚華,自強不息層次變量關聯(lián)性選擇性有序性定量性平面YYYY大小YYY數(shù)值YY紋理YYY顏色YY方向YY形狀
35、Y表 不同視網(wǎng)膜變量對應的層次組織關聯(lián)性:根據(jù)屬性可找出圖形符號對應關系,并進行分類;選擇性:根據(jù)屬性可找出圖形符號所屬類別;有序性:根據(jù)屬性可對圖形符號進行排序;定量性:根據(jù)屬性可從圖形符號推導出比例關系或者距離第 61 頁竢實揚華,自強不息4.5.1 圖形符號學Bertin提出的視覺變量標記形式點線面通道位置尺寸灰階值紋理色彩方向形狀第 62 頁竢實揚華,自強不息4.5.2 關系數(shù)據(jù)的圖形表示1986年,Mackinlay提出了一種可從數(shù)據(jù)庫中自動提取信息并用圖形方式顯示的技術。和Bertin的理論相似,這種可視化技術采用二維靜態(tài)表達方式,如散點圖和網(wǎng)絡圖。區(qū)別在于Mackinlay試圖用
36、圖形語言描述和定義可視化的表達。Mackinlay提出:圖形語言需要滿足表達性和有效性,表達性指圖形語言必須能夠表達所需的信息;有效性指對于給定情況,圖形語言必須有效的使用顯示介質和人的視覺系統(tǒng)。圖形符號點、線和面位置變量一維、二維和三維時間變量動畫視網(wǎng)膜變量顏色、形狀、尺寸、飽和度、紋理和方向表4.3 Mackinlay的圖形詞匯Mackinlay提出了一套基本的圖形語言和組合算子,在這些元素的基礎上可通過運算構造出更高級的圖形表達?;贐ertin的理論, Mackinlay提出了新的圖形詞匯(見表4.3)第 63 頁竢實揚華,自強不息以及初級圖形語言的基組(見表4.4)并定義了三個用于合
37、并兩個表達相同信息的圖形句子的原則:雙軸合并:合并的圖形句子具有相同的橫軸和縱軸。單軸合并:對齊圖形句子中相同的橫軸或者縱軸。圖形合并:對齊圖形句子中的圖形。編碼技術基本圖形語言視網(wǎng)膜變量顏色、形狀、尺寸、飽和度、紋理和方向單個位置橫軸、豎軸拼接位置曲線圖、柱狀圖、散點圖地圖道路圖、地形圖鏈接樹、圖、網(wǎng)絡雜項餅圖、維恩圖表4.4 Mackinlay的初級圖形語言的基組Mackinlay的創(chuàng)新之處是進一步提出了表達性和有效性原則,并且提供了更為嚴格的圖形語言描述第 64 頁竢實揚華,自強不息Mackinlay提出的視覺變量4.5.2 關系數(shù)據(jù)的圖形表示第 65 頁竢實揚華,自強不息4.5.3 圖
38、形語法表4.5 Wilinson的語法規(guī)范Wilkinson提出了一種底層設計圖形生成語言,可用于構造不同類型的統(tǒng)計圖形。圖形的構造過程分為三個階段:規(guī)范定義、組裝和顯示。其中,規(guī)范定義是整個語法的基礎,描述了不同圖形對象間的轉變和最終圖形顯示映射。整個語法規(guī)范由7個部分組成(見表4.5)。其中,數(shù)據(jù)和轉換定義在數(shù)據(jù)空間;框架、標度和坐標定義了底層的圖形幾何和數(shù)據(jù)的空間位置;圖形定義了不同的圖形對象。數(shù)據(jù)從數(shù)據(jù)集中生成變量的數(shù)據(jù)操作轉換數(shù)據(jù)變量間的轉換框架變量空間,包括變量間的操作標度標度轉換坐標坐標系統(tǒng)圖形圖形及其美學屬性參考用于圖形對象間的對齊、分類和比較等第 66 頁竢實揚華,自強不息形
39、式表面運動聲音文字位置堆疊躲避擾動尺寸形狀多邊形符號圖片旋轉顏色色相亮度飽和度紋理圖案粒度方向模糊透明度方向速度加速音調聲響節(jié)奏語音標簽Wilkinson也定義了標準圖形和美學屬性。其中,標準圖形對應于Bertin 的圖形符號,美學屬性對應Bertin的視網(wǎng)膜變量。Wilkinson的美學屬性Wilkinson提出兩個重要的可視化概念數(shù)據(jù)和它們的視覺表達應該被區(qū)分(類似于Bertin的內容和載體的分離)可應用不同的算子構造數(shù)據(jù)變量的可視化。即可采用融合+等算子從各類數(shù)據(jù)變量出發(fā)定義復雜的圖形空間,并通過縮放映射島顯示視圖。第 67 頁竢實揚華,自強不息4.5.4 基于數(shù)據(jù)類型的研究一維:一維數(shù)據(jù)指由字母或文字組成的線性數(shù)據(jù),如文本文件、程序源代碼等。可視化設計主要針對文字、選擇字體、顏色、大小和顯示方式。用戶需求一半是搜索文本或者數(shù)據(jù)項,以及相關屬性。二維:二維數(shù)據(jù)主要是平面或地圖數(shù)據(jù),例如地理地圖、平面圖或報紙版面等。數(shù)據(jù)集中每一項對應二維平面上的某些區(qū)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年綠色生態(tài)建筑農(nóng)民工勞動合同示范3篇
- 二零二五年度防盜門行業(yè)市場分析報告合同2篇
- 二零二五版加油站智能監(jiān)控與數(shù)據(jù)分析合同3篇
- 二零二五白云區(qū)觀白活力中心房地產(chǎn)合作開發(fā)投資框架合同2篇
- 二零二五年度智能家電產(chǎn)品研發(fā)與銷售合同3篇
- 二零二五版養(yǎng)殖企業(yè)與個體養(yǎng)牛戶合作合同3篇
- 二零二五版數(shù)據(jù)中心機房租賃及數(shù)據(jù)備份服務合同2篇
- 基于2025年度5G網(wǎng)絡技術研發(fā)合作合同2篇
- 二零二五版拌和站產(chǎn)品質量追溯與售后服務合同2篇
- 二零二五版建筑工程土方中介合同糾紛調解機制3篇
- 課題申報書:GenAI賦能新質人才培養(yǎng)的生成式學習設計研究
- 外配處方章管理制度
- 2025年四川長寧縣城投公司招聘筆試參考題庫含答案解析
- 駱駝祥子-(一)-劇本
- 《工程勘察設計收費標準》(2002年修訂本)
- 全國醫(yī)院數(shù)量統(tǒng)計
- 【MOOC】PLC技術及應用(三菱FX系列)-職教MOOC建設委員會 中國大學慕課MOOC答案
- 2023七年級英語下冊 Unit 3 How do you get to school Section A 第1課時(1a-2e)教案 (新版)人教新目標版
- 泌尿科主任述職報告
- 2024年醫(yī)美行業(yè)社媒平臺人群趨勢洞察報告-醫(yī)美行業(yè)觀察星秀傳媒
- 第六次全國幽門螺桿菌感染處理共識報告-
評論
0/150
提交評論