大數(shù)據(jù)可視化技術(shù)教案_第1頁
大數(shù)據(jù)可視化技術(shù)教案_第2頁
大數(shù)據(jù)可視化技術(shù)教案_第3頁
大數(shù)據(jù)可視化技術(shù)教案_第4頁
大數(shù)據(jù)可視化技術(shù)教案_第5頁
已閱讀5頁,還剩58頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

《大數(shù)據(jù)可視化技術(shù)》教案(總62

頁)

--本頁僅作為文檔封面,使用時請直接刪除即可--

--內(nèi)頁可以根據(jù)需求調(diào)整合適字體及大小--

教案

(詳案)

2019-2020學(xué)年第2學(xué)期

課程名稱:大數(shù)據(jù)可視化技術(shù)

課程代碼:

適用專業(yè):計算機(jī)應(yīng)用技術(shù)

教師姓名:

所屬系部:

職稱:

課時:總學(xué)時64

使用教材:大數(shù)據(jù)可視化技術(shù)

2

教學(xué)單元教案

主題任務(wù)1大數(shù)據(jù)可視化概述序號1

課時2教學(xué)手段多媒體、板書、實(shí)訓(xùn)室

教學(xué)方法講授法、演示法、案例法

教學(xué)課型□理論□實(shí)訓(xùn)√一體化□(其它)

能力目標(biāo):能夠理解什么是大數(shù)據(jù)可視化;掌握大數(shù)據(jù)可視化的作用與意義。

知識目標(biāo):能夠理解什么是大數(shù)據(jù)可視化;掌握大數(shù)據(jù)可視化的作用與意義;了解數(shù)據(jù)

教學(xué)目標(biāo)

可視化在其他領(lǐng)域的應(yīng)用。

素質(zhì)目標(biāo):復(fù)習(xí)舊知識、學(xué)習(xí)新知識的能力。

能夠理解什么是大數(shù)據(jù)可視化;掌握大數(shù)據(jù)可視化的作用與意義;了解數(shù)據(jù)可視化在其他

教學(xué)重點(diǎn)

領(lǐng)域的應(yīng)用。

教學(xué)難點(diǎn)能夠理解什么是大數(shù)據(jù)可視化;掌握大數(shù)據(jù)可視化的作用與意義

教學(xué)過程設(shè)計備注

一.導(dǎo)入(15分鐘)

數(shù)據(jù)是抽象的,有時也可以是異常美麗的??梢暬夹g(shù)為大數(shù)據(jù)分析

提供了一種更加直觀的數(shù)據(jù)挖掘、分析與展示手段,有助于發(fā)現(xiàn)大數(shù)據(jù)中

蘊(yùn)含的規(guī)律,在各行各業(yè)均得到了廣泛的應(yīng)用。

可視化和可視化分析利用人類視覺認(rèn)知的高通量特點(diǎn),通過圖形和交

互的形式表現(xiàn)信息的內(nèi)在規(guī)律及其傳遞、表達(dá)的過程,充分結(jié)合人的智能

和機(jī)器的計算分析能力,是人們理解復(fù)雜現(xiàn)象、詮釋復(fù)雜數(shù)據(jù)的重要手段

和途徑。

數(shù)據(jù)可視化是大數(shù)據(jù)的主要理論基礎(chǔ),也是大數(shù)據(jù)的關(guān)鍵技術(shù),已經(jīng)

成為當(dāng)前大數(shù)據(jù)分析的重要研究領(lǐng)域。

下面就讓我們開始大數(shù)據(jù)可視化之旅吧!

教師活動:PPT講解、案例演示;學(xué)生活動:聽講記錄;時間分配:

5分鐘。

二.教學(xué)內(nèi)容(60分鐘)

1、什么是大數(shù)據(jù)可視化

(1)大數(shù)據(jù)可視化的定義

數(shù)據(jù)可視化主要旨在借助于圖形化手段,清晰有效地傳達(dá)與溝通信

息。

3

數(shù)據(jù):聚焦于解決數(shù)據(jù)的采集,清理,預(yù)處理,分析,挖掘。

圖形:聚焦于解決對光學(xué)圖像進(jìn)行接收、提取信息、加工變換、模式

識別及存儲顯示。

可視化:聚焦于解決將數(shù)據(jù)轉(zhuǎn)換成圖形,并進(jìn)行交互處理。

(2)大數(shù)據(jù)可視化的分層

從市場上的數(shù)據(jù)可視化工具來看,數(shù)據(jù)可視化分為5個層級,如下圖

所示:

(3)數(shù)據(jù)可視化技術(shù)基礎(chǔ)概念

數(shù)據(jù)可視化技術(shù)包含以下幾個基本概念:

1.數(shù)據(jù)空間:是由n維屬性和m個元素組成的數(shù)據(jù)集所構(gòu)成的多維信息空間;

2.數(shù)據(jù)開發(fā):是指利用一定的算法和工具對數(shù)據(jù)進(jìn)行定量的推演和計算;

3.數(shù)據(jù)分析:指對多維數(shù)據(jù)進(jìn)行切片、塊、旋轉(zhuǎn)等動作剖析數(shù)據(jù),從而能多角度多側(cè)面

觀察數(shù)據(jù);

4.數(shù)據(jù)可視化:是指將大型數(shù)據(jù)集中的數(shù)據(jù)以圖形圖像形式表示,并利用數(shù)據(jù)分析和開

發(fā)工具發(fā)現(xiàn)其中未知信息的處理過程。

數(shù)據(jù)可視化已經(jīng)提出了許多方法,這些方法根據(jù)其可視化的原理不同可以劃分為基于幾何的

技術(shù)、面向像素技術(shù)、基于圖標(biāo)的技術(shù)、基于層次的技術(shù)、基于圖像的技術(shù)和分布式技術(shù)等

等。

(4)數(shù)據(jù)可視化領(lǐng)域的起源

4

數(shù)據(jù)可視化領(lǐng)域的起源,可以追溯到20世紀(jì)50年代計算機(jī)圖形學(xué)的早期。當(dāng)時,人們利用

計算機(jī)創(chuàng)建了首批圖形圖表。

(5)教師活動:PPT講解;學(xué)生活動:聽講記錄;時間分配:20分

鐘。

2、數(shù)據(jù)可視化作用與意義

(1)數(shù)據(jù)可視化作用

數(shù)據(jù)可視化的主要作用包括數(shù)據(jù)記錄和表達(dá)、數(shù)據(jù)操作及數(shù)據(jù)分析3個方面,這也是以

可視化技術(shù)支持計算機(jī)輔助數(shù)據(jù)認(rèn)知的3個基本階段:

1.數(shù)據(jù)記錄和表達(dá)

借助于有效的圖形展示工具,數(shù)據(jù)可視化能夠在小空間呈現(xiàn)大規(guī)模數(shù)據(jù)。

2.數(shù)據(jù)操作

數(shù)據(jù)操作是以計算機(jī)提供的界面、接口、協(xié)議等條件為基礎(chǔ)完成人與數(shù)據(jù)的交互需求。

3.數(shù)據(jù)分析

數(shù)據(jù)分析是通過數(shù)據(jù)計算獲得多維、多源、異構(gòu)和海量數(shù)據(jù)所隱含信息的核心手段,它

是數(shù)據(jù)存儲、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)計算和數(shù)據(jù)可視化的綜合應(yīng)用。

(2)數(shù)據(jù)可視化意義

數(shù)據(jù)可視化在數(shù)據(jù)科學(xué)中的重要地位主要表現(xiàn)在以下4個方面:

1.視覺是人類獲得信息的最主要途徑

1)視覺感知是人類大腦的最主要功能之一

2)眼睛是感知信息能力最強(qiáng)的人體器官之一

2.數(shù)據(jù)可視化的主要優(yōu)勢

1)可以洞察統(tǒng)計分析無法發(fā)現(xiàn)的結(jié)構(gòu)和細(xì)節(jié)

2)可視化處理有利于大數(shù)據(jù)普及應(yīng)用

3.可視化能夠幫助人們提高理解與處理數(shù)據(jù)的效率

4.數(shù)據(jù)可視化能夠在小空間展示大規(guī)模數(shù)據(jù)

3、數(shù)據(jù)可視化的經(jīng)典案例

數(shù)據(jù)可視化是對各類數(shù)據(jù)的可視化理論與方法的統(tǒng)稱。

近年來,可視化的應(yīng)用范圍隨著計算機(jī)技術(shù)、圖形學(xué)技術(shù)的發(fā)展而不斷拓寬,除了傳統(tǒng)的醫(yī)

學(xué)、航空學(xué)、汽車設(shè)計、氣象預(yù)報和海洋學(xué)領(lǐng)域外,大數(shù)據(jù)可視化的重要應(yīng)用領(lǐng)域表現(xiàn)在大科

學(xué)、大工程、大安全、互聯(lián)網(wǎng)與社交媒體、物聯(lián)網(wǎng)與智慧城市5大領(lǐng)域。

5

(1)元素周期表

(2)倫敦地鐵圖

(3)南丁格爾玫瑰圖

(4)智能交通可視化

(5)生命科學(xué)可視化

教師活動:講解演示;學(xué)生活動:聽講記錄;時間分配:50分鐘。

三.總結(jié)(5分鐘)

教師總結(jié)本次課的重點(diǎn)內(nèi)容及需要使用的注意知識點(diǎn)。

作業(yè)布置

教學(xué)反思

6

教學(xué)單元教案

主題任務(wù)2可視化的類型與模型序號2

課時2教學(xué)手段多媒體、板書、實(shí)訓(xùn)室

教學(xué)方法講授法、演示法、案例法

教學(xué)課型□理論□實(shí)訓(xùn)√一體化□(其它)

能力目標(biāo):能夠掌握科學(xué)可視化的常用方法;能夠掌握可視化三大模型的基本流程、

分析過程。

教學(xué)目標(biāo)知識目標(biāo):能夠基本掌握可視化的兩大類型;能夠掌握科學(xué)可視化的常用方法;能夠

掌握信息可視化數(shù)據(jù)的分類;能夠掌握可視化三大模型的基本流程、分析過程。

素質(zhì)目標(biāo):接受新知識、自主學(xué)習(xí)的能力。

能夠掌握科學(xué)可視化的常用方法;能夠掌握信息可視化數(shù)據(jù)的分類;能夠掌握可視化三大

教學(xué)重點(diǎn)

模型的基本流程、分析過程;

教學(xué)難點(diǎn)能夠掌握科學(xué)可視化的常用方法;能夠掌握可視化三大模型的基本流程、分析過程。

教學(xué)過程設(shè)計備注

一.導(dǎo)入(5分鐘)

了解了可視化相關(guān)技術(shù)及運(yùn)用領(lǐng)域,這一節(jié)我們將來學(xué)習(xí)可視化的類

型與模型。教師活動:PPT講解;學(xué)生活動:聽講記錄;時間分配:5分

鐘。

二.教學(xué)內(nèi)容

1、可視化類型(70分鐘)

2、科學(xué)可視化

7

科學(xué)可視化最初稱為“科學(xué)計算機(jī)之中的可視化”(VisualizationInScientific

Computing,VISC)。

運(yùn)用計算機(jī)圖形學(xué)和圖像處理的研究成果創(chuàng)建視覺圖像,替代那些規(guī)模龐大而又錯綜復(fù)雜的

數(shù)字化呈現(xiàn)形式,幫助人們更好地理解科學(xué)技術(shù)概念和科學(xué)數(shù)據(jù)成果。

科學(xué)可視化的研究重點(diǎn)有兩個:

一是判斷可視化對象的類別,判斷類別之后才能確定如何用計算機(jī)來進(jìn)行可視化表現(xiàn);

二是將研究對象以最接近真實(shí)事物的效果快速地繪制出來,不僅以單純展示的方式顯現(xiàn)出

來,而且能通過虛擬空間的方式讓人們身臨其境,用視覺、觸覺等交互方式進(jìn)行觀察、理解和研

究。

(1)發(fā)展方向

科學(xué)可視化所涉及的領(lǐng)域包括建筑學(xué)、氣象環(huán)境學(xué)、醫(yī)學(xué)、生物學(xué)、考古學(xué)、機(jī)械制造

等,所有它所處理的對象是指具有空間幾何特征數(shù)據(jù)的時空現(xiàn)象,需要對勘察、計算、實(shí)驗(yàn)?zāi)M

等獲取到的數(shù)據(jù)進(jìn)行描繪,并提供交互分析手段。所有其發(fā)展的方向也非常多樣。

(2)分類

體可視化

研究對象主要是體數(shù)據(jù),即三維采樣數(shù)據(jù),是各類科學(xué)工程領(lǐng)域以及醫(yī)學(xué)領(lǐng)域中常見的數(shù)據(jù)

類型(圖2-1)。

體可視化技術(shù)包括等值面的抽取技術(shù)(Iso-surfacesExtractionTechnique)、直接體繪制

(DirectVolumeRendering)等。

流場可視化

運(yùn)用計算機(jī)圖形學(xué)和圖像處理技術(shù),將流場數(shù)據(jù)轉(zhuǎn)換為二維或三維圖形、圖像或動畫進(jìn)行呈

現(xiàn),并詳細(xì)分析其模式和相互關(guān)系,是計算流體力學(xué)研究與工程實(shí)踐中不可缺少的手段。

大規(guī)模數(shù)據(jù)可視化

研究重點(diǎn)在于如何高效快捷地對海量的數(shù)據(jù)進(jìn)行處理。

(3)常用方法

8

顏色映射方法

用顏色表示數(shù)據(jù)場中數(shù)據(jù)值的大小,即在數(shù)據(jù)與顏色之間建立一個映射關(guān)系,把不同的數(shù)據(jù)

映射為不同的顏色。

等值線方法

制圖對象某一數(shù)量指標(biāo)值相等的各點(diǎn)連成的平滑曲線,由地圖上標(biāo)出的表示制圖對象數(shù)量的

各點(diǎn)采用內(nèi)插法找出各整數(shù)點(diǎn)繪制而成的。每兩條等值線之間的數(shù)量差額多為常數(shù),可通過

等值線的疏密程度來判斷現(xiàn)象的數(shù)量變化趨勢。

立體圖法和層次分割法

矢量數(shù)據(jù)場的直接法和流線法

通過記錄坐標(biāo)的方式來盡可能將地理實(shí)體的空間位置表現(xiàn)的準(zhǔn)確無誤

(3)系統(tǒng)組成

根據(jù)科學(xué)可視化系統(tǒng)主要功能的要求,科學(xué)可視化系統(tǒng)大致可由以下幾部分組成:

數(shù)據(jù)的管理與過濾;

提取幾何圖元和建立模型;

繪制;

顯示和播放。

眾多的科學(xué)可視化系統(tǒng)采用“可視化流水線”作為理論模型:

3、信息可視化

信息可視化是1989年由斯圖爾特卡德(StuartK.Card)、約克·麥金利(JockD.Mackinlay)

和喬治·羅伯遜(GeorgeG.Robertson)提出的

信息可視化就是利用計算機(jī)支撐的、交互的、對抽象數(shù)據(jù)的可視表示,增強(qiáng)人們對這些抽象

信息的認(rèn)知。

------即是將非空間數(shù)據(jù)的信息對象的特征值抽取、轉(zhuǎn)換、映射、高度抽象與整合,用圖

形、圖像、動畫等方式表示信息對象內(nèi)容特征和語義的過程。

信息對象包括文本、圖像、視頻和語音等類型,它們的可視化分別采用不同模型方法實(shí)現(xiàn)。

(1)現(xiàn)代信息可視化發(fā)展

傳統(tǒng)方式的信息可視化是利用視覺設(shè)計學(xué)和人體感官原理,將圖形、色彩、標(biāo)志等原始

視覺信號應(yīng)用于管理實(shí)踐中。伴隨信息技術(shù)、虛擬現(xiàn)實(shí)技術(shù)、計算機(jī)網(wǎng)絡(luò)等的發(fā)展,現(xiàn)代的

日常生活中所需要管理和處理的數(shù)據(jù)遠(yuǎn)超過傳統(tǒng)模式,對信息的失效、準(zhǔn)確度要求也逐步提

高,因此,現(xiàn)代信息可視化技術(shù)主要從以下幾個方面展開:

1.文本信息可視化

2.層次信息可視化

9

信息可視化

4.可視化數(shù)據(jù)挖掘

5.多維信息可視化

(2)數(shù)據(jù)分類

信息可視化可分為:

一維線性數(shù)據(jù)

以一維線性方式組織的數(shù)據(jù),如數(shù)據(jù)庫、文本等。

二維數(shù)據(jù)

又稱平面數(shù)據(jù),,數(shù)據(jù)集中的對象具有形狀、大小、顏色等特征。

三維數(shù)據(jù)

主要集中在數(shù)據(jù)對象的體積、表面積、位置、方向、遮擋與導(dǎo)航等方面。

多維數(shù)據(jù)

是將具有n(3個以上)個屬性的數(shù)據(jù)對象映射為n維空間中的標(biāo)記。

時態(tài)數(shù)據(jù)

時態(tài)數(shù)據(jù)的可視化主要應(yīng)用在期貨市場需求分析、地震預(yù)測和生物電信號分析等領(lǐng)域

層次數(shù)據(jù)

網(wǎng)絡(luò)結(jié)構(gòu)

在信息可視化中,從原始數(shù)據(jù)到用戶,中間要經(jīng)歷一系列數(shù)據(jù)變換。數(shù)據(jù)轉(zhuǎn)換把原始數(shù)據(jù)映

射為數(shù)據(jù)表;

可視化映射把數(shù)據(jù)表轉(zhuǎn)換為結(jié)合了空間基、標(biāo)記和圖形屬性的可視化結(jié)構(gòu)。

(2)技術(shù)

不同的數(shù)據(jù)所涉及的可視化技術(shù)也是不盡相同:

多維數(shù)據(jù)可視化技術(shù)

平行坐標(biāo)系

散點(diǎn)圖

Andrews曲線法

層次數(shù)據(jù)的可視化

節(jié)點(diǎn)連接圖

樹圖

網(wǎng)絡(luò)數(shù)據(jù)可視化

力導(dǎo)向布局

分層布局

網(wǎng)格布局

(3)基本過程及特征

在CARD等提出的信息可視化模型中,信息可視化過程可以劃分為3個數(shù)據(jù)轉(zhuǎn)換的過程:

1.原始數(shù)據(jù)到數(shù)據(jù)表的轉(zhuǎn)換、

2.數(shù)據(jù)表到可視化結(jié)構(gòu)的轉(zhuǎn)換、

3.可視化結(jié)構(gòu)到視圖的轉(zhuǎn)換。

10

(4)主要特點(diǎn)

位置特征交互探討性

直觀形象性信息的動態(tài)性

多源數(shù)據(jù)的采集和集成性信息載體的多樣性

(5)應(yīng)用領(lǐng)域

可視化數(shù)據(jù)挖掘KM可視化

可視化技術(shù)在空間信息挖掘中的應(yīng)用信息可視化商品

4、順序模型

順序模型的流程分為七步,如下圖所示,且七步可歸納為這三大部分:

1.原始數(shù)據(jù)的轉(zhuǎn)換

原始數(shù)據(jù)的轉(zhuǎn)換包括7個階段里的獲取、分析、過濾和挖掘。

2.數(shù)據(jù)的視覺轉(zhuǎn)換

數(shù)據(jù)的視覺轉(zhuǎn)換包括7個階段里的表示和修飾。

3.界面交互

界面交互包括7個階段里的交互。

5、分析模型

下圖是典型的可視分析模型,起點(diǎn)是輸入的數(shù)據(jù),終點(diǎn)是提煉的知識。可視化分析是從數(shù)據(jù)

到知識,從知識到數(shù)據(jù),再從數(shù)據(jù)到知識的循環(huán)過程。

數(shù)據(jù)可視化分析流程中的核心要素包括以下四個方面:

1.數(shù)據(jù)表示與轉(zhuǎn)換

2.數(shù)據(jù)的可視化呈現(xiàn)

3.用戶交互

4.分析推理

11

6、循環(huán)模型

該模型包含左邊計算機(jī)的部分和右邊人的部分。在計算機(jī)部分中,數(shù)據(jù)被繪制為可視化圖

表,同時也通過模型進(jìn)行整理和挖掘。在人的部分中,提出了3層循環(huán):探索循環(huán)、驗(yàn)證循環(huán)和知

識產(chǎn)生循環(huán)。

教師活動:講解、演示;學(xué)生活動:理解記筆記;時間分配:70分

鐘。

三.總結(jié)(5分鐘)

總結(jié)本次課的重點(diǎn)、難點(diǎn)知識:

1、數(shù)據(jù)可視化是關(guān)于數(shù)據(jù)視覺表現(xiàn)形式的科學(xué)技術(shù)研究。這種數(shù)據(jù)

的視覺表現(xiàn)形式被定義為“把信息用某種概要形式抽取出來”,其中應(yīng)包

括信息單位的各種屬性和變量。

2、數(shù)據(jù)可視化主要指的是利用計算機(jī)圖形學(xué)和圖像處理技術(shù),通過

表達(dá),建模以及圖形顯示對數(shù)據(jù)加以可視化解釋。

3、可視化的類型分為:科學(xué)可視化、信息可視化。

4、可視化的模型分為:順序模型、分析模型、循環(huán)模型。

布置作業(yè)并提醒學(xué)生預(yù)習(xí)下次課的內(nèi)容。

作業(yè)布置

教學(xué)反思

12

教學(xué)單元教案

主題任務(wù)3數(shù)據(jù)可視化基礎(chǔ)序號3

課時2教學(xué)手段多媒體、板書、實(shí)訓(xùn)室

教學(xué)方法講授法、演示法、案例法

教學(xué)課型□理論□實(shí)訓(xùn)√一體化□(其它)

能力目標(biāo):掌握可視化的基本特征、流程、設(shè)計組件及框架設(shè)計整

體思路。

教學(xué)目標(biāo)知識目標(biāo):掌握可視化的基本特征、流程、設(shè)計組件及框架設(shè)計整

體思路。

素質(zhì)目標(biāo):接受新知識、自主學(xué)習(xí)的能力。

教學(xué)重點(diǎn)掌握可視化的基本特征、流程、設(shè)計組件及框架設(shè)計整體思路。

教學(xué)難點(diǎn)掌握可視化的基本特征、流程、設(shè)計組件及框架設(shè)計整體思路

教學(xué)過程設(shè)計備注

一.導(dǎo)入(5分鐘)

提出疑問:1、可視化技術(shù)需要學(xué)習(xí)和掌握哪些知識呢怎樣才能更好

的利用可視化技術(shù)呢教師活動:PPT講解;學(xué)生活動:聽講記錄;時間

分配:5分鐘。

二.教學(xué)內(nèi)容(70分鐘)

1、可視化基本特征

(1)數(shù)據(jù)可視化不只是一種新穎的數(shù)據(jù)處理工具和技術(shù),同時作為一種表達(dá)數(shù)據(jù)的方法,它是對

現(xiàn)實(shí)世界的抽象表達(dá)。

(2)利用可見的圖表或圖形呈現(xiàn)數(shù)據(jù),是最能夠讓用戶對數(shù)據(jù)產(chǎn)生直觀印象的方式。

大數(shù)據(jù)可視化不僅有一般數(shù)據(jù)可視化的基本特點(diǎn),更有其本身特性帶來的新要求,其特征主

要體現(xiàn)在以下幾個方面:

(3)易懂性

可視化使人們更加容易地理解數(shù)據(jù)和使用數(shù)據(jù),進(jìn)而便于人們將數(shù)據(jù)與他們的經(jīng)驗(yàn)知識相關(guān)

聯(lián)。可視化使得原本碎片化的數(shù)據(jù)轉(zhuǎn)換為具有特定結(jié)構(gòu)的知識,從而為科學(xué)決策支持提供強(qiáng)有力

的支持。

(4)必然性

數(shù)據(jù)量已遠(yuǎn)遠(yuǎn)超出了人們直接讀取、瀏覽和操作數(shù)據(jù)的能力,必然要求人們對數(shù)據(jù)進(jìn)行形象

化的歸納和總結(jié),對數(shù)據(jù)的結(jié)構(gòu)和表現(xiàn)形式進(jìn)行有效的轉(zhuǎn)換處理。

(5)多維性

通過數(shù)據(jù)可視化的多維呈現(xiàn),能夠清楚地對數(shù)據(jù)相關(guān)的多個變量或者多個屬性進(jìn)行標(biāo)識,并

且所處理的數(shù)據(jù)可以根據(jù)每一維的量值來進(jìn)行顯示、組合、排序與分類。

13

(6)片面性

數(shù)據(jù)可視化往往只是從特定的視角或需求來認(rèn)識數(shù)據(jù),并得到符合特定目的的可視化模式。

數(shù)據(jù)可視化的片面性特征意味著可視化模式不能替代數(shù)據(jù)本身,只能作為數(shù)據(jù)表達(dá)的一種特定形

式。

(7)專業(yè)性

數(shù)據(jù)可視化與領(lǐng)域?qū)I(yè)知識緊密相關(guān),其形式需求多種多樣并隨行業(yè)、用戶和環(huán)境等條件而

動態(tài)變化。專業(yè)化特征是人們從可視化模型中提取專業(yè)知識的必要環(huán)節(jié),是數(shù)據(jù)可視化應(yīng)用的最

后流程。

2、可視化流程

可視化的目的是幫助用戶識別所分析數(shù)據(jù)中隱含的模式或趨勢,而不是提供冗長的描述。

優(yōu)秀的可視化項目應(yīng)該有效地提取和歸納信息,并把信息有機(jī)組織起來,讓用戶的注意力集

中于關(guān)鍵點(diǎn)。好的可視化項目是一個反復(fù)迭代的過程。

可視化的基本步驟

(1)明確問題

開始創(chuàng)建一個可視化項目時,第一步是要明確可視化項目要解決的問題。

(2)從基本的可視化著手

確定可視化的目標(biāo)后,下一步是基于要展現(xiàn)的數(shù)據(jù),選擇建立一個基本的圖形,不同類型的

數(shù)據(jù)各自有其最適合的圖表類型。

(3)確定最能提供信息的指標(biāo)

確定可視化目標(biāo)和可視化形式后,下一步需要確定最能提供信息的指標(biāo),以便于信息準(zhǔn)確表

達(dá)。

(4)選擇正確的圖表類型

在確定最能提供信息的指標(biāo)后,選取正確的圖表類型有助于用戶理解數(shù)據(jù)中隱含的信息和規(guī)

律。

(5)將注意力引向關(guān)鍵信息

最后,采用確定的圖表展現(xiàn)數(shù)據(jù)可視化結(jié)果時,需要將用戶的注意力引向關(guān)鍵的信息。可視

化項目應(yīng)該總結(jié)關(guān)鍵信息并使之更清晰直白,而不應(yīng)該令人困惑。

可視化的一般流程

科學(xué)可視化的可視化流水線

數(shù)據(jù)可視化循環(huán)模型

14

1.數(shù)據(jù)獲取

主動式是以明確的數(shù)據(jù)需求為目的,如衛(wèi)星影像、測繪工程等;被動式是以數(shù)據(jù)平臺為基

礎(chǔ),由數(shù)據(jù)平臺的活動者提供數(shù)據(jù)來源,如電子商務(wù)、網(wǎng)絡(luò)論壇等。

2.數(shù)據(jù)處理

數(shù)據(jù)處理是指對原始的數(shù)據(jù)進(jìn)行質(zhì)量分析、預(yù)處理和計算等步驟。數(shù)據(jù)處理的目標(biāo)是保證數(shù)

據(jù)的準(zhǔn)確性、可用性。

3.可視化模式

可視化模式是數(shù)據(jù)的一種特殊展現(xiàn)形式,常見的可視化模式有標(biāo)簽云、序列分析、網(wǎng)絡(luò)

結(jié)構(gòu)、電子地圖等??梢暬J降倪x取決定了可視化方案的雛形。

4.可視化應(yīng)用

可視化應(yīng)用主要根據(jù)用戶的主觀需求展開,最主要的應(yīng)用方式是用來觀察和展示,通過觀

察和人腦分析進(jìn)行推理和認(rèn)知,輔助人們發(fā)現(xiàn)新知識或者得到新結(jié)論。

3、可視化設(shè)計組件

、可視化設(shè)計模型

數(shù)據(jù)可視化的設(shè)計可簡化為四個層次,各層之間是嵌套的關(guān)系,外層的輸出是內(nèi)層的輸入,

同時外層的錯誤最終會級聯(lián)傳導(dǎo)到各內(nèi)層。

第一層(最外層)

概括描述用戶遇到的實(shí)際問題,稱為問題描述層;

第二層(抽象層)

負(fù)責(zé)將特定領(lǐng)域的任務(wù)和數(shù)據(jù)映射到抽象且通用的任務(wù)及數(shù)據(jù)類型;

第三層(編碼層)

設(shè)計與數(shù)據(jù)類型相關(guān)的視覺編碼及交互方法;

第四層(最內(nèi)層)

則需要實(shí)現(xiàn)正確完成數(shù)據(jù)可視化展示和交互的算法。

、可視化設(shè)計原則

三個原則

?過于復(fù)雜繁瑣的可視化可能會給用戶帶來理解上的麻煩,甚至?xí)鹩脩魧υ紨?shù)據(jù)信息的

誤解

?缺少友好交互控制的可視化也會阻礙用戶以更直觀的方式獲得可視化所包含的信息

?美學(xué)因素也在一定程度上影響用戶對可視化設(shè)計的喜好或厭惡情緒,進(jìn)而影響可視化傳播和

表達(dá)信息的能力。

三個步驟

?確定數(shù)據(jù)到圖形元素(即標(biāo)記)和視覺通道的映射,明確需要呈現(xiàn)的是什么樣的數(shù)據(jù)

?視圖的選擇與用戶交互控制的設(shè)計,建立恰當(dāng)?shù)臄?shù)據(jù)指標(biāo),從總體到局部逐步展示數(shù)據(jù)結(jié)果

15

數(shù)據(jù)的有效篩選并注重數(shù)據(jù)的比較,即確定在有限的可視化視圖空間中選擇適當(dāng)容量的信息

進(jìn)行編碼,以避免在數(shù)據(jù)量過大情況下產(chǎn)生視覺上的混亂。

、可視化的數(shù)據(jù)

1.認(rèn)知數(shù)據(jù)

人們對數(shù)據(jù)的認(rèn)知,一般都經(jīng)過從數(shù)據(jù)模型到概念模型的過程,最后得到數(shù)據(jù)在實(shí)際中的具

體語義。在處理數(shù)據(jù)時,最初接觸的是數(shù)據(jù)模型,數(shù)據(jù)模型是對數(shù)據(jù)的底層描述及相關(guān)操

作。概念模型是對數(shù)據(jù)的高層次描述,對應(yīng)于人們對數(shù)據(jù)的具體認(rèn)知。對數(shù)據(jù)進(jìn)行進(jìn)一步

處理之前,需要定義數(shù)據(jù)的概念和它們之間的聯(lián)系,同時定義數(shù)據(jù)的語義和它們所代表的

含義。

2.數(shù)據(jù)分類

在科學(xué)計算中,通常根據(jù)測量標(biāo)度,將數(shù)據(jù)分為四類:類別型數(shù)據(jù)、有序型數(shù)據(jù)、區(qū)間型數(shù)

據(jù)和比值型數(shù)據(jù)。類別型數(shù)據(jù)用于區(qū)分物體,有序型數(shù)據(jù)用來表示對象間的順序關(guān)系,區(qū)

間型數(shù)據(jù)用于得到對象間的定量比較,比值型數(shù)據(jù)用于比較數(shù)值間的比例關(guān)系,可以精確

地定義比例。

根據(jù)數(shù)據(jù)分析要求,不同的應(yīng)用可以采用不同的數(shù)據(jù)分類方法。例如,根據(jù)數(shù)據(jù)模型,可以

將數(shù)據(jù)分為浮點(diǎn)數(shù)、整數(shù)、字符等;根據(jù)概念模型,可以定義數(shù)據(jù)所對應(yīng)的實(shí)際意義或者

對象,例如汽車、摩托車、自行車等。

、可視化的原材料

視覺暗示

可視化最基本的形式就是簡單地把數(shù)據(jù)映射成彩色圖形??梢暬故颈仨毐WC可以在圖形和它

所代表的數(shù)字間來回切換。

坐標(biāo)系

編碼數(shù)據(jù)的時候,總得把物體放到一定的位置。有一個結(jié)構(gòu)化的空間,還要指定圖形和顏色畫

在哪里的規(guī)則,這就是坐標(biāo)系,它賦予X、Y坐標(biāo)或經(jīng)緯度以意義。

標(biāo)尺

坐標(biāo)系指定了可視化的維度,而標(biāo)尺則指定了在每一個維度里數(shù)據(jù)映射到哪里。標(biāo)尺有多

種,但基本上不會偏離以下三種標(biāo)尺,分別為數(shù)字標(biāo)尺、分類標(biāo)尺和時間標(biāo)尺。

背景信息

背景信息(幫助更好地理解數(shù)據(jù)相關(guān)的5W信息,即何人、何事、何時、何地、為何)

可以使數(shù)據(jù)更清晰,并且能正確引導(dǎo)數(shù)據(jù)使用者。

、可視化的基本圖表

原始數(shù)據(jù)繪圖

原始數(shù)據(jù)繪圖用于可視化原始數(shù)據(jù)的屬性值,直觀呈現(xiàn)數(shù)據(jù)特征,其代表性方法包括:

數(shù)據(jù)軌跡、柱狀圖、折線圖、直方圖、餅圖、等值線圖、散點(diǎn)圖、氣泡圖、維恩圖、熱力圖

和雷達(dá)圖等。

簡單統(tǒng)計值標(biāo)繪

盒須圖是JohnTukey發(fā)明的通過標(biāo)繪簡單的統(tǒng)計值來呈現(xiàn)一維和二維數(shù)據(jù)分布的一種

方法。它的基本形式是用一個長方形盒子表示數(shù)據(jù)的大致范圍,并在盒子中用橫線標(biāo)明均值

的位置。

同時,在盒子上部和下部分別用兩根橫線標(biāo)注最大值和最小值。盒須圖在實(shí)驗(yàn)數(shù)據(jù)的統(tǒng)

計分析中很有用。針對二維數(shù)據(jù),標(biāo)準(zhǔn)的一維盒須圖可以根據(jù)需要擴(kuò)充為二維盒須圖。

16

多視圖協(xié)調(diào)關(guān)聯(lián)

多視圖協(xié)調(diào)關(guān)聯(lián)將不同類型的繪圖組合起來,每個繪圖單元可以展現(xiàn)數(shù)據(jù)某方面的屬

性,并且通常允許用戶進(jìn)行交互分析,提升用戶對數(shù)據(jù)的模式識別能力。

在多視圖協(xié)調(diào)關(guān)聯(lián)應(yīng)用中,“選擇”操作作為一種探索方法,可以是對某個對象和屬性進(jìn)

“取消選擇”的過程,也可以是選擇屬性的子集或?qū)ο蟮淖蛹圆榭疵總€部分之間的關(guān)系

的過程。

4、可視化框架設(shè)計整體思路

、可視化框架的構(gòu)成

數(shù)據(jù)可視化的本質(zhì)是:將數(shù)據(jù)映射到圖形,同時將一些附加信息傳達(dá)給用戶。

、數(shù)據(jù)圖形映射的路程

數(shù)可視化從原始數(shù)據(jù)映射到所需要的圖形需要經(jīng)過多個步驟,包括統(tǒng)計分析、預(yù)處理數(shù)據(jù)、

過濾、映射和繪制等。

PPT講解、演示;時間分配:70分鐘。

三.總結(jié)(5分鐘)

本章說明了數(shù)據(jù)可視化的基本特征,在此基礎(chǔ)上,重點(diǎn)闡述了可視化

流程與可視化設(shè)計組件。

17

最后,探討了可視化設(shè)計總體框架和流程。。

作業(yè)布置

教學(xué)反思

18

教學(xué)單元教案

主題任務(wù)4數(shù)據(jù)可視化的常用方法序號4

課時2教學(xué)手段多媒體、板書、實(shí)訓(xùn)室

教學(xué)方法講授法、演示法、案例法

教學(xué)課型□理論□實(shí)訓(xùn)√一體化□(其它)

能力目標(biāo):掌握可視化分析常用的方法及可視化設(shè)計優(yōu)化。。

知識目標(biāo):理解統(tǒng)計圖表可視化方法和圖可視化方法;掌握可

教學(xué)目標(biāo)

視化分析常用的方法及可視化設(shè)計優(yōu)化。

素質(zhì)目標(biāo):接受新知識、自主學(xué)習(xí)的能力。

理解統(tǒng)計圖表可視化方法和圖可視化方法;掌握可視化分析常

教學(xué)重點(diǎn)

用的方法及可視化設(shè)計優(yōu)化。

教學(xué)難點(diǎn)掌握可視化分析常用的方法及可視化設(shè)計優(yōu)化。

教學(xué)過程設(shè)計

一.教學(xué)內(nèi)容

1、課程導(dǎo)入

可視化有許多方法,這些方法在項目中運(yùn)用得也很廣泛。接下來讓我們

一起來看看都有哪些方法。

教師活動:PPT講解、演示;時間分配:5分鐘。

2、統(tǒng)計圖表可視化方法

(1)柱狀圖

柱狀圖(barchart):是一種以長方形的長度為變量的表達(dá)圖形的統(tǒng)計報告圖,由一系列

高度不等的縱向條紋表示數(shù)據(jù)分布的情況,用來比較兩個或兩個以上的價值(不同視覺

或者不同條件),只有一個變量,通常用于較小的數(shù)據(jù)集分析。

適用場景:柱狀圖適用于二維數(shù)據(jù)集,能夠清晰地比較兩個維度的數(shù)據(jù)。由于視覺對高

度之間的差異感知較敏感,柱狀圖利用柱子之間的高度來反映數(shù)據(jù)之間的差異。

優(yōu)勢:柱狀圖利用柱子的高度,反映數(shù)據(jù)的差異,肉眼對高度差異很敏感。

劣勢:柱狀圖的局限在于只適用中小規(guī)模的數(shù)據(jù)集。

(2)二維柱狀圖

傳統(tǒng)柱狀圖:一般用于表示客觀事物的絕對數(shù)量的比較或者變化規(guī)律,用于顯示一段時

間內(nèi)數(shù)據(jù)的變化,或者顯示不同項目之間的對比,分為:二維簇狀柱形圖、二維堆積柱

形圖、二維百分比堆積柱形圖。如下圖所示:

19

(3)三維柱狀圖

三維柱形圖:這種圖表類型沿著兩個數(shù)軸比較數(shù)據(jù)點(diǎn),數(shù)據(jù)點(diǎn)指在圖表中繪制的單個值,這些

值由條形、柱形、折線、餅圖和其他被稱為數(shù)據(jù)標(biāo)記的圖形表示。相同顏色的數(shù)據(jù)標(biāo)記組成一個數(shù)

據(jù)系列。

三維簇狀柱形圖、三維堆積柱形圖、三維百分比堆積柱形圖分別如下圖所示:

(4)條狀圖

排列在工作表的列或行中的數(shù)據(jù)可以繪制到條形圖中。條形圖顯示各個項目之間的比較情

況。

描繪條形圖要素:組數(shù)、組寬度、組限。

適用場景:軸標(biāo)簽過長、顯示的數(shù)值是持續(xù)型的。

(5)折線圖

適用場景:適用于二維大數(shù)據(jù)集,尤其是那些趨勢比單個數(shù)據(jù)點(diǎn)更重要的場合。同時,

它還適用于多個二維數(shù)據(jù)集之間的比較,當(dāng)需要體現(xiàn)許多數(shù)據(jù)點(diǎn)的順序時,能夠按時間

20

(年、月和日)或類別顯示趨勢,如下圖:

(6)餅圖

適用場景:一般適用于表述一維數(shù)據(jù)(行和列)的可視,尤其是能夠直觀反映數(shù)據(jù)序列

中各項的大小、總和和相互之間的比例大小,圖表中的每個數(shù)據(jù)系列具有唯一的顏色或

圖案并且在圖表的圖例中表示。

使用數(shù)據(jù):反映某個部分占整體的比例,用于對比幾個數(shù)據(jù)在其形成的總和中所占百分

比值時最有用。如果想表示多個系列的數(shù)據(jù),則可以用環(huán)形圖。

優(yōu)勢:餅圖能夠直觀地反映某個部分占整體的比例。

劣勢:餅圖的局限性在于要求僅有一個要繪制的數(shù)據(jù)系列,同時繪制的數(shù)值沒有負(fù)值,

同時幾乎沒有零值。

(7)散點(diǎn)圖

適用場景:適用于三維數(shù)據(jù)集,但其中只有兩維需要比較。

重要作用:可以用來繪制函數(shù)曲線,從簡單的三角函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)到更復(fù)雜

的混合型函數(shù),都可以利用它快速準(zhǔn)確地繪制出曲線,所以常用于教學(xué)和科學(xué)計算中。

21

(8)氣泡圖

氣泡圖:是散點(diǎn)圖的一種變形,通過每個點(diǎn)的面積大小,來反映第三維所表達(dá)的信息。

區(qū)別:氣泡圖與散點(diǎn)圖相似,不同的是,氣泡圖允許在圖表中額外加入一個表示大小的變

量。

(9)雷達(dá)圖

雷達(dá)圖(RadarChart):又可稱為戴布拉圖、蜘蛛網(wǎng)圖(SpiderChart),是財務(wù)分析報表的一

種。

適用場景:適用于多維數(shù)據(jù)(四維以上),且每個維度必須可以排序。

局限:數(shù)據(jù)點(diǎn)最多6個。

3、圖可視化方法

圖是表達(dá)數(shù)據(jù)最靈活、最強(qiáng)大的方式之一,能夠?qū)?shù)據(jù)進(jìn)行優(yōu)雅變換,“無圖無真相”“一圖

勝千言”正是對圖可視化方法最好的歸納。圖可視化能夠簡介地表述復(fù)雜的關(guān)系、吸引讀者的注意

力、有助于讀者理解和回憶等特點(diǎn)。

近年來,圖論方法在數(shù)據(jù)可視化,尤其是社會網(wǎng)絡(luò)類數(shù)據(jù)的可視化中得到廣泛應(yīng)用。

22

(1)圖的類型

圖的類型>>關(guān)系

圖可視化最重要的作用之一,便是能夠表達(dá)關(guān)系。這些關(guān)系組成了已經(jīng)定義的世界或系

統(tǒng)。

圖能夠使得我們以一種非常容易理解的方式來描述和表達(dá)世界。

圖的類型>>分層

對于分層數(shù)據(jù)中獲取信息,圖也是一個很好的選擇。分層圖常被稱樹。樹有一個根父節(jié)

點(diǎn),其鏈接分支到第二個節(jié)點(diǎn),第二級節(jié)點(diǎn)還可能再次分支,以此類推,直到到達(dá)沒有子節(jié)

點(diǎn)的葉子節(jié)點(diǎn),根節(jié)點(diǎn)的每個后代節(jié)點(diǎn)都只有一個父節(jié)點(diǎn)。

分層中常見的圖形是樹。樹是一種非線性的數(shù)據(jù)結(jié)構(gòu),用樹能很好地描述有分支和層次

特性的數(shù)據(jù)集合。

樹形結(jié)構(gòu)在現(xiàn)實(shí)生活中廣泛存在,如社會組織機(jī)構(gòu)的組織關(guān)系圖就可以用樹形結(jié)構(gòu)來表

示。

樹在計算機(jī)領(lǐng)域中也有廣泛應(yīng)用,如在編譯系統(tǒng)中,用樹表示源程序的語法結(jié)構(gòu)

(2)圖論可視化

圖論(GraphTheory)是數(shù)學(xué)的一個分支。它以圖為研究對象。圖論中的圖是由若干給定的

點(diǎn)及連接兩點(diǎn)的線所構(gòu)成的圖形,這種圖形通常用來描述某些事物之間的某種特定關(guān)系,用點(diǎn)代表

事物,用連接兩點(diǎn)的線表示相應(yīng)兩個事物間具有這種關(guān)系。

(3)思維導(dǎo)圖

思維導(dǎo)圖(MindMap),即借助圖表來分析問題、理清思路。常見的思維圖有八種:Circle

Map圓圈圖、TreeMap樹狀圖、BubbleMap氣泡圖、DoubleBubbleMap雙重氣泡圖、

FlowMap流程圖、Multi-flowMap多重流程圖、BraceMap括號圖,和BridgeMap橋型圖。

思維導(dǎo)圖>>圓圈圖

定義一件事,主要用于把一個主題展開來,聯(lián)想或描述細(xì)節(jié)。它有兩個圓圈,里面的小圈

是主題,而外面的大圈里放的是和這個主題有關(guān)的細(xì)節(jié)或特征。其基本形狀如下圖所示:

23

思維導(dǎo)圖>>圓圈圖

氣泡圖描述事物性質(zhì)和特征。國外很多幼兒園和小學(xué)都在用氣泡圖幫助孩子學(xué)習(xí)知識、描

述事物。最基本的氣泡圖如下圖所示:

圓圈圖強(qiáng)調(diào)的是一個概念的具體展開,而氣泡圖更加側(cè)重于對一個概念的特征描述。例如,用

氣泡圖分析一只鷹有哪些特征。在實(shí)際分析問題的時候,不必太糾結(jié)到底該用哪種圖,怎么直觀怎

么來。

4、可視化分析方法常用算法

(1)沙盒分析法

沙盒分析的關(guān)鍵能力主要有:認(rèn)知、自動處理模型范本、想法的解讀。運(yùn)用網(wǎng)絡(luò)服務(wù)界

面和協(xié)議,整合了高級計算機(jī)語言功能。沙盒的組成如下圖所示:

實(shí)時數(shù)指令識

模型處理別

據(jù)模型細(xì)節(jié)處理

聚類工程界實(shí)體

輸入設(shè)備捕

關(guān)聯(lián)分析

分析方法

安排模式處理

參考

設(shè)計行為處理行為仿真

注釋

數(shù)據(jù)收集導(dǎo)航仿真引擎

圖表處理

最優(yōu)化渲染平臺

優(yōu)點(diǎn):識別大量的人為認(rèn)知,減少搜索時間,識別模式較強(qiáng),對人類社會行為的可視分析十

24

分有效。

(2)認(rèn)知作業(yè)分析法

認(rèn)知作業(yè)分析法是研究個人或者團(tuán)隊在特殊環(huán)境下的心理過程、行為和判斷的方法,融

合了計算機(jī)技術(shù),有效地進(jìn)行人類抉擇。

認(rèn)知作業(yè)分析:人們對完成特定任務(wù)的思維邏輯過程信息,這些信息包括如何去處理所獲

取的信息和下一步該做什么。

認(rèn)知作業(yè)分析著重研究認(rèn)知過程,而不是完成任務(wù)的機(jī)理。

優(yōu)點(diǎn):不受其他事物的影響,反應(yīng)速度快,可應(yīng)用于決策判斷,應(yīng)急疏散。

(3)順序模式法

順序模式:用來發(fā)現(xiàn)離散事件同時發(fā)生的概率。隨著計算機(jī)的發(fā)展,人們能處理更龐大

的數(shù)據(jù)而且獲得大量的順序模式,每個順序模式包含一個最小概率,其意義為這個模式發(fā)生

的百分比。

優(yōu)點(diǎn):快速地顯示數(shù)據(jù)的結(jié)構(gòu)與分布、顯示單個事件的發(fā)生頻率、準(zhǔn)確性高,可應(yīng)用于文

本挖掘。

(4)協(xié)同多視圖法

多視圖可用多種形式的視圖,如促進(jìn)信息加工中的抽象視圖、分層和時間序列的視圖。

在可視分析中實(shí)現(xiàn)協(xié)同并不容易,因?yàn)闆]有正式的協(xié)同規(guī)則,有的規(guī)則也不是萬能的,需要

具有一定的針對性才能體現(xiàn)協(xié)同多視圖法的效果。協(xié)同多視圖法的基本原理如下圖所示:

改善可視化渲染轉(zhuǎn)換

抽象可

原始數(shù)據(jù)子集圖像

視對象

通知

歸納,可視化分析算圖像用

事件過濾技術(shù)法戶界面

5、可視化分析研究的特點(diǎn)

可視分析學(xué)的根本原理是將可視化作為半自動分析過程的媒介,人類和機(jī)器合作,利用兩者各

自特有的能力,獲得最有效的結(jié)果。

可視分析學(xué)從6個基本方面放大了人類感知能力:

1.增加感知源,如通過可視化源來擴(kuò)展人類工作記憶。

2.減少搜索,例如在小空間中表示大量數(shù)據(jù)。

3.增強(qiáng)模式認(rèn)知,如在空間中展示具備時間序列特征的信息。

4.支持關(guān)系可感知的簡易推理。

5.對大量潛在事件的感知監(jiān)測。

6.提供可操作的介質(zhì),與靜態(tài)圖不同,能允許探索參數(shù)值的表示空間。

可視化分析學(xué)將形成分析過程和模型的建構(gòu)式評價、修正和迅速提高,最終改善知識和決策,將

25

科技應(yīng)用到計算和可視化,分析報告和技術(shù)轉(zhuǎn)移上,促進(jìn)分析推理、數(shù)據(jù)交互、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)表

示的發(fā)展。

6、可視化分析的運(yùn)用案例

(1)模型和決策支持

回歸模型在許多應(yīng)用領(lǐng)域中扮演著重要角色,典型的回歸模型構(gòu)建過程中輸入變量的特

征子集選取受到限制,其他局限還存在于局部結(jié)構(gòu)、轉(zhuǎn)換以及變量間交互的識別。

基于模型驅(qū)動黑色系期貨日K線數(shù)據(jù)驗(yàn)證如下圖:

(2)圖像和視頻數(shù)據(jù)處理

圖像和視頻數(shù)據(jù)是繼文本數(shù)據(jù)之后的又一大數(shù)據(jù)類型,可視分析學(xué)在這兩種數(shù)據(jù)分析上同樣能

發(fā)揮優(yōu)勢。

雙目生理性眼顫的互抑制可視化如下圖所示:

(3)社會媒體數(shù)據(jù)分析

可視分析學(xué)還被用至社會媒體數(shù)據(jù)分析、社會網(wǎng)絡(luò)分析、文檔重建系統(tǒng)和人類地形分析等領(lǐng)域

社會媒體數(shù)據(jù)可視化分析如下圖所示:

26

主成分分析(PrincipalComponentAnalysis,PCA)法:一種利用線性映射來進(jìn)行數(shù)據(jù)降維的方

法,同時去除數(shù)據(jù)的相關(guān)性,以最大限度保持原始數(shù)據(jù)的方差信息,從而進(jìn)行有效的特征提取。

主成分分析是通過一個或幾個綜合性較好的指標(biāo)來概括多個變量具有相關(guān)性的指標(biāo),即主成

分,這些指標(biāo)希望能互相獨(dú)立地代表某一方面的性質(zhì),指標(biāo)要可靠、真實(shí),能充分反映個體間的變

異。

優(yōu)點(diǎn):將多變量概括為少變量并且損失少量信息,對數(shù)據(jù)起到了降維的作用,為后續(xù)的計算

減少工作量;缺點(diǎn):有時候新變量的符號有正有負(fù)時物理意義難以弄清楚。

時間復(fù)雜度:O(n^2m^2),n和m分別為行數(shù)、列數(shù),即樣本和變量數(shù)。

因子分析:從假定的因子模型出發(fā),把復(fù)雜數(shù)據(jù)視為由公共因子、誤差和特殊因子構(gòu)成。

使用了主成分分析的方法但其關(guān)于特征值的計算是以相關(guān)矩陣作為出發(fā),把每個變量置于同一度

量,使特征值相對均勻,并將主成分轉(zhuǎn)換成因子,還把特征向量正規(guī)化使之長度為1。

層次分析法:能對大量的非定量的模糊數(shù)據(jù)進(jìn)行處理,如良好、優(yōu)秀、一般等,層次分析法用

定量的方法去描述這些數(shù)據(jù),將定性和定量相結(jié)合,分層次分析,用數(shù)學(xué)的方法確定每一層中所有

元素的重要性的權(quán)值,最后分析排序結(jié)果,解決問題。

層次分析的步驟為:

1.構(gòu)造判斷矩陣

2.計算層次單排序

3.計算各層元素的組合權(quán)重

4.一致性檢驗(yàn)

7、可視化方法的選擇

在可視化圖表工具的表現(xiàn)形式方面,圖表類型表現(xiàn)的更加多樣化,豐富化。除了傳統(tǒng)的餅圖、

柱狀圖、折線圖等常見圖形,還有氣泡圖、面積圖、省份地圖、詞云、瀑布圖、漏斗圖等酷炫圖

表,甚至還有GIS地圖。這些種類繁多的圖形能滿足不同的展示和分析需求。下圖總結(jié)了根據(jù)需求

分析可采用的統(tǒng)計可視化方法。

27

三.總結(jié)(5分鐘)

1、數(shù)據(jù)可視化的最重要目的和最高追求是將簡單、易于理解、快速易懂的可視化展現(xiàn)形式,

表示復(fù)雜的數(shù)據(jù)關(guān)系。

2、圖可視化能夠簡潔地表述復(fù)雜的關(guān)系、吸引讀者的注意力、有助于讀者理解和回憶等特

點(diǎn),因此勝過千言萬語。

3、可視分析方法有沙盒分析方法、認(rèn)知作業(yè)分析法、順序模式法、協(xié)同多視圖法。

4、可視化分析學(xué)從6個基本方面放大了人類的感知能力,它的產(chǎn)出物是可以供分析師使用的

分析系統(tǒng)。

作業(yè)布置

教學(xué)反思

28

教學(xué)單元教案

主題任務(wù)5可視化交互序號5

課時2教學(xué)手段多媒體、板書、實(shí)訓(xùn)室

教學(xué)方法講授法、演示法、案例法

教學(xué)課型□理論□實(shí)訓(xùn)√一體化□(其它)

能力目標(biāo):掌握可視化交互方法分類、空間和模型。

教學(xué)目標(biāo)知識目標(biāo):掌握可視化交互方法分類、空間和模型。

素質(zhì)目標(biāo):接受新知識、自主學(xué)習(xí)的能力。

教學(xué)重點(diǎn)掌握可視化交互方法分類、空間和模型。

教學(xué)難點(diǎn)掌握可視化交互方法分類、空間和模型。

教學(xué)過程設(shè)計備注

一.導(dǎo)入

教師活動:提問;學(xué)生活動:思考回答;時間分配:5分鐘。

二.教學(xué)內(nèi)容

1、可視化交互方法分類

可視化交互研究屬于可視化與人機(jī)交互的交叉領(lǐng)域。

交互方法五花八門,而一個良好的交互方法通常有一個特定的視圖設(shè)計,這大大提高了可

視化顯示信息,支持研究和假設(shè)驗(yàn)證的能力。

數(shù)據(jù)可視化系統(tǒng)中的兩個核心要素——視覺呈現(xiàn)和交互是密不可分的,其交互性技術(shù)的功

29

能是促進(jìn)用戶與系統(tǒng)之間的信息交流,主要分為5類:平移+縮放技術(shù)、動態(tài)過濾技術(shù)、概覽

+細(xì)節(jié)技術(shù)、焦點(diǎn)+上下文技術(shù)、多視圖關(guān)聯(lián)技術(shù)。

下面開始介紹這五類方法:

(1)平移+縮放技術(shù)

可縮放用戶界面(ZoomableUserInterfaces,ZUI)最早源于對PAD及PAD++的研

究;

是一種使用空間和尺度組織信息,將平移(Panning)與縮放(Zooming)作為主要交互技

術(shù)的圖形用戶界面。

平移與縮放操作由鼠標(biāo)與鍵盤作為主要交互設(shè)備進(jìn)行控制,平移用于改變信息空間的位

置,縮放用于改變信息空間的比例。鼠標(biāo)、鍵盤的輸入與平移、縮放的輸出的關(guān)系分為線性相關(guān)

與非線性相關(guān)兩種。

非線性平移與縮放技術(shù)主要包括以下三種形式:

1.目標(biāo)導(dǎo)向的縮放

2.平移與縮放相結(jié)合

3.自動縮放

(2)動態(tài)過濾技術(shù)

Shneiderman對動態(tài)過濾的定義是:動態(tài)過濾描述了用戶對于可視化查詢參數(shù)的交互控

制,通過交互控制對數(shù)據(jù)庫的搜索結(jié)果進(jìn)行快速(每100ms刷新)、動態(tài)、可視化的顯示。

使用動態(tài)過濾的用戶界面稱為動態(tài)過濾用戶界面,通過可視化的信息呈現(xiàn),并且基于直接操縱原

理提供用戶動態(tài)交互控制,可以更加高效地探索、理解大規(guī)模的數(shù)據(jù)空間。

(3)概覽+細(xì)節(jié)技術(shù)

概覽+細(xì)節(jié)(Overview+Detail)的基本思想:在資源有限的條件下同時顯示整體與細(xì)節(jié);

概覽:指不需要做任何操作,在一個視圖上可以集中顯示所有的對象;

細(xì)節(jié):是突出用戶需要的重點(diǎn)部分進(jìn)行展示;

概覽+細(xì)節(jié)的用戶交互模式:指既顯示全局概覽,又將細(xì)節(jié)部分在相鄰視圖上或者本視圖的側(cè)面進(jìn)

行展示,其好處在于非常符合用戶探索數(shù)據(jù)的行為方式。

(4)焦點(diǎn)+上下文技術(shù)

焦點(diǎn)+上下文技術(shù)是在同一視圖上提供選中的數(shù)據(jù)子集的上下文信息,致力于顯示用戶興趣焦

點(diǎn)部分的細(xì)節(jié)信息,同時展示焦點(diǎn)與周邊的關(guān)系關(guān)聯(lián),即整合了當(dāng)前聚焦點(diǎn)的細(xì)節(jié)信息與全局部

分上下文信息。

焦點(diǎn)+上下文技術(shù)的一個研究動機(jī)源于Bertin、Larkin和Simon的以下發(fā)現(xiàn):當(dāng)信息空間被

劃分為兩個顯示區(qū)域時,在探索信息時用戶注意力與工作記憶的頻繁切換會導(dǎo)致效率的降低,因

此焦點(diǎn)+上下文技術(shù)能夠有效降低人的認(rèn)知負(fù)擔(dān)。

另一個研究動機(jī)源于Furnas提出的魚眼視圖的概念,將用戶關(guān)注的焦點(diǎn)信息與概覽視圖上下文同

時顯示在一個顯示區(qū)內(nèi),通過建立關(guān)注度函數(shù)對信息空間各個對象進(jìn)行變形處理,將焦點(diǎn)信息放

大,焦點(diǎn)周圍的上下文信息逐漸縮小。通過用戶對關(guān)注度的定義,能夠有效提高對視圖信息搜索

的效率。

30

(5)多視圖關(guān)聯(lián)協(xié)調(diào)技術(shù)

通過多個具有語義關(guān)聯(lián)的視圖,為目標(biāo)概念實(shí)體的分析提供具有語義關(guān)聯(lián)的多角度支持,此

種技術(shù)稱為多視圖關(guān)聯(lián)協(xié)調(diào)技術(shù)。

使用此種技術(shù)的用戶界面稱為關(guān)聯(lián)多視圖用戶界面,能夠改善用戶對可視化信息的認(rèn)知。

Visage是一個支持多視圖關(guān)聯(lián)協(xié)調(diào)的信息可視化系統(tǒng),通過將圖形元素在視圖間直接進(jìn)行拖放來

對視圖進(jìn)行刷新,強(qiáng)調(diào)對于用戶界面中任何粒度的圖形元素所表達(dá)信息的直接操控。

2、可視化交互空間

(1)可視化交互空間查詢

從信息表達(dá)的角度來看,交互可視化空間查詢是通過可視化手段,在可視化界面上集中

展示空間查詢的要素及相互關(guān)系。用戶通過對界面要素的選取、配置及調(diào)整等交互操作,實(shí)現(xiàn)空

間實(shí)體和屬性信息的快速檢索??梢暬换ソ缑嬷饕樵円韵乱兀?/p>

1.空間關(guān)系:空間實(shí)體間的各種關(guān)聯(lián)關(guān)系,如拓?fù)?、距離、方位和順序等關(guān)系

2.空間分布:空間對象間的位置分布及分布模式等

3.空間查詢:通過布爾元運(yùn)算符將可視化空間查詢邏輯表達(dá)式連接,組成結(jié)構(gòu)化查詢語句

(SQL)或面向空間數(shù)據(jù)的擴(kuò)展結(jié)構(gòu)化語言

4.空間查詢結(jié)果:可視化交互查詢結(jié)果有多種形式,按照查詢的方式可分成3種,具體如下:

對于空間→屬性查詢,查詢結(jié)果為滿足查詢條件的屬性信息,通常以屬性列表的形式反饋給

用戶;

對于屬性→空間查詢,查詢結(jié)果為滿足查詢條件的空間對象集合,通常以高亮來顯示地理圖

層中匹配的點(diǎn)、線、弧和多邊形實(shí)體(矢量結(jié)構(gòu))集合或像素(柵格結(jié)構(gòu))集合;

對于空間屬性聯(lián)合查詢,查詢結(jié)果既可以是滿足條件的屬性列表,也可以是圖層中滿足條件

的空間要素集合,或者是上述兩者的組合。

(2)可視化交互空間分析

空間分析是一種基于地理對象位置和形態(tài)特征的空間數(shù)據(jù)分析技術(shù),旨在提取和傳

輸空間信息,是GIS的核心功能,主要用于區(qū)別一般信息系統(tǒng)的功能特征。下圖給出了一個交互

式可視化空間分析架構(gòu):

31

具體過程如下:

1.連接數(shù)據(jù)源。用戶通過可視化交互界面進(jìn)入空間分析系統(tǒng),采用數(shù)據(jù)驅(qū)動模塊交互地配

置數(shù)據(jù)源并進(jìn)行連接,將空間位置、拓?fù)潢P(guān)系或?qū)傩孕畔⒊尸F(xiàn)在圖層或圖形用戶接口(GUI)上。

2.選擇空間分析實(shí)體。用戶通過觀察,可以采用多種交互方法進(jìn)行瀏覽、查詢或采樣,選

中的實(shí)體將作為后續(xù)分析的對象。

3.對對象進(jìn)行操作。操作是將選中的實(shí)體轉(zhuǎn)換為更有意義的形式,以進(jìn)一步提取隱含的信

息,包括分割、聚合、疊加和空間插值等轉(zhuǎn)換操作,如生成一個多邊形要素的緩沖區(qū)、將兩個多

邊形要素進(jìn)行合并,操作的過程始終保持空間數(shù)據(jù)的變換與屬性數(shù)據(jù)同步。變換的結(jié)果輸出到可

視化交互界面以反饋給用戶。

對對象進(jìn)行探索和確認(rèn)分析。探索分析是一種數(shù)據(jù)驅(qū)動的分析方法,它不預(yù)設(shè)數(shù)據(jù)的規(guī)律和特

征,而是試探性地、一步一步地完成分析過程,逐步理解數(shù)據(jù)并找到規(guī)律。

(3)可視化交互空間分類

交互操作符有助于在交互過程中澄清參數(shù)的作用及在不同空間的語義。本節(jié)主要介紹幾個不

同類別相互作用的空間。

1.屏幕空間(像素)

在屏幕空間中的導(dǎo)航通常包括一些動作,如平移、縮放和旋轉(zhuǎn)。

2.數(shù)據(jù)值空間(多元數(shù)據(jù)值)

數(shù)據(jù)值空間是過濾的最明顯的空間。

3.數(shù)據(jù)結(jié)構(gòu)空間(數(shù)據(jù)結(jié)構(gòu)的組成)

數(shù)據(jù)可以有很多種方式構(gòu)造,如列表、表格、網(wǎng)格、層次結(jié)構(gòu)和圖形。對于每一個結(jié)構(gòu),可

以設(shè)計互動機(jī)制,以指示那些部分的結(jié)構(gòu)可以被操作,以及如何展示這種操作。

4.屬性空間(圖形實(shí)體組件)

屬性空間導(dǎo)航類似于數(shù)據(jù)值空間。

5.對象空間(三維曲面)

在這些顯示種,數(shù)據(jù)映射到一個幾何對象,該對象(或其投影)可以發(fā)生相互作用和轉(zhuǎn)換。

6.可視化結(jié)構(gòu)空間

可視化結(jié)構(gòu)空間由相對獨(dú)立的值、屬性和數(shù)據(jù)結(jié)構(gòu)組成。

3、可視化交互模型

(1)可視化分析方法

信息可視化有很多方向,本節(jié)主要討論兩個方向,即多媒體/富媒體數(shù)據(jù)的可視化交互和

數(shù)據(jù)庫及數(shù)據(jù)倉庫的可視化交互。

在本節(jié)介紹的5種模型中,交互式信息可視化的用戶界面模型(IIVM)、支持信息多面體可

視分析界面模型(IMFA)屬于多媒體/富媒體數(shù)據(jù)的可視化交互模型,交互式可視化的關(guān)聯(lián)

規(guī)則屬于數(shù)據(jù)庫及數(shù)據(jù)倉庫的可視化交互模型。

(2)交互式信息可視化的用戶界面模型

由Puerta提出的基于模型的界面開發(fā)通用框架中的界面模型,能夠有效地描述具有個性化

用戶界面的交互式信息可視化系統(tǒng)。

32

在基于界面模型的軟件開發(fā)方法中,完備的用戶界面模型主要描述6個組成元素,即任務(wù)、

用戶、領(lǐng)域?qū)ο?、表征、對話以及映射關(guān)系。

其中任務(wù)、用戶及領(lǐng)域?qū)ο髮儆诮缑婺P偷某橄蠼M成元素,表征、對話屬于界面模型的具體

組成元素,具體組成元素構(gòu)成了可運(yùn)行的用戶界面,界面模型驅(qū)動的軟件開發(fā)即界面模型中的抽

象組成元素與具體組成元素之間的映射問題。

交互式信息可視化的用戶界面模型(IIVM)圖如下圖所示:

IIVM組成元素包括領(lǐng)域信息模型、可視化表征模型、任務(wù)模型、用戶模型、對話模型等,其

中:

1.領(lǐng)域信息模型(IM)

由領(lǐng)域信息概念實(shí)體集合組成。每個信息概念實(shí)體作為一個信息多面體,由具有關(guān)聯(lián)關(guān)

系的信息側(cè)面組成。每個信息側(cè)面由數(shù)據(jù)節(jié)點(diǎn)集合及數(shù)據(jù)節(jié)點(diǎn)關(guān)聯(lián)集合組成,對層次、網(wǎng)絡(luò)、多

維等數(shù)據(jù)進(jìn)行統(tǒng)一描述

2.可視化表征模型(VM)

對界面中三種類型的可視化表征元素進(jìn)行描述,主要包括可視結(jié)構(gòu)、視圖容器及關(guān)聯(lián)、

交互控件。將Card等定義的可視結(jié)構(gòu)中的圖形標(biāo)記分為圖形節(jié)點(diǎn)與圖形節(jié)點(diǎn)關(guān)聯(lián)兩種類型。根據(jù)

Bertin提出的視網(wǎng)膜變量,取常用的形狀、顏色、大小、方向、紋理等作為圖形節(jié)點(diǎn)的視覺屬性

3.任務(wù)模型(TM)

對子任務(wù)集合、子任務(wù)的原子任務(wù)組成及序列進(jìn)行描述,用于對各種信息可視化任務(wù)描

4.用戶模型(UM)

用戶模型對領(lǐng)域應(yīng)用中的用戶標(biāo)識及角色分類進(jìn)行描述

5.對話模型(DM)

對話模型對物理交互設(shè)備的交互行為進(jìn)行描述

映射關(guān)系描述包括UM-IM映射、IM-TM映射、IM-VM映射、TM-VM映射、TM-

DM映射、VM-DM映射等,詳細(xì)介紹如下:

映射是描述用戶模型與信息模型的映射fUI,是不同用戶角色可訪問的信息概念實(shí)體集

合。

映射是描述信息模型與任務(wù)模型的映射fIT,是各個信息側(cè)面對應(yīng)的交互式信息可視化

任務(wù)集合。

映射是描述信息模型與可視化表征模型的映射,共包括3個子映射fIV1、fIV2及

33

fIV3。

映射是描述任務(wù)模型與可視化表征模型的映射fTV,是任務(wù)模型中的原子任務(wù)與可視化

表征模型中的可視化表征元素類型(可視結(jié)構(gòu)圖形節(jié)點(diǎn)、視圖容器、動態(tài)過濾條、視覺屬性圖例

等)的映射關(guān)系。

映射是描述任務(wù)模型與對話模型的映射fTD,是各個原子任務(wù)對應(yīng)的物理交互設(shè)備的交

互行為。

映射是描述可視化表征模型與對話模型的映射fVD,是可視表征中的圖形節(jié)點(diǎn)、視圖容

器、動態(tài)過濾條、視覺屬性圖例等可視化表征元素可進(jìn)行的交互行為。

(3)支持信息多面體可視化分析界面模型

IMFA:包括多面體數(shù)據(jù)模型、可視表征模型和交互控制模型3個部分。

多面體數(shù)據(jù)模型:信息側(cè)面以及信息側(cè)面間關(guān)聯(lián)的集合。

模型是視圖的集合,包括一組可視結(jié)構(gòu)和視圖關(guān)聯(lián)集合。視圖定義了視圖中的信息側(cè)面和可

視結(jié)構(gòu)。

模型包括:直接操縱類任務(wù)控制集合、間接操縱類任務(wù)控制集合,這兩類交互控制集合由對

應(yīng)的交互控制組成。

(4)交互式可視化的關(guān)聯(lián)規(guī)則挖掘模型

通過可視化的方式將關(guān)聯(lián)規(guī)則算法產(chǎn)生的中間結(jié)果展示出來,用戶采用交互手段及結(jié)合自身

的領(lǐng)域知識和挖掘目標(biāo)聚焦下一步的搜索空間,驅(qū)動算法前進(jìn),直到找到自己感興趣的關(guān)聯(lián)規(guī)則

為止,即交互可視化關(guān)聯(lián)規(guī)則。

基于關(guān)聯(lián)規(guī)則理想的交互式可視化應(yīng)至少具備以下兩個原則與要求:

1.挖掘過程的“黑盒”應(yīng)該被打開,挖掘的中間結(jié)果有序的用圖形化的方法展示出來,能夠

給予用戶充分的信息支持。

2.用戶結(jié)合系統(tǒng)提供的信息、自身的領(lǐng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論