Tableau數(shù)據(jù)分析與可視化(微課版)PPT完整全套教學(xué)課件_第1頁
Tableau數(shù)據(jù)分析與可視化(微課版)PPT完整全套教學(xué)課件_第2頁
Tableau數(shù)據(jù)分析與可視化(微課版)PPT完整全套教學(xué)課件_第3頁
Tableau數(shù)據(jù)分析與可視化(微課版)PPT完整全套教學(xué)課件_第4頁
Tableau數(shù)據(jù)分析與可視化(微課版)PPT完整全套教學(xué)課件_第5頁
已閱讀5頁,還剩295頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

Tableau數(shù)據(jù)分析

與可視化(微課版)本書目錄第1章Tableau數(shù)據(jù)可視化概述第2章Tableau連接數(shù)據(jù)源第3章Tableau基礎(chǔ)操作第4章Tableau高級操作第5章Tableau數(shù)據(jù)可視化第6章Tableau儀表板和故事第7章連接Hadoop集群第8章Tableau在線服務(wù)器第9章電商行業(yè)案例實(shí)戰(zhàn)第10章客戶價(jià)值畫像實(shí)戰(zhàn)第1章Tableau數(shù)據(jù)可視化概述數(shù)據(jù)可視化是技術(shù)與藝術(shù)的完美結(jié)合,它借助圖形化的手段,清晰有效地傳達(dá)與溝通信息。一方面,數(shù)據(jù)賦予可視化意義;另一方面,可視化增加數(shù)據(jù)的靈性,兩者相輔相成,幫助企業(yè)從信息中提取知識、從知識中收獲價(jià)值。數(shù)據(jù)可視化技術(shù)允許利用圖形、圖像處理、計(jì)算機(jī)視覺以及用戶界面,通過表達(dá)、建模以及對立體、表面、屬性、動畫的顯示,對數(shù)據(jù)加以可視化解釋。Tableau數(shù)據(jù)可視化軟件為用戶在數(shù)據(jù)可視化方面提供了行之有效的方法,重視的人越來越多。本章將詳細(xì)介紹數(shù)據(jù)可視化及其常用軟件,Tableau軟件概況及其基礎(chǔ)知識等。目錄1數(shù)據(jù)可視化常用軟件數(shù)據(jù)可視化概述2Tableau軟件概況3初識Tableau4數(shù)據(jù)可視化的歷史可以追溯到20世紀(jì)50年代計(jì)算機(jī)圖形學(xué)的早期,人們利用計(jì)算機(jī)創(chuàng)建了首批圖表。1987年,一篇題目為《VisualizationinScientificComputing》(即科學(xué)可視化)的論文成為數(shù)據(jù)可視化發(fā)展的里程碑,它強(qiáng)調(diào)基于計(jì)算機(jī)可視化技術(shù)的必要性。隨著數(shù)據(jù)種類和數(shù)量的增長、計(jì)算機(jī)運(yùn)算能力的提升,越來越多高級計(jì)算機(jī)圖形學(xué)技術(shù)與方法應(yīng)用于處理和可視化這些海量數(shù)據(jù)。20世紀(jì)90年代初期,“信息可視化”成為新的研究領(lǐng)域,旨在為抽象異質(zhì)性數(shù)據(jù)集的分析工作提供支持。1.1.1什么是數(shù)據(jù)可視化實(shí)現(xiàn)數(shù)據(jù)可視化的步驟相對比較簡單,主要包括數(shù)據(jù)準(zhǔn)備、可視化設(shè)計(jì)與內(nèi)容分發(fā)三步。1.數(shù)據(jù)準(zhǔn)備2.可視化設(shè)計(jì)3.報(bào)表分發(fā)1.1.2如何實(shí)現(xiàn)數(shù)據(jù)可視化在實(shí)際工作中,如何準(zhǔn)確進(jìn)行數(shù)據(jù)可視化,注意以下幾點(diǎn):1.數(shù)據(jù)分析與數(shù)據(jù)可視化的差異2.正確理解數(shù)據(jù)儀表板3.不要僅僅停留在可視化視圖上1.1.3數(shù)據(jù)可視化注意事項(xiàng)目錄1數(shù)據(jù)可視化常用軟件數(shù)據(jù)可視化概述2Tableau軟件概況3初識Tableau4數(shù)據(jù)可視化的工具可以分為非編程類和編程類,對于大部分商業(yè)數(shù)據(jù)分析師來說,對編程都比較陌生,因此我們這里僅僅介紹一些非編程類的數(shù)據(jù)可視化工具。1.2.1TableauDesktop1.2.2MicrosoftPowerBI1.2.3阿里DataV1.2.4騰訊TCV1.2.5百度Sugar1.2.6帆軟FineBI目錄1數(shù)據(jù)可視化常用軟件數(shù)據(jù)可視化概述2Tableau軟件概況3初識Tableau4Tableau公司成立于2003年,是由斯坦福大學(xué)的三位校友ChristianChabot(首席執(zhí)行官)、ChrisStole(開發(fā)總監(jiān))以及PatHanrahan(首席科學(xué)家)在遠(yuǎn)離硅谷的西雅圖注冊成立的。Tableau可視化工具是一系列軟件的總稱,包括TableauDesktop、TableauPrep、TableauOnline、TableauServer、TableauPublic、TableauMobile、TableauReader等子產(chǎn)品。目錄1數(shù)據(jù)可視化常用軟件數(shù)據(jù)可視化概述2Tableau軟件概況3初識Tableau4截至2020年5月,最新版本是TableauDesktop2020.2,本書是基于該版本而進(jìn)行的介紹。TableauDesktop2020.2的主要新功能如下:(1)較豐富的數(shù)據(jù)源易于構(gòu)建、維護(hù)和分析。(2)關(guān)系可實(shí)現(xiàn)LOD感知分析體驗(yàn)。(3)“數(shù)據(jù)源”頁面(畫布、數(shù)據(jù)網(wǎng)格)、“查看數(shù)據(jù)”和“數(shù)據(jù)”窗格已更新,以支持LOD感知分析體驗(yàn)。(4)上下文感知查詢在需要時(shí)引入相關(guān)數(shù)據(jù)。1.4.1新增功能TableauDesktop的開始頁面主要由“連接”和“打開”2個(gè)區(qū)域組成,可以從中連接數(shù)據(jù)、訪問最近使用的工作簿等。1.4.2“開始”頁面在建立與數(shù)據(jù)的初始連接后,Tableau將引導(dǎo)我們進(jìn)入“數(shù)據(jù)源”頁面,也可以通過在工作簿任意位置單擊“顯示開始頁面”按鈕返回開始頁面,重新連接數(shù)據(jù)源。“數(shù)據(jù)源”頁面通常由3個(gè)主要區(qū)域組成:左側(cè)窗格、畫布和網(wǎng)格。1.4.3“數(shù)據(jù)源”頁面數(shù)據(jù)源中的所有字段都具有一種數(shù)據(jù)類型。數(shù)據(jù)類型反映了該字段中存儲信息的種類,如整數(shù)、日期和字符串。字段的數(shù)據(jù)類型在“數(shù)據(jù)”窗格中由圖標(biāo)標(biāo)識。TableauDesktop的主要數(shù)據(jù)類型。1.4.4數(shù)據(jù)類型及轉(zhuǎn)換運(yùn)算符用于執(zhí)行程序代碼運(yùn)算,會針對一個(gè)以上操作數(shù)項(xiàng)目進(jìn)行運(yùn)算。例如,2+3的操作數(shù)是2和3,運(yùn)算符是“+”。Tableau支持的運(yùn)算符有算術(shù)運(yùn)算符、邏輯運(yùn)算符、比較運(yùn)算符等。所有運(yùn)算符都按特定順序計(jì)算,如2*1+2等于4而不等于6,因?yàn)?運(yùn)算符始終在+運(yùn)算符之前計(jì)算。表1-1顯示了計(jì)算運(yùn)算符的順序,第一行具有最高優(yōu)先級,同一行中的運(yùn)算符具有相同優(yōu)先級,如果兩個(gè)運(yùn)算符具有相同優(yōu)先級,則按照算式從左向右進(jìn)行計(jì)算。1.4.5運(yùn)算符及優(yōu)先級優(yōu)先級運(yùn)算符優(yōu)先級運(yùn)算符1–(求反)5==、>、<、>=、<=、!=2^(乘方)6NOT3*、/、%7AND4+、–8OR數(shù)據(jù)可視化分析結(jié)束,我們可以使用多種不同的Tableau專用文件類型保存文件,主要有工作簿、打包工作簿、數(shù)據(jù)提取、數(shù)據(jù)源、打包數(shù)據(jù)源和書簽等。工作簿(.twb):Tableau工作簿文件具有.twb文件擴(kuò)展名,工作簿中含有一個(gè)或多個(gè)工作表,有零個(gè)或多個(gè)儀表板和故事。打包工作簿(.twbx):Tableau打包工作簿具有.twbx文件擴(kuò)展名,打包工作簿是一個(gè)zip文件,包含一個(gè)工作簿以及任何提供支持的本地文件數(shù)據(jù)源和背景圖像,適合與不能訪問該數(shù)據(jù)的其他人共享。1.4.6文件類型第2章Tableau連接數(shù)據(jù)源在創(chuàng)建數(shù)據(jù)視圖進(jìn)行可視化分析之前,首先需要將Tableau連接到數(shù)據(jù)源。本章將介紹TableauDesktop支持連接到的主要數(shù)據(jù)源,例如,存儲在Excel表格或文本文件中的數(shù)據(jù),存儲在企業(yè)服務(wù)器中的數(shù)據(jù),包括關(guān)系型和非關(guān)系型數(shù)據(jù)庫等。目錄1連接關(guān)系型數(shù)據(jù)庫連接數(shù)據(jù)文件2連接非關(guān)系型數(shù)據(jù)庫3連接其他數(shù)據(jù)源4在Tableau的開始頁面的“連接”下面,單擊“MicrosoftExcel”選項(xiàng),然后選擇要連接的“企業(yè)運(yùn)營數(shù)據(jù).xlsx”工作簿,單擊“打開”按鈕。2.1.1MicrosoftExcel在“連接”下面,單擊“文本文件”選項(xiàng),然后選擇要連接到的文本文件。2.1.2文本文件在“連接”下面,單擊“JSON文件”選項(xiàng),然后,選擇要連接的“2018年商品訂單表.json”文件。2.1.3JSON文件在開始頁面的“連接”下面,單擊“MicrosoftAccess”選項(xiàng)。2.1.4MicrosoftAccessTableau可以讀取PDF文件中的數(shù)據(jù)。在開始頁面上的“連接”下面,單擊“PDF文件”選項(xiàng)。選擇要連接到的“企業(yè)運(yùn)營分析.pdf”文件,然后單擊“打開”按鈕。2.1.5PDF文件在開始頁面上的“連接”下面,單擊“空間文件”選項(xiàng),然后選擇需要連接到的全國各個(gè)省份的ESRIShapefile格式的地圖文件,這里選擇“Provinces.shp”文件。2.1.6空間文件在開始頁面的“連接”下面,單擊“統(tǒng)計(jì)文件”選項(xiàng),我們這里要導(dǎo)入SPSS格式的數(shù)據(jù)文件,選擇“客戶信息表.sav”文件。2.1.7統(tǒng)計(jì)文件目錄1連接關(guān)系型數(shù)據(jù)庫連接數(shù)據(jù)文件2連接非關(guān)系型數(shù)據(jù)庫3連接其他數(shù)據(jù)源4在開始頁面的“連接”下面,單擊“MicrosoftSQLServer”選項(xiàng),然后輸入要連接的服務(wù)器的地址,選擇服務(wù)器的登錄方式,使用Windows身份驗(yàn)證還是使用特定用戶名和密碼。2.2.1MicrosoftSQLServer在開始頁面的“連接”下面,單擊“MySQL”選項(xiàng),然后執(zhí)行以下操作:輸入數(shù)據(jù)庫的服務(wù)器地址、用戶名和密碼等,單擊“登錄”按鈕。2.2.2MySQL在開始頁面的“連接”下面,單擊“Oracle”選項(xiàng),然后輸入服務(wù)器地址、服務(wù)名稱和端口等,然后選擇登錄到服務(wù)器的方式,指定使用集成身份驗(yàn)證還是使用特定用戶名和密碼。2.2.3Oracle在開始頁面的“連接”下面,單擊“PostgreSQL”選項(xiàng),然后輸入服務(wù)器地址、端口和數(shù)據(jù)庫,然后選擇登錄服務(wù)器的方式,這里我們使用用戶名和密碼的方式。2.2.4PostgreSQL在開始頁面的“連接”下面,單擊“IBMDB2”選項(xiàng),然后輸入服務(wù)器地址、端口(默認(rèn)50000)和數(shù)據(jù)庫,然后輸入用戶名和密碼。2.2.5IBMDB2在開始頁面的“連接”到下面,單擊“MemSQL”選項(xiàng),然后輸入服務(wù)器地址、端口和數(shù)據(jù)庫,以及用戶名和密碼。2.2.6MemSQL目錄1連接關(guān)系型數(shù)據(jù)庫連接數(shù)據(jù)文件2連接非關(guān)系型數(shù)據(jù)庫3連接其他數(shù)據(jù)源4MongoDB(來自于單詞“Humongous”,中文為龐大)是可以應(yīng)用于各種規(guī)模的企業(yè)、各行業(yè)以及各類應(yīng)用程序的開源非關(guān)系型數(shù)據(jù)庫。MongoDB將數(shù)據(jù)存儲為一個(gè)文檔,類似于JSON對象,字段值可以包含其他文檔、數(shù)組及文檔數(shù)組等。2.3.1MongoDB簡介登錄MongoDB的官方網(wǎng)站下載安裝包,安裝比較簡單,默認(rèn)安裝在C盤。由于我安裝的是4.2.6版本,在安裝的時(shí)候就自動安裝了其服務(wù),需要檢查一下計(jì)算機(jī)服務(wù)中有沒有MongoDB服務(wù)。2.3.2安裝MongoDB要使Tableau能夠連接MongoDB數(shù)據(jù)庫,需要如下的三個(gè)必需條件:(1)開啟MongoDB服務(wù)。首先需要保證計(jì)算機(jī)的MongoDB服務(wù)已經(jīng)開啟。(2)安裝MongoDB連接器。連接前需要到MongoDB的官方網(wǎng)站下載和安裝其BI連接器。(3)安裝MySQL的ODBC驅(qū)動程序。安裝好MongoDBConnectorforBI還不夠,還需要安裝MySQL的ODBC驅(qū)動程序,然后單擊Tableau中的MongoDBBI連接器,在彈出的對話框中輸入服務(wù)器地址、端口、用戶名和密碼等。2.3.3連接MongoDB目錄1連接關(guān)系型數(shù)據(jù)庫連接數(shù)據(jù)文件2連接非關(guān)系型數(shù)據(jù)庫3連接其他數(shù)據(jù)源4阿里MaxCompute主要服務(wù)于批量結(jié)構(gòu)化數(shù)據(jù)的存儲和計(jì)算,可以提供海量數(shù)據(jù)倉庫的解決方案以及針對大數(shù)據(jù)的分析建模服務(wù),隨著社會數(shù)據(jù)收集手段的不斷豐富及完善,越來越多的行業(yè)數(shù)據(jù)被積累下來。目前Tableau可以連接到阿里MaxComputer,在對話框中輸入服務(wù)器地址、用戶名和密碼。2.4.1阿里MaxComputerDatabricks是屬于Spark的商業(yè)化公司,由美國伯克利大學(xué)AMP實(shí)驗(yàn)室的Spark大數(shù)據(jù)處理系統(tǒng)多位創(chuàng)始人聯(lián)合創(chuàng)立。Databricks致力于提供基于Spark的云服務(wù),可用于數(shù)據(jù)集成,數(shù)據(jù)管道等任務(wù)。Databricks公司的云解決方案由三部分組成:Databricks平臺、Spark和Databricks工作區(qū)。目前Tableau可以連接到Databricks,在對話框中輸入服務(wù)器地址、用戶名和密碼。2.4.2DatabricksTableau還可以連接更多服務(wù)器,包括傳統(tǒng)的數(shù)據(jù)倉庫軟件(如IBMNetezza、Teradata等)。TableauDesktop連接的所有數(shù)據(jù)庫類型,可以在開始頁面單擊“連接”→“到服務(wù)器”,再單擊“更多...”選項(xiàng)進(jìn)行查看。2.4.3更多服務(wù)器第3章Tableau基礎(chǔ)操作Tableau連接新數(shù)據(jù)源時(shí)會將該數(shù)據(jù)源中的每個(gè)字段分配給“數(shù)據(jù)”窗格中的“維度”或“度量”,具體情況視字段的數(shù)據(jù)類型而定。如果字段是分類等文本類型數(shù)據(jù),Tableau會將其分配給“維度”,如果字段包含數(shù)值數(shù)據(jù),Tableau就會將其分配給“度量”。本章將介紹Tableau的基礎(chǔ)操作:包括工作區(qū)的操作、維度和度量及其轉(zhuǎn)換、連續(xù)和離散及其轉(zhuǎn)換、數(shù)據(jù)及視圖的導(dǎo)出等內(nèi)容。目錄1維度和度量及其操作工作區(qū)及其操作2連續(xù)和離散及其操作3數(shù)據(jù)及視圖的導(dǎo)出4Tableau的工具欄包含“連接到數(shù)據(jù)”“新建工作表”和“保存”等按鈕,還包含“排序”“分組”和“突出顯示”等分析和導(dǎo)航工具。通過選擇“窗口”→“顯示工具欄”可隱藏或顯示工具欄。3.1.1工具欄及其功能工作區(qū)左側(cè)的“數(shù)據(jù)”窗格顯示數(shù)據(jù)源中的已有字段、創(chuàng)建的新字段和參數(shù)等,在可視化分析過程中,需要將“數(shù)據(jù)”窗格中的相關(guān)字段拖放到功能區(qū)。“數(shù)據(jù)”窗格分為以下4個(gè)區(qū)域。(1)維度:包含諸如文本和日期等類別數(shù)據(jù)的字段。(2)度量:包含可以聚合的數(shù)值字段。(3)集:定義的數(shù)據(jù)子集。(4)參數(shù):可替換計(jì)算字段和“篩選器”中常量值的動態(tài)占位符。3.1.2“數(shù)據(jù)”窗格操作根據(jù)可視化視圖的不同,可以從工作區(qū)左側(cè)顯示的“分析”窗格中將常量線、平均線、含四分位點(diǎn)的中值、盒須圖(即箱形圖)等拖入數(shù)據(jù)視圖。3.1.3“分析”窗格操作Tableau中的每個(gè)工作表都包含功能區(qū)和卡。例如,“標(biāo)記”卡用于控制標(biāo)記屬性的位置,包含“顏色”“大小”“文本”“詳細(xì)信息”“工具提示”控件,此外,根據(jù)分析的具體視圖需要,有時(shí)還會出現(xiàn)“形狀”和“角度”等控件。3.1.4功能區(qū)和標(biāo)記工作表是Tableau制作可視化視圖的區(qū)域,在工作表中通過將字段拖放到功能區(qū)生成數(shù)據(jù)視圖,這些工作表以標(biāo)簽的形式沿工作簿的底部顯示。1.創(chuàng)建工作表2.復(fù)制工作表3.導(dǎo)出工作表4.刪除工作表3.1.5工作表及其操作目錄1維度和度量及其操作工作區(qū)及其操作2連續(xù)和離散及其操作3數(shù)據(jù)及視圖的導(dǎo)出4維度就是指分類數(shù)據(jù),例如城市名稱、用戶性別、商品名稱等。當(dāng)?shù)谝淮芜B接數(shù)據(jù)源時(shí),Tableau會將包含離散分類信息的字段(如字符串或日期字段)分配給“數(shù)據(jù)”窗格中的“維度”,當(dāng)字段從“維度”區(qū)域拖放到行或列功能區(qū)時(shí),Tableau將創(chuàng)建列或行標(biāo)題,例如將“支付方式”拖放到行功能區(qū)時(shí)會出現(xiàn)4種支付類型。3.2.1維度及其操作度量就是指定量數(shù)據(jù),例如客戶的年齡、商品的銷量額和利潤額等。當(dāng)?shù)谝淮芜B接數(shù)據(jù)源時(shí),Tableau會將包含數(shù)值信息的字段分配給“數(shù)據(jù)”窗格中的“度量”,當(dāng)將字段從“度量”區(qū)域拖放到行或列功能區(qū)時(shí),Tableau將創(chuàng)建連續(xù)軸,并創(chuàng)建一個(gè)默認(rèn)的數(shù)據(jù)展示樣式,我們可以根據(jù)需要再進(jìn)行修改。3.2.2度量及其操作1.將“數(shù)據(jù)”窗格中的度量轉(zhuǎn)換為維度在“數(shù)據(jù)”窗格中可以將度量轉(zhuǎn)換為維度,可以使用的方法如下:方法1:選擇該字段并將其從“數(shù)據(jù)”窗格的度量拖放到維度。方法2:在“數(shù)據(jù)”窗格中右鍵單擊該字段,選擇“轉(zhuǎn)換為維度”選項(xiàng)。3.2.3維度和度量的轉(zhuǎn)換及案例2.將可視化視圖中的度量轉(zhuǎn)換為離散維度現(xiàn)在,我們需要了解商品在每種折扣率情況下的總銷售額。由于“折扣”字段是數(shù)值數(shù)據(jù),當(dāng)連接數(shù)據(jù)源時(shí),Tableau會將其分配給“數(shù)據(jù)”窗格中的“度量”,需要將其轉(zhuǎn)換為維度,具體操作步驟如下:步驟1:將“銷售額”拖放到行功能區(qū),將“折扣”拖放到列功能區(qū),Tableau將默認(rèn)顯示一個(gè)散點(diǎn)圖,以總和形式聚合“折扣”和“銷售額”。步驟2:若要將“折扣”視為維度,需要單擊字段上的下拉箭頭,并從菜單中選擇“維度”選項(xiàng)。Tableau將不會聚合“折扣”字段,因此現(xiàn)在將看到一條線。但“折扣”的值仍然是連續(xù)的。再次單擊“折扣”并從菜單中選擇“離散”選項(xiàng)?!罢劭邸钡霓D(zhuǎn)換現(xiàn)已完成,現(xiàn)在將在底部顯示列標(biāo)題(0、0.1、0.2等)。步驟3:最后美化一下視圖,隱藏視圖標(biāo)題等以優(yōu)化視圖的外觀。目錄1維度和度量及其操作工作區(qū)及其操作2連續(xù)和離散及其操作3數(shù)據(jù)及視圖的導(dǎo)出4連續(xù)是指可以包含無限數(shù)量的值,例如商品的銷售額可以是一個(gè)數(shù)字區(qū)間內(nèi)的任何值。如果字段包含可以加總、求平均值或其他方式聚合的數(shù)字,在第一次連接到數(shù)據(jù)源時(shí),Tableau會假定這些值是連續(xù)的,并將該字段分配給“數(shù)據(jù)”窗格的“度量”。當(dāng)字段從“度量”區(qū)域拖放到行或列功能區(qū)時(shí),顯示一系列實(shí)際值,將連續(xù)字段放到行或列功能區(qū)后,Tableau會顯示一個(gè)軸,這個(gè)軸是最小值和最大值之間的度量線,如將“實(shí)際配送天數(shù)”拖放到列功能區(qū)上。3.3.1連續(xù)及其操作離散是指包含有限數(shù)量的值,例如地區(qū)包含華東、華北和東北等6類。如果某個(gè)字段包含的值是名稱、日期或地理位置,Tableau會在第一次連接到數(shù)據(jù)源時(shí)將該字段分配給“數(shù)據(jù)”窗格的“維度”區(qū)域,Tableau會假定這些值是離散的。當(dāng)把離散字段拖放到列或行功能區(qū)時(shí),Tableau會創(chuàng)建標(biāo)題,如將“門店名稱”拖放到行功能區(qū)上。3.3.2離散及其操作1.字段類型在“數(shù)據(jù)”窗格中的轉(zhuǎn)換如果要轉(zhuǎn)換“數(shù)據(jù)”窗格中的字段類型,可以右鍵單擊該字段,然后選擇“轉(zhuǎn)換為離散”或“轉(zhuǎn)換為連續(xù)”。例如,如果需要將“年份”的類型修改為離散型,在下拉框中選擇“轉(zhuǎn)換為離散”選項(xiàng)即可。如果需要將“訂單日期”的類型修改為連續(xù)型,在下拉框中選擇“轉(zhuǎn)換為連續(xù)”選項(xiàng)即可。3.3.3連續(xù)和離散的轉(zhuǎn)換及案例2.字段類型在可視化視圖中的轉(zhuǎn)換單擊視圖中需要轉(zhuǎn)換的字段,如果選擇“離散”,即將字段類型轉(zhuǎn)換為“離散”;選擇“連續(xù)”,即將字段類型轉(zhuǎn)換為“連續(xù)”。目錄1維度和度量及其操作工作區(qū)及其操作2連續(xù)和離散及其操作3數(shù)據(jù)及視圖的導(dǎo)出4在工作中經(jīng)常需要導(dǎo)出視圖中的數(shù)據(jù),可以通過“查看數(shù)據(jù)”實(shí)現(xiàn),在TableauDesktop視圖上右擊鼠標(biāo),在彈出的菜單中選擇“查看數(shù)據(jù)”選項(xiàng)。3.4.1導(dǎo)出數(shù)據(jù)文件我們可以直接導(dǎo)出TableauDesktop圖像,依次單擊菜單欄的“工作表”→“導(dǎo)出”→“圖像”。3.4.2導(dǎo)出圖形文件如果TableauDesktop生成的各類圖和表需要導(dǎo)出為PDF便攜式文件,就可以單擊菜單欄的“文件”→“打印為PDF”。3.4.3導(dǎo)出PDF格式文件如果TableauDesktop生成的各類圖和表需要導(dǎo)出為PowerPoint格式的文件,可以單擊菜單欄的“文件”→“導(dǎo)出為PowerPoint”。3.4.4導(dǎo)出PowerPoint格式文件在工作中,數(shù)據(jù)可視化視圖一般都需要與同事進(jìn)行共享,但是TableauDesktop的版本升級較快,各版本之間僅向下兼容,不向上兼容。Tableau可以將較高版本的視圖導(dǎo)出為較低版本,單擊菜單欄的“文件”→“導(dǎo)出為版本”。注意如果版本差距較大,某些功能和可視化特征可能會丟失。3.4.5導(dǎo)出低版本文件第4章Tableau高級操作前面我們學(xué)習(xí)了Tableau可視化分析的基本知識,包括連接各類數(shù)據(jù)源、工作表的基礎(chǔ)操作、數(shù)據(jù)的導(dǎo)出等。本章將介紹一些Tableau常用的高級操作,如創(chuàng)建新字段、表計(jì)算、創(chuàng)建參數(shù)、函數(shù)等,使用的數(shù)據(jù)源是“商品訂單表.xlsx”。目錄1表計(jì)算及其案例創(chuàng)建字段及其案例2創(chuàng)建參數(shù)及其案例3函數(shù)及其案例4在日常數(shù)據(jù)分析過程中,一般我們收集整理的數(shù)據(jù)不完全包含分析所需要的所有字段。例如,數(shù)據(jù)源可能包含帶有“銷售額”和“利潤額”兩個(gè)字段,但不包括“利潤率”這個(gè)字段。如果需要每種類型商品的利潤率情況,就可以使用“銷售額”和“利潤額”兩個(gè)字段,來創(chuàng)建一個(gè)新的“利潤率”字段。4.1.1創(chuàng)建字段簡介在分析過程中,我們往往需要從“計(jì)算字段”對話框創(chuàng)建新字段,或者基于所選字段創(chuàng)建新字段,操作步驟如下:打開創(chuàng)建字段的編輯器,單擊“數(shù)據(jù)”窗格“維度”右側(cè)的下拉菜單,并選擇“創(chuàng)建計(jì)算字段”。4.1.2創(chuàng)建字段案例也可以在菜單欄中選擇“分析”→“創(chuàng)建計(jì)算字段”。維度和度量字段度都可以直接拖放到編輯器中。這里我們將“實(shí)際配送天數(shù)”和“計(jì)劃配送天數(shù)”拖放到編輯器中,命名為“商品延遲天數(shù)”,右側(cè)是可以使用的函數(shù)列表。在編輯器中,如果單擊“應(yīng)用”按鈕將保存新創(chuàng)建的字段,并將其添加到“數(shù)據(jù)”窗格中,但不關(guān)閉編輯器;如果單擊“確定”按鈕,那么會保存新創(chuàng)建的字段并關(guān)閉編輯器,其中:Tableau將返回字符串或日期類型的新字段保存為維度,返回?cái)?shù)值類型的新字段保存為度量。此外,在處理比較復(fù)雜的公式時(shí),計(jì)算編輯器可能會顯示“計(jì)算包含錯(cuò)誤”。Tableau允許保存無效的新字段,但是在“數(shù)據(jù)”窗格中,該新字段的右側(cè)會出現(xiàn)一個(gè)紅色感嘆號,在沒有更正無效的計(jì)算字段之前,該新字段將無法拖放到視圖中。目錄1表計(jì)算及其案例創(chuàng)建字段及其案例2創(chuàng)建參數(shù)及其案例3函數(shù)及其案例4在Tableau中表計(jì)算的類型主要有以下8種:差異:顯示絕對變化。百分比差異:顯示變化率。百分比:顯示為指定數(shù)值的百分比。合計(jì)百分比:以總額百分比的形式顯示值。排序:對數(shù)值進(jìn)行排名。百分位:計(jì)算百分位值。匯總:顯示累積總額。移動計(jì)算:消除短期波動以確定長期趨勢。4.2.1表計(jì)算簡介1.打開“表計(jì)算”對話框選擇列功能區(qū)上的“總和(銷售額)”字段,在下拉菜單中選擇“添加表計(jì)算”選項(xiàng)。2.定義計(jì)算在“表計(jì)算”對話框中選擇要應(yīng)用的計(jì)算類型,這里選擇“合計(jì)百分比”,在“表計(jì)算”對話框的下半部分定義計(jì)算依據(jù),這里選擇“表”。3.查看表計(jì)算將“門店名稱”拖放到行功能區(qū),原始度量現(xiàn)在標(biāo)記為表計(jì)算,還可以對視圖進(jìn)行適當(dāng)調(diào)整和美化。假設(shè)需要分析2020年6月份不同類型商品的地區(qū)利潤率,具體步驟如下:步驟1:通過計(jì)算編輯器創(chuàng)建一個(gè)名為“利潤率”的新計(jì)算字段?!袄麧櫬省钡扔诶麧欘~除以銷售額,公式為:利潤率=SUM(利潤)/SUM(銷售額)。4.2.2表計(jì)算案例步驟2:將“訂單日期”拖放到篩選器功能區(qū)中,篩選方法主要有相對日期、日期范圍和計(jì)數(shù)等類型,這里我們選擇日期范圍下的“年/月”選項(xiàng)。單擊“下一步”按鈕,會出現(xiàn)“篩選器”的具體選項(xiàng),包括“常規(guī)”“條件”“頂部”。其中,“常規(guī)”包括“從列表中選擇”“自定義值列表”“使用全部”。步驟3:將“地區(qū)”拖放到列功能區(qū),將“利潤率”拖放到列功能區(qū),它的名稱自動更改為“聚合(利潤率)”,使用預(yù)定義求和聚合,表示聚合計(jì)算,將“子類別”拖放到行功能區(qū)。還可以添加“顏色”標(biāo)記對視圖進(jìn)行適當(dāng)?shù)拿阑?。目?表計(jì)算及其案例創(chuàng)建字段及其案例2創(chuàng)建參數(shù)及其案例3函數(shù)及其案例4在TableauDesktop中,參數(shù)是全局占位符值,例如數(shù)字、日期或字符串,可以替換計(jì)算、“篩選器”或參考行中的常量值??梢允褂脜?shù)而不是在“篩選器”中手動設(shè)置要顯示的數(shù)值,在需要更改該值時(shí)打開參數(shù)控件進(jìn)行更新即可。例如,可能會創(chuàng)建一個(gè)實(shí)習(xí)業(yè)務(wù)員的月度銷售額大于60000時(shí)返回“達(dá)標(biāo)”,否則返回“不達(dá)標(biāo)”的計(jì)算字段??梢栽诠街惺褂脜?shù)來替換常量值60000。然后,可以使用參數(shù)控件來動態(tài)更改計(jì)算中的閾值。4.3.1創(chuàng)建參數(shù)簡介下面結(jié)合具體的案例介紹如何在“篩選器”中使用參數(shù)。例如,當(dāng)通過“篩選器”顯示銷售額排名最高的前10個(gè)城市時(shí),可能希望使用參數(shù)而不是固定值10,這樣就可以快速更新“篩選器”來顯示銷售額最高的前10、前20或前30名的城市。創(chuàng)建參數(shù)的具體操作步驟如下:使用“數(shù)據(jù)”窗格維度右側(cè)的下拉箭頭打開創(chuàng)建菜單,選擇“創(chuàng)建參數(shù)”。4.3.2創(chuàng)建參數(shù)案例在“創(chuàng)建參數(shù)”對話框中,為字段指定一個(gè)名稱,這里命名為“前N名”,并指定參數(shù)值的數(shù)據(jù)類型。指定當(dāng)前值,這是參數(shù)的默認(rèn)值,對于浮點(diǎn)型的數(shù)據(jù),當(dāng)前值的默認(rèn)值是1,然后指定要在參數(shù)控件中使用的顯示格式,由于參數(shù)是城市的銷售額排名,因此這里選擇“數(shù)字(標(biāo)準(zhǔn))”。如果選擇“范圍”,則必須指定最小值、最大值和步長。例如,可以定義介于1和50之間的數(shù)值,并將步長設(shè)置為1以創(chuàng)建可用來選擇每個(gè)排名的參數(shù)控件。單擊“確定”按鈕,在“數(shù)據(jù)”窗格底部的“參數(shù)”部分就會出現(xiàn)新創(chuàng)建的參數(shù)。可以通過“數(shù)據(jù)”窗格或參數(shù)控件來編輯參數(shù)。在“數(shù)據(jù)”窗格中右鍵單擊該參數(shù),并選擇“編輯”,在“編輯參數(shù)”對話框中進(jìn)行必要的修改。截至目前,“前N名”的參數(shù)已經(jīng)創(chuàng)建完畢,下面制作各個(gè)城市銷售額排名的條形圖。然后將“城市”字段拖放到“篩選器”中,在彈出的“篩選器[城市]”對話框中,選擇“頂部”下的“按字段”,并在“頂部”后下拉框中選擇新創(chuàng)建的“前N名”參數(shù),依據(jù)是銷售額的總和。顯示參數(shù)控件,在“數(shù)據(jù)”窗格中右鍵單擊參數(shù)并選擇“顯示參數(shù)控件”。使用參數(shù)控件就可以修改“篩選器”以顯示銷售額排名靠前的前10、前15或前20名的城市。目錄1表計(jì)算及其案例創(chuàng)建字段及其案例2創(chuàng)建參數(shù)及其案例3函數(shù)及其案例4函數(shù)是指一段可以直接被另一段程序或代碼引用的程序或代碼。Tableau與其它軟件一樣,也包含豐富的函數(shù),主要包括數(shù)學(xué)函數(shù)、字符串函數(shù)、日期函數(shù)、類型轉(zhuǎn)換函數(shù)、邏輯函數(shù)、聚合函數(shù)等,下面介紹一些比較常用的函數(shù)。4.4.1主要函數(shù)簡介1.數(shù)學(xué)函數(shù)的功能和用法數(shù)學(xué)函數(shù)允許對字段中的數(shù)值進(jìn)行運(yùn)算,只能用于包含數(shù)值的字段。(1)ABS(2)CEILING(3)FLOOR(4)DIV(5)EXP(6)LN(7)LOG(8)MAX2.字符串函數(shù)的功能和用法字符串函數(shù)也叫字符串處理函數(shù),指的是用來進(jìn)行字符串?dāng)?shù)據(jù)處理的函數(shù)。(1)LEFT(2)RIGHT(3)MID(4)LEN(5)FIND(6)FINDNTH3.日期函數(shù)的功能和用法日期函數(shù)允許對數(shù)據(jù)源中的日期進(jìn)行操作。Tableau提供多種日期函數(shù),許多日期函數(shù)使用時(shí)間間隔(date_part)。(1)NOW(2)TODAY(3)DAY(4)MONTH(5)YEAR(6)DATEDIFF4.類型轉(zhuǎn)換函數(shù)的功能和用法類型轉(zhuǎn)換函數(shù)允許將字段從一種數(shù)據(jù)類型轉(zhuǎn)換為另一種數(shù)據(jù)類型。例如,STR([折扣])將數(shù)值類型的折扣轉(zhuǎn)換為字符串值,Tableau將不能對其進(jìn)行聚合。(1)DATE(2)DATETIME(3)FLOAT(4)INT(5)STR5.邏輯函數(shù)的功能和用法邏輯計(jì)算允許確定某個(gè)特定條件為真還是假。例如,SUM([利潤額])>500將確定訂單利潤額是否大于500元,如果大于就返回真,否則返回偽。(1)CASE…WHEN…THEN…ELSE…END(2)IIF(3)IF…THEN…END/IF…THEN…ELSE…END(4)IF…THEN…ELSEIF…THEN…ELSE…END(5)IFNULL6.聚合函數(shù)的功能和用法聚合函數(shù)允許進(jìn)行匯總或更改數(shù)據(jù)的粒度,它是對一組數(shù)據(jù)進(jìn)行計(jì)算,并返回單個(gè)值,也被稱為組函數(shù)。(1)AVG(2)COUNT(3)COUNTD(4)VAR(5)STDEV(6)PERCENTILE下面結(jié)合具體的案例介紹如何應(yīng)用函數(shù),例如需要繪制不同類型商品的銷售額散點(diǎn)圖。通常,散點(diǎn)圖需要多個(gè)度量字段來實(shí)現(xiàn),但是需求中只有一個(gè)銷售額度量,其他都是維度字段。那么一個(gè)度量與多個(gè)維度的散點(diǎn)圖如何繪制呢?上述情況相對比較復(fù)雜,下面詳細(xì)介紹其繪制過程,具體步驟如下:4.4.2函數(shù)應(yīng)用案例導(dǎo)入數(shù)據(jù)后,將“商品類別”和“銷售額”字段分別拖放到列功能區(qū)和行功能區(qū),并將“子類別”拖放到“顏色”標(biāo)記,生成條形圖。將視圖顯示設(shè)置為“整個(gè)視圖”,在標(biāo)記卡中,把條形圖調(diào)整為圓。接下來,用Index函數(shù)創(chuàng)建一個(gè)計(jì)算字段,公式中數(shù)字代表散點(diǎn)的列數(shù),希望呈現(xiàn)出來的散點(diǎn)能排列得密集一點(diǎn),所以標(biāo)了50。將創(chuàng)建好的字段拖放到列功能區(qū),并設(shè)置計(jì)算字段的“計(jì)算依據(jù)”,這是為了使點(diǎn)按照子類別散開,否則,這些點(diǎn)會在同一條直線上。至此,我們通過Index函數(shù),得到了可以直觀查看類別詳情的散點(diǎn)圖,如果不喜歡圓點(diǎn),可以在標(biāo)記卡中,將圓改為其他類型。第5章Tableau數(shù)據(jù)可視化與其他可視化軟件相比,Tableau通過簡單的拖放就可以生成比較美觀的圖形,為我們的工作節(jié)約大量的人力成本和時(shí)間,尤其是一些重復(fù)的工作。本章將通過實(shí)例詳細(xì)介紹如何使用Tableau創(chuàng)建一些常用的視圖,如條形圖、餅形圖、直方圖、折線圖、氣泡圖、樹狀圖、散點(diǎn)圖、箱形圖、環(huán)形圖等,除環(huán)形圖外,他們都位于Tableau軟件界面右上方“智能顯示”區(qū)域,使用的數(shù)據(jù)源主要是“商品訂單表.xlsx”。目錄1復(fù)雜視圖的可視化簡單視圖的可視化2統(tǒng)計(jì)分析的可視化3地理數(shù)據(jù)的可視化4條形圖是一種把連續(xù)數(shù)據(jù)繪制成數(shù)據(jù)條的表現(xiàn)形式,通過比較不同組的條形長度,從而比較不同組的數(shù)據(jù)量大小,例如客戶的性別、受教育程度、購買方式等。繪制條形圖時(shí),不同組之間是有空隙的,如果沒有就是直方圖,可分為垂直條和水平條。條形圖的主要類型如下:(1)簇狀條形圖和三維簇狀條形圖:簇狀條形圖比較各個(gè)類別的值。簇狀條形圖通常垂直軸顯示類別,三維簇狀條形圖以三維格式顯示水平矩形。(2)堆積條形圖和三維堆積條形圖:堆積條形圖顯示單個(gè)項(xiàng)目與整體之間的關(guān)系。三維堆積條形圖以三維格式顯示水平矩形,而不以三維格式顯示數(shù)據(jù)。(3)百分比堆積條形圖和三維百分比堆積條形圖:通常用于比較各個(gè)類別的每一數(shù)值所占總數(shù)值的百分比大小。5.1.1條形圖例如,要?jiǎng)?chuàng)建一個(gè)不同子類別商品的利潤額條形圖,具體步驟如下:連接“商品訂單表.xlsx”數(shù)據(jù)源后,將度量下的“利潤額”字段拖放到列功能區(qū),維度下的“子類別”字段拖放到行功能區(qū),Tableau會自動生成條形圖,顯示商品在各個(gè)子類別上的利潤額。然后將“利潤額”字段拖入“顏色”和“標(biāo)簽”標(biāo)記,設(shè)置圖形顏色,并添加視圖標(biāo)題等。餅形圖(即餅圖)用于展示數(shù)據(jù)系列中各項(xiàng)與總和的比例,圖中的數(shù)據(jù)點(diǎn)顯示為占總體的百分比,每個(gè)數(shù)據(jù)系列具有唯一的顏色或圖案,并且用圖例表示。餅圖的主要類型如下:(1)三維餅圖:以三維格式顯示每一數(shù)值相對于總數(shù)值的大小。(2)復(fù)合餅圖:將數(shù)值從主餅圖中提取并組合到第二個(gè)餅形圖或堆積條形圖的餅圖。(3)分離型餅圖:顯示每一數(shù)值相對于總數(shù)值的大小,同時(shí)強(qiáng)調(diào)每個(gè)數(shù)值。5.1.2餅形圖例如,要?jiǎng)?chuàng)建一個(gè)不同地區(qū)的銷售額餅圖,具體步驟如下:將度量下的“銷售額”字段拖放到行功能區(qū),將“地區(qū)”字段拖放到列功能區(qū),會自動生成柱形圖。單擊“智能顯示”中的餅圖視圖,它顯示每個(gè)地區(qū)在總銷售額中的占比。為了使圖形更加直觀,我們還需要進(jìn)一步美化。單擊“顏色”按鈕,對各個(gè)地區(qū)的顏色進(jìn)行編輯。單擊“大小”標(biāo)記后,拖動滑塊可以放大或縮小餅圖,還可以將“地區(qū)”和“銷售額”拖入“標(biāo)簽”標(biāo)記給每組加上標(biāo)簽等。直方圖是一種統(tǒng)計(jì)報(bào)告圖,由一系列高度不等的縱向條紋或線段表示數(shù)據(jù)分布的情況,一般用橫軸表示數(shù)據(jù)類型,縱軸表示分布情況。直方圖的主要類型如下:(1)標(biāo)準(zhǔn)型直方圖:圖形呈現(xiàn)中間高、兩邊低,左右近似對稱。(2)孤島型直方圖:圖形的左側(cè)或右側(cè)出現(xiàn)孤立的小島。(3)雙峰型直方圖:圖形中出現(xiàn)兩個(gè)山峰。(4)折齒型直方圖:圖形呈現(xiàn)凹凸不平的形狀,(5)陡壁型直方圖:圖形像高山一樣陡壁,向一邊傾斜。(6)偏態(tài)型直方圖:圖形的頂峰有時(shí)偏向左側(cè)、有時(shí)偏向右側(cè)。(7)平頂型直方圖:圖形沒有突出的頂峰,呈平頂型。5.1.3直方圖例如,要?jiǎng)?chuàng)建一個(gè)顯示不同訂單金額區(qū)間的直方圖,具體步驟如下:在度量中選擇“銷售額”字段,將其拖放到行功能區(qū),還需要單擊“智能顯示”中的直方圖視圖,用于創(chuàng)建直方圖。顯示企業(yè)在各個(gè)銷售額區(qū)間的訂單次數(shù)。將“支付方式”字段拖入“篩選器”功能區(qū)中,例如選擇子類別類型為“支付寶”。將“銷售額”字段拖入“顏色”和“標(biāo)簽”標(biāo)記,并為視圖添加標(biāo)題等,現(xiàn)在可以看出使用支付寶這種支付方式的訂單銷售額分布情況。為了能夠更清晰的查看銷售額分布情況,還可以將橫軸的坐標(biāo)刻度進(jìn)行固定,這里設(shè)置為0到15000(即0K到15K)。折線圖是用直線將各個(gè)數(shù)據(jù)點(diǎn)連接起來而組成的圖形,以折線方式顯示數(shù)據(jù)的變化趨勢。折線圖可以顯示隨時(shí)間而變化的連續(xù)數(shù)據(jù),因此非常適合顯示相等時(shí)間間隔的數(shù)據(jù)趨勢。在折線圖中,類別數(shù)據(jù)沿水平軸均勻分布,值數(shù)據(jù)沿縱軸均勻分布。數(shù)據(jù)分析中常常會用到折線圖和面積圖,看起來很相似,可以完成同一類的分析,但是他們卻是不能互換的,正確使用折線圖的幾點(diǎn)注意事項(xiàng):(1)折線圖的橫坐標(biāo)只能是時(shí)間,如果變成了省份等分類變量,就沒有趨勢可言。(2)折線圖展示的是一定日期內(nèi)的數(shù)值趨勢,而面積圖展示的是總值趨勢。5.1.4折線圖例如,要?jiǎng)?chuàng)建一個(gè)顯示不同訂單日期的銷售額折線圖,具體步驟如下:將“訂單日期”拖放到列功能區(qū),將“銷售額”拖放到行功能區(qū)。為了觀察訂單按月份的趨勢,可以單擊列功能區(qū)中的“年(訂單日期)”,然后選擇“月2015年5月”選項(xiàng)。我們還可以通過“標(biāo)記”下的“顏色”“大小”和“標(biāo)簽”等對視圖進(jìn)行美化,并給視圖添加標(biāo)題。氣泡圖可用于展示三個(gè)變量之間的關(guān)系繪制時(shí)將一個(gè)變量放在橫軸,另一個(gè)變量放在縱軸,而第三個(gè)變量則用氣泡的大小來表示。氣泡圖與散點(diǎn)圖類似,不同之處在于:氣泡圖允許在圖中額外加入一個(gè)表示氣泡大小的變量。5.1.5氣泡圖例如,要?jiǎng)?chuàng)建一個(gè)不同省市銷售額大小的氣泡圖,具體步驟如下:將度量下的“銷售額”字段拖放到列功能區(qū),將維度下的“省市”字段拖放到行功能區(qū),拖放完成后,Tableau會自動生成條形圖。通過Tableau右上方的“智能顯示”調(diào)整樣式,選擇“氣泡圖”選項(xiàng)。然后將“銷售額”字段拖放到“顏色”標(biāo)記,為視圖添加標(biāo)題,進(jìn)一步編輯顏色和美化視圖。目錄1復(fù)雜視圖的可視化簡單視圖的可視化2統(tǒng)計(jì)分析的可視化3地理數(shù)據(jù)的可視化4樹狀圖通過在嵌套的矩形中顯示數(shù)據(jù),使用維度定義樹狀圖的結(jié)構(gòu),使用度量定義各個(gè)矩形的大小或顏色??梢詫⒍攘糠旁凇按笮 焙汀邦伾睒?biāo)記上,在“顏色”標(biāo)記上可以包括多個(gè)維度,添加維度只會將視圖分為更多的較小矩形。5.2.1樹狀圖例如:要?jiǎng)?chuàng)建不同類型商品的利潤額樹狀圖,具體步驟如下:將“子類別”拖放到列功能區(qū),將“利潤額”拖放到行功能區(qū),當(dāng)列功能區(qū)上有一個(gè)維度且行功能區(qū)上有一個(gè)度量時(shí),Tableau會顯示一個(gè)默認(rèn)圖表,單擊工具欄上的“智能顯示”按鈕,然后選擇“樹狀圖”視圖類型。將“商品類別”拖放到標(biāo)記卡的“顏色”上,視圖將被分為三個(gè)獨(dú)立的區(qū)域,“商品類別”將確定矩形的顏色。將“銷售額”拖放到標(biāo)記卡的“標(biāo)簽”上,并為視圖添加標(biāo)題等。散點(diǎn)圖表示一個(gè)變量隨另一個(gè)變量變化的大致趨勢,據(jù)此判斷兩變量之間是否存在某種關(guān)聯(lián),從而選擇合適的函數(shù)對數(shù)據(jù)進(jìn)行擬合。散點(diǎn)圖的主要類型如下:(1)散點(diǎn)圖矩陣:用于同時(shí)繪制多個(gè)變量之間的兩兩相關(guān)性的散點(diǎn)圖。(2)三維散點(diǎn)圖:由3個(gè)變量確定的三維空間中研究變量之間的關(guān)系。5.2.2散點(diǎn)圖例如,要?jiǎng)?chuàng)建訂單的實(shí)際配送天數(shù)和計(jì)劃配送天數(shù)的散點(diǎn)圖,具體步驟如下:將“實(shí)際配送天數(shù)”拖放到行功能區(qū),將“計(jì)劃配送天數(shù)”拖放到列功能區(qū),同時(shí)取消菜單欄“分析”下的“聚合度量”選項(xiàng)。將“配送延遲天數(shù)”拖放到“顏色”和“形狀”標(biāo)記上,并為視圖添加標(biāo)題等,從視圖可以看出商品的配送延遲天數(shù)分布情況。箱形圖又稱為箱線圖或盒須圖,是一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計(jì)圖。箱形圖主要用于反映原始數(shù)據(jù)分布的特征,還可以進(jìn)行多組數(shù)據(jù)分布特征的比較等。箱線圖的繪制方法是:先將數(shù)據(jù)進(jìn)行排序,找出一組數(shù)據(jù)的上邊緣、下邊緣、中位數(shù)和兩個(gè)四分位數(shù),然后連接兩個(gè)四分位數(shù)畫出箱體,再將上邊緣和下邊緣與箱體相連接,中位數(shù)在箱體中間。5.2.3箱形圖例如,要?jiǎng)?chuàng)建不同類型商品的折扣箱形圖,具體步驟如下:將“商品類別”和“地區(qū)”拖放到列功能區(qū),將“折扣”拖放到行功能區(qū),Tableau將創(chuàng)建一個(gè)條形圖。單擊工具欄中的“智能顯示”按鈕,然后選擇“盒須圖”視圖類型。將“折扣”拖放到“標(biāo)簽”標(biāo)記,并為視圖添加標(biāo)題等,從視圖可以看出不同類型商品的折扣分布情況。環(huán)形圖是由兩個(gè)及其以上大小不一的餅形圖疊加而成,挖去中間的部分所構(gòu)成的圖形,環(huán)形圖與餅形圖類似,但又有區(qū)別,環(huán)形圖中間有一個(gè)“空洞”。5.2.4環(huán)形圖例如,要?jiǎng)?chuàng)建不同地區(qū)退單量的環(huán)形圖,具體步驟如下:將度量中的“記錄數(shù)”拖放到行功能區(qū),重復(fù)兩次操作,并在標(biāo)記卡上選擇“餅圖”。將視圖顯示方式調(diào)整為適應(yīng)“整個(gè)視圖”,選擇第一個(gè)餅圖,單擊“大小”標(biāo)記,修改餅圖的大小。在行功能區(qū),將兩個(gè)記錄數(shù)的聚合計(jì)算類型由“總和”修改為“平均值”。在第一個(gè)度量上,將“地區(qū)”字段拖放到“顏色”標(biāo)記,“利潤額”字段拖放到“角度”標(biāo)記,并設(shè)置快速表計(jì)算類型為“合計(jì)百分比”。在第二個(gè)度量上,鼠標(biāo)右擊縱坐標(biāo)軸,選擇“雙軸”選項(xiàng)。然后鼠標(biāo)右擊縱坐標(biāo)軸,選擇“同步軸”選項(xiàng)。再右擊縱坐標(biāo)軸,選擇“編輯軸”選項(xiàng),設(shè)置軸的范圍,使得圓環(huán)圖置于視圖的中間位置,選擇“固定”選項(xiàng),并輸入初始值,固定開始為0.8,固定結(jié)束為1.2。然后使用“大小”標(biāo)記適當(dāng)調(diào)整兩個(gè)餅形圖的大小,使其更加美觀。設(shè)置標(biāo)簽,在第一個(gè)度量上,將“地區(qū)”和“是否退單”拖放到“標(biāo)簽”標(biāo)記,并設(shè)置“是否退單”的快速表計(jì)算類型為“合計(jì)百分比”。設(shè)置第二個(gè)餅圖(內(nèi)部小的餅圖)的顏色,選擇第二個(gè)餅圖,然后選擇“顏色”標(biāo)記,選擇顏色類型為“無”,最后,為視圖添加標(biāo)題等,使其更加美觀。傾斜圖可以展示單個(gè)指標(biāo)在不同時(shí)期的變化情況,既能展示值的大小變化,又能展示排名變化等。例如,我們需要繪制企業(yè)各個(gè)門店在2018年和2019年銷售業(yè)績排名的傾斜圖。數(shù)據(jù)包含門店名稱、2018年排名、2019年排名三個(gè)字段。5.2.5傾斜圖門店名稱2018年排名2019年排名定遠(yuǎn)路店15海恒店26金寨店38燎原店41臨泉路52廬江路69人民路店74楊店店87眾興店93繪制傾斜圖之前,首先需要對基礎(chǔ)數(shù)據(jù)進(jìn)行整理,創(chuàng)建“排名變化”新字段,即計(jì)算“2018年排名”與“2019年排名”的差值。

注意:由于“2018年排名”和“2019年排名”都為非聚合字段,因此在公式中需要對字段進(jìn)行聚合處理,如添加SUM函數(shù),才能讓兩個(gè)字段進(jìn)行計(jì)算。要?jiǎng)?chuàng)建的斜線圖,其橫軸是“2018年排名”和“2019年排名”兩個(gè)字段,縱軸是排名,相對前面介紹的視圖,繪制過程比較復(fù)雜,具體操作步驟如下:將維度下的“度量名稱”和度量下的“度量值”分別拖放到列功能區(qū)和行功能區(qū)。

在左下角“度量值”區(qū)域保留“2018年排名”和“2019年排名”兩個(gè)度量值,刪除其他選項(xiàng),標(biāo)記類型選擇“線”。將“排名變化”字段拖放到“大小”標(biāo)記,將“門店名稱”拖放到“標(biāo)簽”標(biāo)記。單擊標(biāo)記卡中的“標(biāo)簽”,修改標(biāo)簽的對齊和標(biāo)簽標(biāo)記選項(xiàng)。倒轉(zhuǎn)坐標(biāo)軸,在縱軸上通過鼠標(biāo)右鍵進(jìn)入“編輯軸”頁面,將縱坐標(biāo)軸設(shè)置為“倒序”,使得排名按照從上往下的順序,體現(xiàn)球隊(duì)排名從高到低。將“度量值”拖放到“標(biāo)簽”標(biāo)記,單擊“標(biāo)簽”進(jìn)入其設(shè)置頁面,將標(biāo)簽設(shè)置為“<度量值>.<門店名稱>”,在視圖中將按照設(shè)置好的格式進(jìn)行顯示。對創(chuàng)建的斜線圖進(jìn)行美化,包括添加視圖標(biāo)題、調(diào)整“度量值”的數(shù)字格式、去除縱坐標(biāo)軸標(biāo)題、添加線條顏色等。目錄1復(fù)雜視圖的可視化簡單視圖的可視化2統(tǒng)計(jì)分析的可視化3地理數(shù)據(jù)的可視化4相關(guān)分析使用相關(guān)系數(shù)表示變量之間的關(guān)系;首先判斷是否有關(guān)系,接著判斷關(guān)系為正相關(guān)或者負(fù)相關(guān),相關(guān)系數(shù)大于0為正相關(guān),反之為負(fù)相關(guān),也可以通過散點(diǎn)圖直觀的查看變量的關(guān)系;最后判斷關(guān)系緊密程度。通常絕對值大于0.7時(shí)認(rèn)為兩變量之間表現(xiàn)出非常強(qiáng)的相關(guān)關(guān)系,絕對值大于0.4時(shí)認(rèn)為有著強(qiáng)相關(guān)關(guān)系,絕對值小于0.2時(shí)相關(guān)關(guān)系較弱。相關(guān)系數(shù)有三類:Pearson、Spearman和Kendall相關(guān)系數(shù),它們均用于描述相關(guān)關(guān)系程度,判斷標(biāo)準(zhǔn)也基本一致。(1)Pearson相關(guān)系數(shù):用來反映兩個(gè)連續(xù)性變量之間的線性相關(guān)程度。(2)Spearman相關(guān)系數(shù):用來反映兩個(gè)定序變量之間的線性相關(guān)程度。(3)Kendall相關(guān)系數(shù):用來反映兩個(gè)隨機(jī)變量擁有一致的等級相關(guān)性。5.3.1相關(guān)分析1.創(chuàng)建簡單散點(diǎn)圖例如:需要分析“門店A銷售額”與“門店A利潤額”兩個(gè)連續(xù)變量之間的關(guān)系。將“門店A銷售額”與“門店A利潤額”分別拖至列功能區(qū)和行功能區(qū),此時(shí)視圖區(qū)域僅有一個(gè)點(diǎn),這是由于Tableau會把兩個(gè)度量按照“總和”進(jìn)行聚合。選擇菜單欄“分析”下的“聚合度量”選項(xiàng),移除選中標(biāo)記,即解聚這兩個(gè)度量字段。2.創(chuàng)建散點(diǎn)圖矩陣散點(diǎn)圖矩陣是散點(diǎn)圖的高維擴(kuò)展,可以幫助探索兩個(gè)及以上變量的兩兩關(guān)系。例如,需要分析門店A、門店B、門店C三家門店銷售額兩兩之間的關(guān)系。將“門店A銷售額”“門店B銷售額”“門店C銷售額”等分別拖至行功能區(qū)和列功能區(qū),并通過“分析”菜單下的“聚合度量”對三個(gè)度量進(jìn)行解聚。在Tableau創(chuàng)建散點(diǎn)圖之后,可以通過添加趨勢線對存在相關(guān)關(guān)系的變量進(jìn)行回歸分析,擬合其回歸直線。在向視圖添加趨勢線時(shí),Tableau將構(gòu)建一個(gè)回歸模型,即趨勢線模型。截至目前,Tableau內(nèi)置了線性、對數(shù)、指數(shù)、多項(xiàng)式和冪等5種趨勢線模型。(1)線性:回歸方程是線性函數(shù)關(guān)系y=a+bx1+cx2+……。(2)對數(shù):回歸方程是對數(shù)函數(shù)關(guān)系y=logax。(3)指數(shù):回歸方程是指數(shù)函數(shù)關(guān)系y=a^x。(4)多項(xiàng)式:回歸方程是多項(xiàng)式函數(shù)關(guān)系y=a+bx+cx^2+dx^3+……。(5)冪:回歸方程是冪函數(shù)關(guān)系y=x^a。例如,需要對“門店A銷售額”與“門店A利潤額”兩個(gè)變量進(jìn)行回歸分析。5.3.2回歸分析1.構(gòu)建回歸模型將“門店A銷售額”與“門店A利潤額”分別拖至行功能區(qū)和列功能區(qū),然后通過菜單欄“分析”下的“聚合度量”對變量進(jìn)行解聚,生成簡單散點(diǎn)圖。在Tableau中,為散點(diǎn)圖添加趨勢線有兩種方法:方法1:在散點(diǎn)圖上單擊鼠標(biāo)右鍵,選擇“趨勢線”下的“顯示趨勢線”,注意默認(rèn)構(gòu)建線性回歸模型。方法2:拖放“分析”窗口中的“趨勢線”到右側(cè)視圖中,可以選擇構(gòu)建模型的類型,有線性、對數(shù)、指數(shù)、多項(xiàng)式、冪等5類。下面以“線性”模型為例進(jìn)行介紹,首先對簡單散點(diǎn)圖的橫坐標(biāo)起始范圍進(jìn)行設(shè)置,范圍為40到190。生成趨勢線后將鼠標(biāo)懸停在趨勢線上,這時(shí)可以查看趨勢線方程和模型的擬合情況。2.優(yōu)化回歸模型在視圖上單擊鼠標(biāo)右鍵,選擇“趨勢線”下的“編輯趨勢線”選項(xiàng),Tableau彈出“趨勢線選項(xiàng)”頁面,此時(shí)可以重新選擇趨勢線的類型等。3.評估回歸模型添加趨勢線后,如果想查看模型的擬合優(yōu)度,我們只需在視圖中右擊鼠標(biāo),選擇“趨勢線”下的“描述趨勢模型”選項(xiàng),打開“描述趨勢模型”頁面。聚類分析是根據(jù)“物以類聚”的道理,對樣品或指標(biāo)進(jìn)行分類的一種多元統(tǒng)計(jì)分析方法,要求能合理地按各自的特性進(jìn)行合理的分類,沒有任何模式可供參考或依循,即在沒有先驗(yàn)知識的情況下進(jìn)行的分析,主要有K均值聚類、系統(tǒng)聚類等。Tableau嵌入的聚類模型是K均值聚類算法。K均值聚類(K-Means)是一種迭代求解的算法,其步驟是:首先指定聚類數(shù)K,軟件會隨機(jī)選取K個(gè)點(diǎn)作為初始的聚類中心點(diǎn)。然后計(jì)算每個(gè)對象與K個(gè)初始聚類中心之間的距離,并把每個(gè)對象分配給距離它最近的聚類中心點(diǎn)。聚類中心以及分配給它們的對象就代表一個(gè)類,每個(gè)類的聚類中心會根據(jù)類中現(xiàn)有的對象重新計(jì)算,計(jì)算每個(gè)類中對象的坐標(biāo)平均值,這個(gè)過程將不斷重復(fù)直到滿足終止條件。5.3.3聚類分析1.構(gòu)建聚類模型下面以企業(yè)經(jīng)營數(shù)據(jù)為例,對門店A和門店B在3月份銷售額數(shù)據(jù)進(jìn)行聚類分析。將“門店A銷售額”拖放到列功能區(qū),將“門店B銷售額”拖放到行功能區(qū)。通過菜單欄“分析”下的“聚合度量”對變量進(jìn)行解聚。然后設(shè)置橫軸和縱軸的刻度范圍,都從100開始。拖放“分析”窗口中的“群集”到右側(cè)視圖中,在視圖的左上方會顯示創(chuàng)建群集的信息。根據(jù)繪制的散點(diǎn)圖可以看出,分為4類比較合適,因此在彈出的“群集”對話框中的“群集數(shù)”中輸入4。將生成的“群集”字段添加到“標(biāo)記”卡上的“標(biāo)簽”和“形狀”控件,然后,對視圖進(jìn)行適當(dāng)?shù)拿阑?,聚類分析的結(jié)果如圖所示。2.描述聚類模型在“群集”下拉框中,選擇“描述群集”選項(xiàng)。Tableau會彈出“描述群集”頁面,其中在“摘要”選項(xiàng)卡中,描述已創(chuàng)建的預(yù)測模型,包括“要進(jìn)行聚類分析的輸入”、“匯總診斷”等。3.編輯聚類模型在“群集”下拉框中,選擇“編輯群集”選項(xiàng),在“群集”頁面,可以添加聚類變量和修改聚類數(shù)。時(shí)間序列分析法是根據(jù)過去的變化預(yù)測未來的發(fā)展,前提是假定事物的過去延續(xù)到未來。時(shí)間序列分析,正是根據(jù)客觀事物發(fā)展的連續(xù)規(guī)律性,運(yùn)用過去的歷史數(shù)據(jù),通過統(tǒng)計(jì)分析,進(jìn)一步推測未來的發(fā)展趨勢。事物的過去會延續(xù)到未來這個(gè)假設(shè)前提包含兩層含義:一是不會發(fā)生突然的跳躍變化,以相對小的步伐前進(jìn);二是過去和當(dāng)前的現(xiàn)象可能表明現(xiàn)在和將來活動的發(fā)展變化趨向。Tableau內(nèi)嵌了對周期性波動數(shù)據(jù)的預(yù)測功能,可以分析數(shù)據(jù)規(guī)律、自動擬合、預(yù)測未來數(shù)據(jù)等,同時(shí)還可以對預(yù)測模型的參數(shù)進(jìn)行調(diào)整,評價(jià)預(yù)測模型的精確度等。但是,Tableau嵌入的預(yù)測模型主要考慮數(shù)據(jù)本身的變化特征,無法考慮外部影響因素,因此適用于存在明顯周期波動特征的時(shí)間序列數(shù)據(jù)。5.3.4時(shí)間序列分析1.建立時(shí)間序列模型時(shí)間序列圖是一種特殊的折線圖,以時(shí)間作為橫軸,縱軸是不同時(shí)間點(diǎn)上變量的數(shù)值。下面以企業(yè)經(jīng)營數(shù)據(jù)為例,創(chuàng)建3月份門店A利潤額的時(shí)間序列圖。將“門店A利潤額”拖放到行功能區(qū),將“月份”字段拖放到列功能區(qū),并單擊右鍵,在彈出的下拉框中選擇“天”,切換日期字段的級別,視圖區(qū)即顯示3月份門店A利潤額的時(shí)間序列圖。2.時(shí)間序列預(yù)測Tableau嵌入了“指數(shù)平滑”的預(yù)測模型,即基于歷史數(shù)據(jù)引入一個(gè)簡化的加權(quán)因子,即平滑系數(shù),以迭代的方式預(yù)測未來一定周期內(nèi)的變化趨勢。該方法之所以稱為指數(shù)平滑法,是因?yàn)槊總€(gè)級別的值都受到前一個(gè)實(shí)際值的影響,且影響程度呈指數(shù)下降,即數(shù)值離現(xiàn)在越近權(quán)重就越大。通常,時(shí)間序列中的數(shù)據(jù)點(diǎn)越多,所產(chǎn)生的預(yù)測就越準(zhǔn)確。如果要進(jìn)行季節(jié)性建模,那么需要具有足夠的數(shù)據(jù),因?yàn)槟P驮綇?fù)雜,就需要越多的數(shù)據(jù)進(jìn)行訓(xùn)練。截至目前,Tableau有3種方式生成預(yù)測曲線:方法1:菜單欄“分析”→“預(yù)測”→“顯示預(yù)測”;方法2:在視圖上任意一點(diǎn)單擊鼠標(biāo)右鍵,選擇“預(yù)測”→“顯示預(yù)測”;方法3:拖放“分析”窗口中的“預(yù)測”模型到視圖中。優(yōu)化預(yù)測模型。Tableau默認(rèn)的預(yù)測模型可能不是最優(yōu)的。可以通過依次單擊菜單欄“分析”→“預(yù)測”→“預(yù)測選項(xiàng)”選項(xiàng),打開“預(yù)測選項(xiàng)”頁面,查看Tableau默認(rèn)的模型類型和預(yù)測選項(xiàng)并進(jìn)行適當(dāng)?shù)男薷?。在“預(yù)測選項(xiàng)”窗口中,將“預(yù)測長度”選項(xiàng)設(shè)置為“自動”,“聚合方式”選項(xiàng)設(shè)置為“自動”,“預(yù)測模型”選項(xiàng)設(shè)置為“自動”,然后單擊“確定”按鈕。3.評估預(yù)測模型依次單擊菜單欄“分析”→“預(yù)測”→“描述預(yù)測”選項(xiàng),打開“描述預(yù)測”對話框,可以查看模型的詳細(xì)描述,分為“摘要”選項(xiàng)卡和“模型”選項(xiàng)卡。在“摘要”選項(xiàng)卡中,描述了已創(chuàng)建的預(yù)測模型,上半部分匯總了Tableau創(chuàng)建預(yù)測所用的選項(xiàng),一般由軟件自動選取,也可以在“預(yù)測選項(xiàng)”對話框中指定。目錄1復(fù)雜視圖的可視化簡單視圖的可視化2統(tǒng)計(jì)分析的可視化3地理數(shù)據(jù)的可視化4地理數(shù)據(jù)一般是通過繪制地圖實(shí)現(xiàn)可視化,地圖是指依據(jù)一定的數(shù)學(xué)法則,使用制圖語言表達(dá)地球上各種事物的空間分布、聯(lián)系及時(shí)間的發(fā)展變化狀態(tài)而繪制的圖形。基本概念下面簡單介紹一下Tableau繪制地圖的步驟:(1)設(shè)置角色:構(gòu)建地圖的第一步是指定包含位置數(shù)據(jù)的字段。Tableau會自動將地理角色分配給具有公用位置名稱的字段。(2)標(biāo)記地圖:在創(chuàng)建地圖時(shí),需要將生成的緯度(生成)和經(jīng)度(生成)分別拖放到行功能區(qū)和列功能區(qū),并將地理字段(如“城市”)拖放到“詳細(xì)信息”標(biāo)記。(3)添加字段信息:為了使地圖更加美觀,需要添加更多字段信息,可以通過從“數(shù)據(jù)”窗格中將度量或連續(xù)維度拖放到“標(biāo)記”卡實(shí)現(xiàn)。(4)設(shè)置地圖選項(xiàng):在創(chuàng)建地圖時(shí),有多個(gè)選項(xiàng)可以幫助我們控制地圖的外觀,菜單欄依次單擊“地圖”→“地圖選項(xiàng)”,打開“地圖選項(xiàng)”窗格。(5)自定義地圖:創(chuàng)建地圖時(shí),可以使用不同方式瀏覽視圖并與其交互,可以放大和縮小視圖、平移、選擇標(biāo)記,甚至可以通過地圖搜索具體地點(diǎn)等。第6章Tableau儀表板和故事Tableau儀表板是若干視圖的集合,讓我們能同時(shí)比較各種數(shù)據(jù)。如果有一組每天都需要審閱的數(shù)據(jù),我們可以創(chuàng)建一個(gè)顯示所有視圖的儀表板,而不是逐一導(dǎo)航到單獨(dú)的工作表,后期審閱該儀表板即可。本章將詳細(xì)介紹創(chuàng)建高效儀表板的基本原則、如何創(chuàng)建美觀的儀表板、如何進(jìn)一步完善與改進(jìn)儀表板等內(nèi)容。目錄1Tableau儀表板創(chuàng)建儀表板基本要求2Tableau故事3共享可視化視圖41.了解可視化的對象那些出色的儀表板,都是服務(wù)于它們的目標(biāo)受眾,除了知道儀表板要展示給什么樣的受眾看之外,還必須了解他們的專業(yè)知識水平以及想要研究的主題和內(nèi)容。2.考慮顯示屏尺寸在創(chuàng)建儀表板前需要提前調(diào)研,了解用戶使用什么樣的設(shè)備查看。如果制作儀表板的初衷是要在筆記本上查看,而實(shí)際上卻在手機(jī)上,那么用戶很可能就不滿意。3.合理規(guī)劃,確??焖偌虞d即使是全世界最為精美的儀表板,如果加載時(shí)間過長,也不會有太大的作用,由于人們都很忙,長時(shí)間等待會讓人感到心煩意亂,優(yōu)化操作順序有助于縮短加載時(shí)間。6.1.1熟悉業(yè)務(wù)合理規(guī)劃1.充分利用吸引目光的位置在數(shù)字時(shí)代,大多數(shù)人在查看內(nèi)容時(shí)都會本能地從屏幕左上角開始瀏覽,在確定了儀表板的主要目的之后,就可以將最重要的視圖放在儀表板的左上角。2.限制視圖數(shù)量和顏色添加過多視圖,會犧牲儀表板的整體效果,一般只能添加兩三個(gè)視圖。如果發(fā)現(xiàn)兩三個(gè)視圖不能滿足需要,可以再創(chuàng)建儀表板。此外,使用顏色會使分析增色不少。3.增強(qiáng)交互性以鼓勵(lì)用戶探索篩選器可以給可視化分析帶來錦上添花的作用,同時(shí)也能吸引用戶參與交互。啟用突出顯示后,在一個(gè)視圖中選擇某個(gè)對象會在其他視圖中突出顯示相關(guān)的數(shù)據(jù)。6.1.2利用視圖充分展示1.試圖通過一個(gè)儀表板解答過多問題人們很容易好高騖遠(yuǎn),想要提供非常詳細(xì)的實(shí)時(shí)儀表板,涵蓋所有業(yè)務(wù)挑戰(zhàn),向用戶提供大量下鉆查詢選項(xiàng)。除非儀表板涵蓋的范圍小而具體,否則不會給觀看者帶來任何助益。2.使用一些沒人理解的指標(biāo)指標(biāo)以及給指標(biāo)添加的標(biāo)簽對自己而言可能很好理解,但其他人是否明白它們的含義?確保這些內(nèi)容契合受眾的專業(yè)知識水平,建議先向其中一名用戶展示設(shè)計(jì)原型。3.混入了無關(guān)緊要的圖表和小組件不要將儀表板做得華而不實(shí),或使用一些類似于儀表的圖形和小組件。在儀表板中添加不必要的對象就像自定義儀表板一樣會讓人上癮,而且會妨礙實(shí)現(xiàn)預(yù)期目標(biāo)。6.1.3完善視圖避免錯(cuò)誤目錄1Tableau儀表板創(chuàng)建儀表板基本要求2Tableau故事3共享可視化視圖4儀表板是若干視圖的集合,它可以使我們能夠輕松的比較各種數(shù)據(jù)。例如如果有一組每天都需要查看的數(shù)據(jù),那么可以創(chuàng)建一個(gè)顯示所有視圖的儀表板,而不是多次重復(fù)導(dǎo)航到每個(gè)工作表。像工作表一樣,可以通過工作簿底部的標(biāo)簽訪問儀表板。工作表和儀表板中的數(shù)據(jù)是相連的,當(dāng)修改工作表時(shí),包含該工作表的所有儀表板也會隨之更改。工作表和儀表板都會隨著數(shù)據(jù)源中的數(shù)據(jù)一起更新。6.2.1什么是儀表板儀表板的創(chuàng)建方式與新工作表的創(chuàng)建方式相同。如果要打開新儀表板并開始創(chuàng)建儀表板,請單擊工作簿底部的“新建儀表板”按鈕。6.2.2如何創(chuàng)建儀表板“儀表板”區(qū)域出現(xiàn)在左側(cè),并列出工作簿中的所有工作表,有了儀表板后,單擊已經(jīng)構(gòu)建的視圖(在左側(cè)的“工作表”下),并將它們拖放到右側(cè)的儀表板上,灰色陰影區(qū)域指明可以將視圖放到哪個(gè)位置。添加和編輯對象,除了將視圖添加到儀表板之外,還可以添加用于增加視覺吸引力和交互性的對象,左下角“對象”選項(xiàng)下共有8種類型:(1)水平與垂直對象:提供布局容器,這些容器能將相關(guān)對象分組在一起,并微調(diào)用戶與對象交互時(shí),調(diào)整儀表板大小的方式。(2)水文本對象:在儀表板的中添加顯示文本,內(nèi)容要言簡意賅。(3)水圖像對象:添加到儀表板的視覺風(fēng)味,可以將它們鏈接到特定目標(biāo)URL。(4)水網(wǎng)頁對象:在儀表板的上下文中顯示目標(biāo)頁面。確保查看這些Web安全性選項(xiàng),并且要注意,某些網(wǎng)頁不允許嵌入自身。(5)水空白對象:可幫助我們調(diào)整儀表板之間的間距。(6)水按鈕對象:可讓受眾從一個(gè)儀表板導(dǎo)航到另一個(gè)儀表板,或者導(dǎo)航到其他工作表或故事。添加自定義圖像和工具提示文本來向用戶呈現(xiàn)按鈕的目標(biāo)。(7)水?dāng)U展對象:使我們能向儀表板中添加獨(dú)特的功能,或?qū)⑺鼈兣cTableau外部的應(yīng)用程序集成。創(chuàng)建儀表板之后,可能需要調(diào)整大小或?qū)ζ溥M(jìn)行重新組織,以便更好地為用戶工作。1.控制總體儀表板大小2.在項(xiàng)目周圍添加邊距、邊框和背景色3.設(shè)置工作表背景6.2.3完善美化儀表板目錄1Tableau儀表板創(chuàng)建儀表板基本要求2Tableau故事3共享可視化視圖4故事是按順序排列的工作表集合,包含多個(gè)傳達(dá)信息的工作表或儀表板。故事中各個(gè)單獨(dú)的工作表稱為“故事點(diǎn)”,創(chuàng)建故事的目的是為了揭示各種事實(shí)之間的關(guān)系、提供上下文、演示決策與結(jié)果的關(guān)系。在數(shù)據(jù)分析工作中,使用故事的方式主要有以下兩種。(1)協(xié)作分析:可以使用故事構(gòu)建有序分析,供自己使用或與同事協(xié)作使用。顯示數(shù)據(jù)隨時(shí)間變化的效果,或執(zhí)行假設(shè)分析。(2)演示工具:可以使用故事向客戶敘述某個(gè)事實(shí),就像儀表板提供相互協(xié)作視圖的空間排列一樣,故事可按順序排列視圖或儀表板,以便創(chuàng)建一種敘述流。6.3.1讓故事代替PPT右擊Tableau下方的“新建故事”按鈕,可以新建一個(gè)故事。鼠標(biāo)右鍵單擊新建故事點(diǎn)的名稱“故事1”,然后選擇“編輯標(biāo)題”選項(xiàng),輸入“運(yùn)營分析”。6.3.2如何創(chuàng)建故事在左下角可以設(shè)置故事的具體大小,我們可以從預(yù)定義的大小中任意選擇一種(有固定大小、自動和范圍三種),這里選擇“自動”。將“工作表”區(qū)域的工作表拖放到故事頁面,如“各門店銷售額分析”。為故事點(diǎn)添加標(biāo)題。單擊“添加標(biāo)題”,輸入標(biāo)題內(nèi)容,如“各門店銷售額”。如果想再創(chuàng)建一個(gè)“各門店利潤額”的故事點(diǎn),可以單擊“空白”按鈕,再拖入“各門店利潤額分析”報(bào)表,并輸入標(biāo)題“各門店利潤額”。按照上面介紹的步驟,可以繼續(xù)創(chuàng)建“各門店退單量”和“各門店滿意度”的故事點(diǎn)。此外,我們還可以通過“復(fù)制”按鈕復(fù)制故事點(diǎn),將會復(fù)制一個(gè)與原來的故事點(diǎn)完全一樣的新故事點(diǎn),例如先選擇“各門店滿意度”故事點(diǎn),然后單擊“復(fù)制”按鈕,將會出現(xiàn)兩個(gè)“各門店滿意度”故事點(diǎn)。故事格式是指對構(gòu)成故事的工作表進(jìn)行適當(dāng)設(shè)置,包括調(diào)整標(biāo)題大小、使儀表板恰好適合故事的大小等。1.標(biāo)題:調(diào)整標(biāo)題方向和大小2.頁面:使儀表板更適合故事3.格式:設(shè)置合適的故事格式6.3.3完善美化故事目錄1Tableau儀表板創(chuàng)建儀表板基本要求2Tableau故事3共享可視化視圖4可以將數(shù)據(jù)可視化視圖發(fā)布到Tableau的服務(wù)器,包括TableauOnline或者TableauServer,下面具體介紹將報(bào)表或儀表板等發(fā)布到TableauOnline的過程,TableauServer與此類似。單擊菜單欄的“文件”→“共享”,我們這里只發(fā)布到TableauOnline,如果是發(fā)布到TableauServer,這里需要輸入服務(wù)器的地址,然后單擊“連接”按鈕。輸入TableauOnline的用戶名和密碼,然后單擊“登錄”按鈕。輸入所在的項(xiàng)目和可視化視圖的名稱等,然后單擊“發(fā)布”按鈕即可。第7章連接Hadoop集群HadoopHive是基于Hadoop的一個(gè)數(shù)據(jù)倉庫工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供完整的SQL查詢功能,可以將SQL語句轉(zhuǎn)換為MapReduce任務(wù)進(jìn)行運(yùn)行,優(yōu)點(diǎn)是學(xué)習(xí)成本低。本章將詳細(xì)介紹Tableau如何連接ClouderaHive、HortonworksHive、MapRHive等Hadoop集群及其注意事項(xiàng)。目錄1連接基本條件Hadoop簡介2連接主要步驟3連接性能優(yōu)化4Hadoop分布式文件系統(tǒng)是一種文件系統(tǒng)實(shí)現(xiàn),類似于NTFS、EXT3、EXT4等。1.名稱節(jié)點(diǎn)(NameNode)2.第二名稱節(jié)點(diǎn)(SecondaryNameNode)3.數(shù)據(jù)節(jié)點(diǎn)(DataNode)7.1.1Hadoop分布式文件系統(tǒng)MapReduce計(jì)算框架是一種分布式計(jì)算模型,核心是將任務(wù)分解成小任務(wù),由不同計(jì)算者同時(shí)參與計(jì)算,并將各個(gè)計(jì)算者的計(jì)算結(jié)果合并,得出最終結(jié)果。1.作業(yè)跟蹤節(jié)點(diǎn)(JobTracker)2.任務(wù)跟蹤節(jié)點(diǎn)(TaskTracker)7.1.2MapReduce計(jì)算框架Hadoop在大數(shù)據(jù)領(lǐng)域的應(yīng)用前景很大,不過因?yàn)槭情_源技術(shù),實(shí)際應(yīng)用過程中存在很多問題。于是出現(xiàn)了各種Hadoop發(fā)行版,國外目前主要是兩家公司在做這項(xiàng)業(yè)務(wù):Cloudera和MapR。1.ClouderaHadoop2.MapRHadoop7.1.3ApacheHadoop發(fā)行版目錄1連接基本條件Hadoop簡介2連接主要步驟3連接性能優(yōu)化4下面介紹連接的先決條件,對于到HiveServer的連接,必須具備以下條件之一:Hadoop集群包含ApacheHadoopCDH3u1或更高版本的Cloudera分布,其中包括Hive0.7.1或更高版本;Hortonworks;MapREnterpriseEdition(M5);AmazonEMR。對于到HiveServer2的連接,必須具備以下條件之一:Hadoop集群包括ApacheHadoopCDH4u1的Cloudera分布;HortonworksHDP1.2;帶有Hive0.9+的MapREnterpriseEdition(M5);AmazonEMR。此外,還必須在每臺運(yùn)行TableauDesktop或TableauServer的計(jì)算機(jī)上安裝正確的HiveODBC驅(qū)動程序。7.2.1連接前提條件對于HiveServer或HiveServer2,必須從“驅(qū)動程序”頁面下載與安裝Cloudera、Hortonworks、MapR或AmazonEMRODBC驅(qū)動程序。7.2.2安裝驅(qū)動程序在集群中,對所有hive原數(shù)據(jù)和分區(qū)的訪問都要通過HiveMetastore,啟動遠(yuǎn)程metastore后,hive客戶端連接metastore服務(wù),從而可以從數(shù)據(jù)庫查詢到原數(shù)據(jù)信息,metastore服務(wù)端和客戶端通信是通過thrift協(xié)議。在Hadoop群集的終端界面中鍵入以下命令:hive--servicemetastore將Hive服務(wù)移到后臺,需要鍵入以下命令:nohuphive--servicemetastore>metastore.log2>&1&Tableau連接Hadoop集群需要啟動HiveServer2,在終端界面中鍵入以下命令:hive--servicehiveserver2&7.2.3啟動Hive服務(wù)目錄1連接基本條件Hadoop簡介2連接主要步驟3連接性能優(yōu)化4在連接ClouderaHadoop大數(shù)據(jù)集群前,需要確保已經(jīng)安裝了最新的驅(qū)動程序。按照以下的步驟,安裝對應(yīng)的驅(qū)動程序,首先到Cloudera的官方網(wǎng)站下載對應(yīng)的驅(qū)動,然后選擇HiveODBC的下載連接。7.3.1連接ClouderaHadoop大數(shù)據(jù)集群驅(qū)動程序安裝完畢后,需要檢查一下是否可以正常連接ClouderaHive的集群,前提是連接前需要正常啟動Hadoop集群。打開電腦管理工具下的ODBC數(shù)據(jù)源,然后配置“SampleClouderaHiveDSN”,配置完畢后,單擊下方的“Test”按鈕,如果測試結(jié)果顯示“SUCCESS!”,說明可以正常連接Hadoop集群。在開始頁面的“連接”下面,單擊“ClouderaHadoop”選項(xiàng),然后執(zhí)行以下操作:在界面中輸入服務(wù)器的IP地址,服務(wù)器登錄信息,包括類型、身份驗(yàn)證、傳輸類型、用戶名和密碼等。然后單擊“登錄”按鈕,如果出現(xiàn)如圖所示界面,說明連接成功,否則檢查前面的參數(shù)設(shè)置是否有錯(cuò)誤。在架構(gòu)下拉框中選擇數(shù)據(jù)庫,架構(gòu)與關(guān)系型數(shù)據(jù)庫中的具體數(shù)據(jù)庫名稱類似,選擇合適的架構(gòu)查找方式,有精確、包含、開頭為三種,這里我們使用精確方式,在“選擇架構(gòu)”文本框中,輸入“sales”后,單擊“搜索”按鈕,在正下方會出現(xiàn)sales。然后輸入需要進(jìn)行可視化分析的表名稱,例如輸入“orders”表,再單擊“搜索”按鈕。將左側(cè)的“orders(sales.orders)”拖放到畫布區(qū)域,然后單擊“立即更新”或“自動更新”按鈕。在連接MapRHadoopHive大數(shù)據(jù)集群前,需要確保已經(jīng)安裝了最新的驅(qū)動

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論