數(shù)據(jù)可視化 第2版 課件 項目1、2 認識數(shù)據(jù)可視化;Tableau 連接與管理數(shù)據(jù)_第1頁
數(shù)據(jù)可視化 第2版 課件 項目1、2 認識數(shù)據(jù)可視化;Tableau 連接與管理數(shù)據(jù)_第2頁
數(shù)據(jù)可視化 第2版 課件 項目1、2 認識數(shù)據(jù)可視化;Tableau 連接與管理數(shù)據(jù)_第3頁
數(shù)據(jù)可視化 第2版 課件 項目1、2 認識數(shù)據(jù)可視化;Tableau 連接與管理數(shù)據(jù)_第4頁
數(shù)據(jù)可視化 第2版 課件 項目1、2 認識數(shù)據(jù)可視化;Tableau 連接與管理數(shù)據(jù)_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

認識數(shù)據(jù)可視化目錄任務(wù)一了解數(shù)據(jù)可視化的意義與應(yīng)用任務(wù)二理解數(shù)據(jù)可視化框架任務(wù)三認識數(shù)據(jù)可視化工具Tableau1了解數(shù)據(jù)可視化的意義與應(yīng)用(一)認知數(shù)據(jù)可視化的意義(二)了解企業(yè)中數(shù)據(jù)可視化的應(yīng)用本項目首先介紹了數(shù)據(jù)可視化分析的意義與作用,帶領(lǐng)大家認識數(shù)據(jù)可視化的框架,接著讓大家認識Tableau可視化工具的主要特征與其豐富的產(chǎn)品體系,以及不同場景下的文件管理,最后為大家列舉了幾個Tableau的經(jīng)典案例。1.高效獲取信息人腦對視覺信息的處理要比書面信息容易得多。使用圖表總結(jié)復(fù)雜的數(shù)據(jù),可以確保對數(shù)據(jù)信息的理解比混亂的電子表格或者文字報告更快。數(shù)據(jù)可視化提供了一種非常清晰的溝通方式,使業(yè)務(wù)領(lǐng)導(dǎo)者能夠更快地理解和處理他們的信息。用一些簡單的圖形就能體現(xiàn)復(fù)雜的信息,甚至單個圖形也能做到。決策者可以通過交互元素以及類似于各種新的可視化工具,輕松解釋各種不同數(shù)據(jù)源。豐富且有意義的數(shù)據(jù)可視化有助于讓忙碌的管理者及業(yè)務(wù)伙伴了解問題和制定有效計劃。(一)認知數(shù)據(jù)可視化的意義2.實時監(jiān)控指標已經(jīng)收集到的消費者行為的數(shù)據(jù)可以為適應(yīng)性強的公司帶來許多新的機遇,這需要他們不斷地收集和分析這些信息,通過使用數(shù)據(jù)可視化來監(jiān)控關(guān)鍵指標,與企業(yè)內(nèi)部數(shù)據(jù)庫實時連接,隨時更新數(shù)據(jù)。企業(yè)領(lǐng)導(dǎo)人可以更早一步發(fā)現(xiàn)各大數(shù)據(jù)集的市場變化和趨勢。(一)認知數(shù)據(jù)可視化的意義3.精準建立模型當今的商業(yè)決策對數(shù)據(jù)依賴越來越強烈。然而,正確而連貫的數(shù)據(jù)流對商業(yè)用戶做出快速、靈活的決策起到?jīng)Q定性的作用。建立正確的數(shù)據(jù)流和數(shù)據(jù)結(jié)構(gòu)才能保證最好的結(jié)果,如客戶人群分析、RFM模型、同群分析等。那么,如何精準建立數(shù)據(jù)模型?

了解業(yè)務(wù):了解業(yè)務(wù)建立概念模型,確定實體與實體關(guān)系。

建立模型:在概念模型的基礎(chǔ)上生成邏輯模型,確定實體屬性,標準化數(shù)據(jù)。

驗證模型:通過具體的業(yè)務(wù)來驗證模型是否能夠滿足要求。(一)認知數(shù)據(jù)可視化的意義1.生產(chǎn)制造業(yè)生產(chǎn)制造業(yè)是典型的數(shù)據(jù)可視化應(yīng)用行業(yè)。管理生產(chǎn)線、關(guān)注生產(chǎn)線的變化是一個最直接的需求。通過將生產(chǎn)制造過程中的數(shù)據(jù)可視化處理,可以及時發(fā)現(xiàn)生產(chǎn)環(huán)節(jié)出現(xiàn)的問題,提高企業(yè)對生產(chǎn)風險的防范能力。如圖1-1所示是一個生產(chǎn)線的數(shù)據(jù)可視化看板,它將產(chǎn)品的缺陷數(shù)據(jù)整理成各項指標圖表展示出來。比如缺陷類型、各地區(qū)生產(chǎn)產(chǎn)生的缺陷量占比、時間序列下產(chǎn)品缺陷量數(shù)據(jù)。

圖1-1(二)了解企業(yè)中數(shù)據(jù)可視化的應(yīng)用2.電商行業(yè)電商行業(yè)是近年來較為火爆的數(shù)據(jù)可視化分析領(lǐng)域,電子商務(wù)產(chǎn)生的數(shù)據(jù)有很大的挖掘價值。對于電商來說訂單數(shù)據(jù)是最直接相關(guān)的數(shù)據(jù),通過將這部分數(shù)據(jù)可視化處理,可以清晰的觀測訂單量、銷售額、利潤額等等情況。如圖1-2所示是訂單數(shù)據(jù)看板,除了一些數(shù)據(jù)指標卡以外,還有地圖、條形圖用來描述數(shù)據(jù)。圖1-2(二)了解企業(yè)中數(shù)據(jù)可視化的應(yīng)用3.金融行業(yè)金融行業(yè)是數(shù)據(jù)可視化應(yīng)用較多的行業(yè),金融行業(yè)銀行業(yè)務(wù)中將信用卡、銀行交易分別統(tǒng)計查看。企業(yè)常常面臨人工整理數(shù)據(jù)比較繁瑣,并且表格數(shù)據(jù)可讀性低等問題。如圖1-3所示是銀行收入數(shù)據(jù)看板,圖中有各項數(shù)據(jù)指標的指標卡,方便企業(yè)查看各銀行的業(yè)務(wù)情況,比如盈利情況、各渠道收入情況、各地區(qū)顧客量等等。圖1-3(二)了解企業(yè)中數(shù)據(jù)可視化的應(yīng)用2理解數(shù)據(jù)可視化框架(一)了解人在視覺上對圖型規(guī)則的敏感度(二)掌握可視化遵循的原則(一)了解人在視覺上對圖型規(guī)則的敏感度

圖1-4視覺是獲取外部世界信息的最重要通道,超過50%的人腦機能都用于視覺感知。人眼對視覺符號的感知速度快于數(shù)字和文本,并且能夠補充有限的記憶內(nèi)存。觀察以下數(shù)據(jù):X均值9.0,X方差10.0,Y均值7.5,Y方差3.75,相關(guān)系數(shù):0.816,數(shù)據(jù)如圖1-4所示。如圖1-5以圖形的視覺通道迅速發(fā)現(xiàn)數(shù)據(jù)信息:圖1-5(一)了解人在視覺上對圖型規(guī)則的敏感度請從圖1-6的數(shù)字中找出有幾個9。圖1-6(一)了解人在視覺上對圖型規(guī)則的敏感度如圖1-7所示,添加顏色。圖1-7(一)了解人在視覺上對圖型規(guī)則的敏感度由此可見,顏色也是一種視覺通道。視覺通道是用于控制幾何標記的展示特性,如圖1-8所示,通常是由幾何標記以及成分組成,幾何標記中通常是一些幾何圖形元素,如:點、線、面、體,成分主要包含標記的位置、大小、形狀、方向、色調(diào)、飽和度、亮度等。圖1-8(一)了解人在視覺上對圖型規(guī)則的敏感度視覺通道的類型又分為定性(分類)的視覺通道以及定量(連續(xù)、有序)的視覺通道。定性(分類)的視覺通道:定性性質(zhì)和分類性質(zhì),關(guān)于對象本身的特征和位置。如:形狀、顏色的色調(diào)、空間位置。定量(連續(xù)、有序)的視覺通道:定量性質(zhì)或定序性質(zhì),對象某一屬性在數(shù)值上的大小。如直線的長度、區(qū)域的面積、空間的體積、斜度、角度、顏色的飽和度等,如圖1-9所示。圖1-9(一)了解人在視覺上對圖型規(guī)則的敏感度數(shù)據(jù)可視化通過視覺通道為我們清晰有效地傳達溝通信息,具體遵循三個原則:可視性:數(shù)據(jù)可以用圖表、儀表板等方式來展現(xiàn),并可對其模式和相互關(guān)系進行可視化分析。多維性:可以從數(shù)據(jù)的多個屬性或變量數(shù)據(jù)進行切片、鉆取、旋轉(zhuǎn)等,以此剖析數(shù)據(jù),從而多角度、多方面分析數(shù)據(jù)。交互性:用戶能夠方便地通過交互界面實現(xiàn)數(shù)據(jù)的管理、計算與預(yù)測。(二)掌握可視化遵循的原則3認識數(shù)據(jù)可視化工具Tableau(一) 認識Tableau(二) 了解Tableau經(jīng)典案例(一)認識Tableau1.Tableau簡介Tableau是美國Tableau軟件公司出品的一款專業(yè)的商業(yè)智能軟件,能夠滿足企業(yè)的數(shù)據(jù)分析需求。Tableau目前在全球的用戶已超過50000家,在中國的用戶已超過2000家。2.主要特點簡單、易用、易學,不需要技術(shù)背景和統(tǒng)計知識,操作極其簡單。可連接多種數(shù)據(jù)源,輕松實現(xiàn)數(shù)據(jù)融合。高效接口集成,具有良好可擴展性,提升數(shù)據(jù)分析能力。3.產(chǎn)品體系TableauDesktopTableauDesktop是設(shè)計和創(chuàng)建美觀的視圖與儀表板、實現(xiàn)快捷數(shù)據(jù)分析功能的桌面端分析工具,包括TableauDesktopPersonal(個人版)和TableauDesktopProfessional(專業(yè)版)兩個版本,支持Windows和Mac操作系統(tǒng)。Tableau個人版僅允許連接到文件和本地數(shù)據(jù)源,分析成果可以發(fā)布為圖片、PDF等格式;而Tableau專業(yè)版除了具備個人版的全部功能外,支持的數(shù)據(jù)源更加豐富,能夠連接到幾乎所有格式的數(shù)據(jù)和數(shù)據(jù)庫系統(tǒng),包括以O(shè)DBC方式新建數(shù)據(jù)源庫,分析成果還可以發(fā)布到企業(yè)或個人的Tableau服務(wù)器、TableauOnline服務(wù)器和TableauPublic服務(wù)器上,實現(xiàn)移動辦公。因此,專業(yè)版比個人版更加通用,但個人版的價格相對專業(yè)版也便宜不少。(一)認識Tableau

TableauServerTableauServer是一款商業(yè)智能應(yīng)用程序,用于發(fā)布和管理TableauDesktop制作的報表,也可以發(fā)布和管理數(shù)據(jù)源,如自動刷新發(fā)布到Server上的數(shù)據(jù)提取。TableauServer是基于瀏覽器的分析技術(shù),非常適用于企業(yè)范圍內(nèi)的部署,當工作簿做好并發(fā)布到TableauServer上后,用戶可以通過瀏覽器或移動終端設(shè)備,查看工作簿的內(nèi)容并與之交互。TableauServer可控制對數(shù)據(jù)連接的訪問權(quán)限,并允許針對工作簿、儀表板甚至用戶設(shè)置來設(shè)置不同安全級別的訪問權(quán)限。通過TableauServer提供的訪問接口,用戶可以搜索和組織工作簿,還可以在儀表板上添加批注,與同事分享數(shù)據(jù)見解,實現(xiàn)在線互動。利用TableauServer提供的訂閱功能,當允許訪問的工作簿版本有更新時,用戶可以接收到郵件通知。(一)認識TableauTableauOnlineTableauOnline針對云分析而建立,是TableauServer的一種托管版本,省去硬件部署、維護及軟件安裝的時間與成本,提供的功能與TableauServer沒有區(qū)別,按每人每年的方式付費使用。TableauMobileTableauMobile是基于iOS和Android平臺移動端應(yīng)用程序。用戶可通過iPad、Android設(shè)備或移動瀏覽器,來查看發(fā)布到TableauServer或TableauOnline上的工作簿,并可進行簡單的編輯和導(dǎo)出操作。(一)認識TableauTableauPublicTableauPublic是一款免費的桌面應(yīng)用程序,用戶可以連接TableauPublic服務(wù)器上的數(shù)據(jù),設(shè)計和創(chuàng)建自己的工作表、儀表板和工作簿,并把成果保存到大眾皆可訪問的TableauPublic服務(wù)器上(不可以把成果保存到本地電腦上)。TableauPublic使用的數(shù)據(jù)和創(chuàng)建的工作簿都是公開的,任何人都可以與其互動并可隨意下載,還可以根據(jù)你的數(shù)據(jù)創(chuàng)建自己的工作簿。(一)認識Tableau注:利用TableauPublic連接數(shù)據(jù)時,如圖1-10所示,對數(shù)據(jù)源、數(shù)據(jù)文件大小和長度都有一定限制:僅包括Excel、Access和多種文本文件格式,對單個數(shù)據(jù)文件的行數(shù)限制為10萬行,對數(shù)據(jù)的存儲空間限定在50MB以內(nèi)。圖1-10(一)認識TableauTableauReaderTableauReader是一個免費的桌面應(yīng)用程序,可以用來打開和查看打包工作簿文件(.twbx),也可以與工作簿中的視圖和儀表板進行交互操作,如篩選、排序、向下鉆取和查看數(shù)據(jù)明細等。打包工作簿文件可以通過TableauDesktop創(chuàng)建和發(fā)布,也可以從TableauPublic服務(wù)器下載。用戶無法使用TableauReader創(chuàng)建工作表和儀表板,也無法改變工作簿的設(shè)計和布局。(一)認識Tableau文件管理Tableau工作簿(.twb):將所有工作表及其連接信息保存在工作簿文件中,不包括數(shù)據(jù)。打包工作簿(.twbx):打包工作簿是一個zip文件,保存所有工作表、連接信息以及任何本地資源(如本地文件數(shù)據(jù)源、背景圖片、自定義地理編碼等)。這種格式最適合對工作進行打包以便與不能訪問該數(shù)據(jù)的其他人共享。Tableau數(shù)據(jù)源(.tds):Tableau數(shù)據(jù)源文件具有.tds文件擴展名。數(shù)據(jù)源文件是快速連接經(jīng)常使用的數(shù)據(jù)源的快捷方式。數(shù)據(jù)源文件不包含實際數(shù)據(jù),只包含新建數(shù)據(jù)源所必需的信息以及在數(shù)據(jù)窗口中所做的修改,例如默認屬性、計算字段、組、集等。Tableau數(shù)據(jù)源(.tdsx):如果連接的數(shù)據(jù)源不是本地數(shù)據(jù)源,tdsx文件與tds文件沒有區(qū)別。如果連接的數(shù)據(jù)源是本地數(shù)據(jù)源,數(shù)據(jù)源(.tdsx)不但包含數(shù)據(jù)源(.tds)文件中的所有信息,還包括本地文件數(shù)據(jù)源(Excel、Access、文本和數(shù)據(jù)提取)。Tableau書簽(.tbm):書簽包含單個工作表,是快速分享所做工作的簡便方式。Tableau數(shù)據(jù)提?。?hyper):Tableau數(shù)據(jù)提取文件具有.hyper文件擴展名。提取文件是部分或整個數(shù)據(jù)源的一個本地副本,可用于共享數(shù)據(jù)、脫機工作和提高數(shù)據(jù)庫性能。(一)認識Tableau注:從10.5開始,新數(shù)據(jù)提取使用.hyper格式,而不是.tde格式。.Hyper格式的數(shù)據(jù)提取利用改進的數(shù)據(jù)引擎,該數(shù)據(jù)引擎的快速分析和查詢性能與之前的數(shù)據(jù)引擎不相上下,但可適用于更大的數(shù)據(jù)提?。ㄒ唬┱J識Tableau5.Tableau工作區(qū)(1)菜單欄

在菜單欄中主要有“文件”、“數(shù)據(jù)”、“工作表”、“儀表板”、“故事”、“分析”、“地圖”、“設(shè)置格式”、“服務(wù)器”、“窗口”、“幫助”菜單。(一)認識Tableau“文件”菜單的主要功能是新建、保存、導(dǎo)入、導(dǎo)出文件等。“數(shù)據(jù)”菜單的主要功能是管理數(shù)據(jù)源,比如編輯主副表關(guān)系、提取數(shù)據(jù)等。“工作表”菜單的主要功能是對當前工作表進行操作,比如復(fù)制、導(dǎo)出當前工作表,設(shè)置當前視圖內(nèi)容顯示等?!皟x表板”菜單的主要功能是對儀表板進行相關(guān)操作,比如設(shè)置儀表板格式、導(dǎo)出儀表板、設(shè)置儀表板交互功能等?!肮适隆辈藛问荰ableau8.2之后的新增功能,可以按照自定義順序?qū)D表或儀表板展示出來?!胺治觥辈藛问菍σ晥D中的數(shù)據(jù)進行相關(guān)操作,比如數(shù)據(jù)的聚合、數(shù)據(jù)計算字段的創(chuàng)建、數(shù)據(jù)預(yù)測與數(shù)據(jù)趨勢線添加等功能?!暗貓D”菜單是Tableau地圖分析的一大功能,主要包含對地圖的背景圖像設(shè)置、地理編碼的導(dǎo)入等功能。“設(shè)置格式”菜單主要對當前視圖中的文本部分進行相關(guān)設(shè)置。“服務(wù)器”菜單主要功能為連接到TableauServer服務(wù)器,可登錄到TableauServer或其托管版本TableauOnline上,還可將工作簿發(fā)布到TableauPublic上?!按翱凇辈藛慰蓪斍耙晥D展示進入演示模式(或者點擊F7鍵),并可調(diào)整當前視圖內(nèi)容,還可創(chuàng)建書簽,切換工作表?!皫椭辈藛慰色@取Tableau相關(guān)的幫助文檔或視頻等。(一)認識Tableau(2)工具欄顯示起始頁:單擊來回切換TableauDesktop的起始頁和主界面。撤銷:撤銷剛才的操作。重做:返回撤銷的操作。保存:保存當前視圖進度。新建數(shù)據(jù)源:連接新的數(shù)據(jù)源。暫停數(shù)據(jù)更新:暫停更新數(shù)據(jù)源。運行更新:更新數(shù)據(jù)源數(shù)據(jù)。新建工作表:可新建工作表、儀表板或故事。復(fù)制:復(fù)制當前工作表、儀表吧或故事。清除工作表:清除當前工作表所有內(nèi)容。交換行列:交換行功能區(qū)以及列功能區(qū)的字段。升序:將視圖區(qū)的數(shù)據(jù)按照升序排列。降序:將視圖中的數(shù)據(jù)按照降序排列。突出顯示:突出顯示視圖中的字段。組:將視圖區(qū)中的字段形成組。顯示標簽:顯示或隱藏標簽。固定:固定視圖。視圖顯示模式:共有四種,分別是標準、適合寬度、適合高度、整個視圖。顯示/隱藏卡:對工作表界面各個功能區(qū)進行顯示或隱藏。演示模式:視圖區(qū)全屏顯示。共享:通過TableauServer或TableauOnline進行分享。(一)認識Tableau(3)數(shù)據(jù)源顯示框數(shù)據(jù)源顯示框顯示所有已經(jīng)連接的數(shù)據(jù)源,根據(jù)數(shù)據(jù)源的數(shù)據(jù)集,自動劃分維度值列表和度量值列表。(4)數(shù)據(jù)分析框匯總與模型等,可以輔助在視圖中添加平均線、趨勢線等。(5)頁面框?qū)⒆侄瓮线M頁面框,可生成播放菜單,整個視圖可以以播放的方式呈現(xiàn)出來。(6)篩選器將字段拖進篩選器,該字段可生成篩選器。(7)圖形菜單框標記下拉菜單可以選擇視圖的圖形,將字段拖入“顏色”、“大小”,該字段使用顏色或大小來表示。(8)列/行功能區(qū)將字段拖到“列”或“行”上面,就能制作相應(yīng)視圖。(9)智能顯示智能顯示區(qū)域列出了24種不同類型的圖形。只要滿足圖形生成的條件,就能生成對應(yīng)的圖形。將字段拖入到視圖后,可以點擊智能顯示區(qū)切換圖形。(一)認識Tableau(二)了解Tableau經(jīng)典案例1.醫(yī)療臨床分析臨床分析讓臨床醫(yī)護人員快速、全面地了解各種醫(yī)學檢驗項目的臨床意義。如圖1-11所示,本案例建立突顯表,分析周一到周日診所的病人數(shù)量情況,由表可知,診所病人數(shù)量最多的時間段為6:00am–13:00pm;建立散點圖,分析各個部門病人的最小等待時間與護理評分,從而優(yōu)化病人看診的時間等待與接受護理的情況。圖1-112.電子商務(wù)銷售分析電子商務(wù)通常是指是在全球各地廣泛的商業(yè)貿(mào)易活動中,在因特網(wǎng)開放的網(wǎng)絡(luò)環(huán)境下,基于瀏覽器/服務(wù)器應(yīng)用方式,買賣雙方不謀面地進行各種商貿(mào)活動,實現(xiàn)消費者的網(wǎng)上購物、商戶之間的網(wǎng)上交易和在線電子支付以及各種商務(wù)活動、交易活動、金融活動和相關(guān)的綜合服務(wù)活動的一種新型的商業(yè)運營模式。(二)了解Tableau經(jīng)典案例

如圖1-12所示,本案例通過條形圖反映了不同產(chǎn)品、不同國家、不同客戶的銷售額達前5名的情況;通過氣泡圖反映客戶數(shù)量在特定區(qū)間內(nèi)的分布情況;通過地圖展現(xiàn)了各個地區(qū)產(chǎn)品銷量情況。圖1-12(二)了解Tableau經(jīng)典案例3.制造業(yè)原料分析服裝業(yè)是我國傳統(tǒng)優(yōu)勢產(chǎn)業(yè)之一,在國民經(jīng)濟中處于重要地位,而服裝材料是指構(gòu)成服裝的物質(zhì)基礎(chǔ),其色彩、質(zhì)地、風格、表現(xiàn)力等方面的因素直接影響著服裝的表現(xiàn)要素。如圖1-13所示,本案例通過符號地圖,對各個國家的平均每碼距離所花費的金額以及貨物總規(guī)模進行統(tǒng)計;通過條形圖,對不同距離段花費金額以及平均每碼所需花費進行對比預(yù)算;通過條形圖,對各個紡織物以及其適合的人群規(guī)模和每碼所花費金額進行對比分析。圖1-13(二)了解Tableau經(jīng)典案例習題什么是數(shù)據(jù)可視化?視覺通道是什么?又是由什么組成?Tableau有哪些產(chǎn)品體系?各產(chǎn)品體系的功能是什么?(二)了解Tableau經(jīng)典案例感謝聆聽!Tableau連接與管理數(shù)據(jù)目錄任務(wù)一數(shù)據(jù)連接任務(wù)二數(shù)據(jù)整合任務(wù)三數(shù)據(jù)維護1數(shù)據(jù)連接(一)連接Excel表格(二)連接Access文件(三)復(fù)制粘貼數(shù)據(jù)數(shù)據(jù)連接是利用Tableau進行數(shù)據(jù)分析的第一步。Tableau幾乎支持所有主流數(shù)據(jù)源類型,比如常見的MicrosoftExcel文件、CSV文本文件、Access數(shù)據(jù)庫文件等。本項目將從最簡單的電子表格開始,說明如何通過Tableau快速連接到各類數(shù)據(jù)源,以及如何對數(shù)據(jù)源進行整合和維護。(一)連接Excel表格數(shù)據(jù)連接利用Tableau進行數(shù)據(jù)分析的首要工作。完成此任務(wù)需要熟悉Tableau數(shù)據(jù)連接功能區(qū)按鈕,能夠快速導(dǎo)入各類型數(shù)據(jù)并切換到Tableau工作表區(qū)。下面我們“superset(超市數(shù)據(jù))”為例介紹電子表格數(shù)據(jù)連接的操作。在文件數(shù)據(jù)源中,電子表格是最常見的,下面以MicrosoftExcel文件為例進行說明。步驟1雙擊Tableau軟件進入到數(shù)據(jù)連接界面,如圖2-1:圖2-1(一)連接Excel表格步驟2選擇MicrosoftExcel,進入Excel表所在的目錄,單擊文件名,點擊[打開],如圖2-2:圖2-2(一)連接Excel表格注:此時進入編輯數(shù)據(jù)源界面,可對數(shù)據(jù)源進行預(yù)覽,確定數(shù)據(jù)源信息無誤。如圖2-3:圖2-3(一)連接Excel表格步驟4點擊[轉(zhuǎn)到工作表],進入工作表界面,如圖2-4所示:

圖2-4(一)連接Excel表格(二)連接Access文件連接Access文件也可以在數(shù)據(jù)連接界面實現(xiàn)。和連接Excel文件不同的是,連接到Access文件后數(shù)據(jù)表下方會出現(xiàn)[新自定義SQL]選項,熟悉SQL的用戶可以使用SQL查詢語句連接數(shù)據(jù)。注意:連接Access數(shù)據(jù)源之后,可能會出現(xiàn)“與MicrosoftAccess數(shù)據(jù)庫通信時出錯。數(shù)據(jù)源連接可能已丟失”的提示錯誤,原因是未安裝驅(qū)動程序,或者安裝的驅(qū)動程序位數(shù)錯誤。需要安裝與TableauDesktop版本匹配的Access驅(qū)動程序。如圖2-5所示,利用SQL語句查詢自然年為2019所有數(shù)據(jù)。圖2-5(二)連接Access文件如圖2-6,利用自定義SQL查詢生成的數(shù)據(jù)源。圖2-6(二)連接Access文件(三)復(fù)制粘貼數(shù)據(jù)創(chuàng)建數(shù)據(jù)源的另外一種方式是將數(shù)據(jù)復(fù)制粘貼到Tableau中,Tableau會根據(jù)復(fù)制數(shù)據(jù)自動創(chuàng)建數(shù)據(jù)源??梢灾苯訌?fù)制的數(shù)據(jù)類型包含MicrosoftExcel和Word在內(nèi)的Office應(yīng)用程序數(shù)據(jù)、網(wǎng)頁中HTML格式的表格、用逗號或制表符分隔的文本文件數(shù)據(jù)。步驟1打開本地“superstore(超市數(shù)據(jù))”Excel文件并復(fù)制數(shù)據(jù),如圖2-7所示:圖2-7步驟2轉(zhuǎn)到Tableau工作表界面,使用快捷鍵Ctrl+V粘貼到表內(nèi),如圖2-8:圖2-8(三)復(fù)制粘貼數(shù)據(jù)注:此時在視圖界面將生成如圖2-9所示的文本表:圖2-9(三)復(fù)制粘貼數(shù)據(jù)2數(shù)據(jù)整合(一)連接兩張表(二)連接多張表(三)數(shù)據(jù)融合(二)連接兩張表在數(shù)據(jù)分析過程中,所需的數(shù)據(jù)可能來自多張表,甚至以不同的文件類型存在。利用Tableau的數(shù)據(jù)整合功能可實現(xiàn)數(shù)據(jù)源的多表連接、多數(shù)據(jù)源的數(shù)據(jù)整合。下面我們以“2018的各地區(qū)GDP情況

”兩張表為例演示數(shù)據(jù)連接操作。兩張表分別記錄了若干省份(自治區(qū)、直轄市)2018年GDP值,并且兩表存在“重復(fù)”數(shù)據(jù),如圖2-10所示:圖2-10步驟1打開Tableau,連接到表“兩表連接1_1”,點擊[添加],打開表“兩表連接1_2”。如圖2-11:圖2-11(二)連接兩張表注1:連接類型分為內(nèi)部連接、左側(cè)連接、右側(cè)連接、完全外部連接4種。其中“內(nèi)部連接”的結(jié)果是兩表所共有的數(shù)據(jù)個體集合;“左側(cè)連接”以左側(cè)表為基準,右側(cè)表與左邊的表重合的部分數(shù)據(jù)會被提取出來;“右側(cè)連接”表示以右邊的表為基準,左邊的表與右邊的表重合的部分數(shù)據(jù)會被提取出來;“完全外部連接”表示包含查詢結(jié)果集合中的包含左、右表的所有數(shù)據(jù)行。注2:兩表默認進行內(nèi)部連接,如果不希望按照默認的方式連接,可以手動為其指定聯(lián)接方式:(二)連接兩張表步驟2兩表左側(cè)連接的方式如圖2-12:圖2-12(二)連接兩張表步驟3兩表右側(cè)聯(lián)接的方式如圖2-13:

圖2-13(二)連接兩張表

步驟4兩表完全外部聯(lián)接的方式如圖2-14:圖2-14(二)連接兩張表(二)連接多張表步驟1打開Tableau,連接到表“data1”,依次添加表“data2”、“data3”,如圖2-15:圖2-15步驟2分別對兩個連接的連接方式進行設(shè)置,如圖2-16:圖2-16完成表聯(lián)接后,選擇[轉(zhuǎn)到工作表],即可在數(shù)據(jù)窗口看到三張數(shù)據(jù)表的信息。操作完成■(二)連接多張表(三)數(shù)據(jù)融合對于同類型數(shù)據(jù)源,可進行數(shù)據(jù)連接。對不同類型的數(shù)據(jù)源,則需要采用數(shù)據(jù)融合加以整合。

現(xiàn)擬將表“superstore超市數(shù)據(jù)”與表“2019銷售

”進行整合。由于兩表屬于不同數(shù)據(jù)源,若直接進行“兩表連接”操作則會出現(xiàn)圖2-17:對于同類型數(shù)據(jù)源,可進行數(shù)據(jù)連接。對不同類型的數(shù)據(jù)源,則需要采用數(shù)據(jù)融合加以整合。圖2-17注:當表之間自動連接失敗時,會顯示警告信息。此時需要采用添加數(shù)據(jù)源的方式實現(xiàn)。步驟1連接表“superstore(超市數(shù)據(jù))”,依次點選[數(shù)據(jù)]—[新建數(shù)據(jù)源]—[工作表1(2019銷售)],如圖2-18:圖2-18(三)數(shù)據(jù)融合注:在數(shù)據(jù)融合中,提供主要信息的數(shù)據(jù)表為主數(shù)據(jù)源,主數(shù)據(jù)源帶有藍色標記。如圖2-19:圖2-19(三)數(shù)據(jù)融合除了主數(shù)據(jù)源外,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論