電子商務(wù)數(shù)據(jù)分析與應(yīng)用(Excel版) 課件 項(xiàng)目5、6 數(shù)據(jù)導(dǎo)入與預(yù)處理、數(shù)據(jù)可視化_第1頁(yè)
電子商務(wù)數(shù)據(jù)分析與應(yīng)用(Excel版) 課件 項(xiàng)目5、6 數(shù)據(jù)導(dǎo)入與預(yù)處理、數(shù)據(jù)可視化_第2頁(yè)
電子商務(wù)數(shù)據(jù)分析與應(yīng)用(Excel版) 課件 項(xiàng)目5、6 數(shù)據(jù)導(dǎo)入與預(yù)處理、數(shù)據(jù)可視化_第3頁(yè)
電子商務(wù)數(shù)據(jù)分析與應(yīng)用(Excel版) 課件 項(xiàng)目5、6 數(shù)據(jù)導(dǎo)入與預(yù)處理、數(shù)據(jù)可視化_第4頁(yè)
電子商務(wù)數(shù)據(jù)分析與應(yīng)用(Excel版) 課件 項(xiàng)目5、6 數(shù)據(jù)導(dǎo)入與預(yù)處理、數(shù)據(jù)可視化_第5頁(yè)
已閱讀5頁(yè),還剩103頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

電子商務(wù)數(shù)據(jù)分析與應(yīng)用第5章數(shù)據(jù)導(dǎo)入與預(yù)處理本章提綱

數(shù)據(jù)的導(dǎo)入導(dǎo)出5.1

數(shù)據(jù)預(yù)處理方法5.2

數(shù)據(jù)的基本處理操作5.3本章提綱

實(shí)訓(xùn)一、數(shù)據(jù)的導(dǎo)入與導(dǎo)出

實(shí)訓(xùn)二、數(shù)據(jù)預(yù)處理方法

實(shí)訓(xùn)三、數(shù)據(jù)的基本處理操作本章思維導(dǎo)圖思政園地案例1蜜雪冰城自救與救災(zāi)【思政教育元素:培養(yǎng)社會(huì)責(zé)任】2021年7月河南遭遇了罕見(jiàn)的極端強(qiáng)降雨天氣,許多地區(qū)遭遇特大水災(zāi),其中總部在受災(zāi)中心鄭州的蜜雪冰城積極展開(kāi)自救與救援行動(dòng)。蜜雪冰城成立救災(zāi)指揮中心,以黨員帶頭對(duì)旗下員工情況進(jìn)行逐一排查,全力保障員工生命安全,同時(shí)成立捐款捐物小組向重災(zāi)區(qū)域運(yùn)送物資,并捐款2200萬(wàn)元用于抗洪救災(zāi)和災(zāi)后重建。蜜雪冰城在深處災(zāi)區(qū)遭受打擊的情況下,依然選擇挺身而出保障員工安全,幫助災(zāi)區(qū)重建,凸顯了企業(yè)的格局。面對(duì)重大災(zāi)情,我國(guó)的電子商務(wù)企業(yè)在發(fā)展壯大不斷擴(kuò)張的同時(shí)大力回報(bào)社會(huì),彰顯了強(qiáng)烈的企業(yè)社會(huì)責(zé)任。思政園地案例2“丑萌”馬踏飛燕火出圈【思政教育元素:扎根傳統(tǒng)文化,增強(qiáng)文化自信】銅奔馬,或者更為大家熟知的“馬踏飛燕”,為東漢青銅器,是甘肅省博物館鎮(zhèn)館之寶。銅奔馬造型矯健精美,顯示一種勇往直前的豪情壯志,是中華民族偉大氣質(zhì)的象征。而正是這么一件擁有厚重歷史的文物,最近在網(wǎng)絡(luò)上以一種意想不到的方式火出圈了。2022年六月,甘肅省博物館推出了一款以“銅奔馬”為原型的文創(chuàng)玩偶,丑萌的綠馬一邊呲牙咧嘴一邊踩著腳底下的燕子,被踩著的飛燕翻著白眼十分“魔性”。這個(gè)別出心裁輕松搞笑的玩偶一推出就受到網(wǎng)友們的喜愛(ài)與調(diào)侃,同時(shí)吸引了許多關(guān)注。這個(gè)玩偶讓人們知道文創(chuàng)產(chǎn)品也可以很接地氣,也可以讓厚重的文物變得新潮有趣,活靈活現(xiàn)。案例導(dǎo)入

隨著大數(shù)據(jù)和人工智能的快速發(fā)展,當(dāng)今的消費(fèi)者與世界高度相連,一個(gè)公司想要獲得更好的商業(yè)成績(jī)需要通過(guò)大數(shù)據(jù)為他的每個(gè)客戶做出個(gè)性化的精準(zhǔn)服務(wù)。為此2013年,擁有145年歷史的大都會(huì)人壽保險(xiǎn)公司建立了名為MetLiftWall的新系統(tǒng),該系統(tǒng)從大都會(huì)人壽70多個(gè)不同的管理系統(tǒng)中收集大量的信息數(shù)據(jù),這些數(shù)據(jù)之前有許多都是不聯(lián)網(wǎng)的獨(dú)立存在,存在著大量的數(shù)據(jù)冗余,建立系統(tǒng)后又經(jīng)過(guò)多年的努力大都會(huì)人壽成功解決了該項(xiàng)問(wèn)題。

上文所匯總的數(shù)據(jù)剛開(kāi)始很難進(jìn)行使用,在大數(shù)據(jù)分析之前我們需要確保這些分析數(shù)據(jù)滿足分析模型的需求,因此數(shù)據(jù)預(yù)處理環(huán)節(jié)十分重要,它可以將缺失的數(shù)據(jù)補(bǔ)充,冗余的數(shù)據(jù)變得簡(jiǎn)潔,復(fù)雜混亂的數(shù)據(jù)格式統(tǒng)一。你聽(tīng)說(shuō)過(guò)數(shù)據(jù)預(yù)處理嗎?繼續(xù)閱讀本章你可以對(duì)數(shù)據(jù)預(yù)處理?yè)碛懈羁痰牧私狻?.1數(shù)據(jù)的導(dǎo)入導(dǎo)出數(shù)據(jù)的導(dǎo)入導(dǎo)出作用:起到備份、存檔的作用;轉(zhuǎn)換為需要的數(shù)據(jù)格式和文件類(lèi)型。數(shù)據(jù)導(dǎo)入導(dǎo)出分類(lèi):數(shù)據(jù)庫(kù)文件導(dǎo)出成文本文件;文本文件導(dǎo)入成數(shù)據(jù)庫(kù)文件;數(shù)據(jù)庫(kù)文件與數(shù)據(jù)庫(kù)文件之間的導(dǎo)入導(dǎo)出。使用Excel從文本文件導(dǎo)入數(shù)據(jù)有兩種方法:可以在Excel中打開(kāi)它,也可以將其導(dǎo)入為外部數(shù)據(jù)區(qū)域。5.2數(shù)據(jù)預(yù)處理方法5.2.1數(shù)據(jù)清理的方法5.2.2數(shù)據(jù)融合的方法5.2.3數(shù)據(jù)變換的方法5.2.4數(shù)據(jù)規(guī)約的方法5.2.1數(shù)據(jù)清理的方法數(shù)據(jù)清理是數(shù)據(jù)準(zhǔn)備過(guò)程中最花費(fèi)時(shí)間、最乏味的,但也是最重要的一步。該步驟可以有效的減少學(xué)習(xí)過(guò)程中可能出現(xiàn)的相互矛盾的情況。初始獲得的數(shù)據(jù)主要有以下幾種情況需要處理。(1)含噪聲數(shù)據(jù)

(2)錯(cuò)誤數(shù)據(jù)

(3)缺失數(shù)據(jù)

(4)冗余數(shù)據(jù)5.2.1數(shù)據(jù)清理的方法1.含噪聲數(shù)據(jù)目前處理此類(lèi)數(shù)據(jù)最為廣泛的技術(shù)是應(yīng)用數(shù)據(jù)平滑方法。分箱技術(shù)通過(guò)檢測(cè)周?chē)鄳?yīng)屬性值進(jìn)行局部數(shù)據(jù)平滑。分箱的方法很多,主要有按箱平均值平滑、按箱中值平滑和按箱邊界值平滑。對(duì)于含噪聲數(shù)據(jù),尤其對(duì)于孤立點(diǎn)或異常數(shù)據(jù),是不可以隨便以刪除方式進(jìn)行處理的。

2.錯(cuò)誤數(shù)據(jù)對(duì)帶有錯(cuò)誤數(shù)據(jù)的數(shù)據(jù)元組,結(jié)合數(shù)據(jù)所反映的實(shí)際問(wèn)題,進(jìn)行分析、更改、刪除或忽略。同時(shí)也可結(jié)合模糊數(shù)學(xué)的隸屬函數(shù)尋找約束函數(shù),或者根據(jù)前一段歷史數(shù)據(jù)趨勢(shì)對(duì)當(dāng)前數(shù)據(jù)進(jìn)行修正。5.2.1數(shù)據(jù)清理的方法3.缺失數(shù)據(jù)補(bǔ)充缺失數(shù)據(jù)的主要辦法包括:(1)線性差值法,用其周?chē)鷶?shù)據(jù)點(diǎn)的信息來(lái)代替(2)使用一個(gè)全局常量或?qū)傩缘钠骄堤畛淇杖敝担?)對(duì)數(shù)據(jù)的部分屬性進(jìn)行修復(fù)(4)忽略該數(shù)據(jù)元組5.2.1數(shù)據(jù)清理的方法4.冗余數(shù)據(jù)冗余數(shù)據(jù)包括屬性冗余和屬性數(shù)據(jù)冗余,若通過(guò)因子分析或經(jīng)驗(yàn)等方法確信部分屬性的相關(guān)數(shù)據(jù)足以對(duì)信息進(jìn)行挖掘和決策,可通過(guò)用相關(guān)數(shù)學(xué)方法找出具有最大影響屬性因子的屬性數(shù)據(jù),其余屬性則可刪除。若某屬性的部分?jǐn)?shù)據(jù)足以反映該問(wèn)題的信息,則其余的可刪除。若經(jīng)過(guò)分析,這部分冗余數(shù)據(jù)可能還有他用則先保留并進(jìn)行備注說(shuō)明。5.2.2數(shù)據(jù)融合的方法通過(guò)數(shù)據(jù)融合(信息融合)產(chǎn)生比單一信息源更準(zhǔn)確、更完全、更可靠的數(shù)據(jù)進(jìn)行估計(jì)和判斷,然后存入數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)挖掘模塊中。常見(jiàn)的數(shù)據(jù)融合方法5.2.3數(shù)據(jù)變換的方法數(shù)據(jù)變換是采用線性或非線性的數(shù)學(xué)變換方法將多維數(shù)據(jù)壓縮成較少維數(shù)的數(shù)據(jù),消除它們?cè)跁r(shí)間、空間、屬性及精度等特征表現(xiàn)方面的差異。這類(lèi)方法雖然對(duì)原始數(shù)據(jù)都有一定的損害,但其結(jié)果往往具有更大的實(shí)用性。常見(jiàn)的數(shù)據(jù)變換方法5.2.4數(shù)據(jù)規(guī)約的方法數(shù)據(jù)經(jīng)過(guò)去噪處理后,需根據(jù)相關(guān)要求對(duì)數(shù)據(jù)的屬性進(jìn)行相應(yīng)處理。數(shù)據(jù)規(guī)約就是在減少數(shù)據(jù)存儲(chǔ)空間的同時(shí)盡可能保證數(shù)據(jù)的完整性,或得比原始數(shù)據(jù)小得多的數(shù)據(jù),并將數(shù)據(jù)以合乎要求的方式表示。常見(jiàn)的數(shù)據(jù)規(guī)約方法實(shí)訓(xùn)一、數(shù)據(jù)的導(dǎo)入與導(dǎo)出(一)數(shù)據(jù)導(dǎo)入可以將收集到的數(shù)據(jù)直接填寫(xiě)在Excel的單元格中,也可以將多種格式的數(shù)據(jù)文件導(dǎo)入到Excel工作表中。單擊導(dǎo)航欄“數(shù)據(jù)”,最左側(cè)可以選擇將不同格式的數(shù)據(jù)導(dǎo)入Excel。(1)將文本文件導(dǎo)入Excel表格(2)將CSV文件導(dǎo)入Excel工作表

實(shí)訓(xùn)一、數(shù)據(jù)的導(dǎo)入與導(dǎo)出1.將文本文件導(dǎo)入Excel表格(1)文本文件(2)打開(kāi)并創(chuàng)建Excel文件,點(diǎn)擊“數(shù)據(jù)”—“自文本”實(shí)訓(xùn)一、數(shù)據(jù)的導(dǎo)入與導(dǎo)出1.將文本文件導(dǎo)入Excel表格(3)在“導(dǎo)入文本文件”窗口中選擇需要導(dǎo)入的文件,點(diǎn)擊“導(dǎo)入”(4)在彈出的“文本導(dǎo)入向?qū)А睂?duì)話框中選擇“分隔符號(hào)”,點(diǎn)擊“下一步”實(shí)訓(xùn)一、數(shù)據(jù)的導(dǎo)入與導(dǎo)出1.將文本文件導(dǎo)入Excel表格(5)“文本導(dǎo)入向?qū)А睂?duì)話框中選擇“Tab鍵”,點(diǎn)擊“下一步”(6)“文本導(dǎo)入向?qū)А睂?duì)話框選擇“常規(guī)”,點(diǎn)擊“完成”實(shí)訓(xùn)一、數(shù)據(jù)的導(dǎo)入與導(dǎo)出1.將文本文件導(dǎo)入Excel表格(7)彈出對(duì)話框“導(dǎo)入數(shù)據(jù)”,選擇“新工作表”,按“確定”按鈕即可(8)返回Excel工作表,就可以看到數(shù)據(jù)的導(dǎo)入情況實(shí)訓(xùn)一、數(shù)據(jù)的導(dǎo)入與導(dǎo)出2.將CSV文件導(dǎo)入Excel工作表(1)CSV文件(2)導(dǎo)入前再次確認(rèn)數(shù)據(jù)的格式、編碼、分隔符、數(shù)據(jù)行數(shù)等,此處默認(rèn),點(diǎn)擊“加載”(3)數(shù)據(jù)導(dǎo)入之后的Excel文件實(shí)訓(xùn)一、數(shù)據(jù)的導(dǎo)入與導(dǎo)出(二)數(shù)據(jù)導(dǎo)出將Excel數(shù)據(jù)導(dǎo)出到其他操作軟件中,這里以將Excel中的數(shù)據(jù)導(dǎo)出到Word中為例(1)打開(kāi)Word,點(diǎn)擊“插入”“對(duì)象”(2)在彈出的“對(duì)象”對(duì)話框中,選擇“由文件創(chuàng)建”,并點(diǎn)擊“瀏覽”實(shí)訓(xùn)一、數(shù)據(jù)的導(dǎo)入與導(dǎo)出將Excel數(shù)據(jù)導(dǎo)出到其他操作軟件中,這里以將Excel中的數(shù)據(jù)導(dǎo)出到Word中為例(3)選擇需要導(dǎo)出的Excel數(shù)據(jù)源,點(diǎn)擊插入(4)在“對(duì)象”對(duì)話框中點(diǎn)擊“確定”(5)返回Word文件,就可以看到從Excel導(dǎo)出的數(shù)據(jù)實(shí)訓(xùn)二、數(shù)據(jù)預(yù)處理1.數(shù)據(jù)清理某price屬性值排序后為2,4,6,6,9,12,12,14,19,則采用各種分箱方法進(jìn)行處理的結(jié)果如下表所示。除采用分箱方法之外,還可以應(yīng)用聚類(lèi)技術(shù)檢測(cè)異常數(shù)據(jù),發(fā)現(xiàn)孤立點(diǎn)并進(jìn)行修正,或者利用回歸函數(shù)或時(shí)間序列分析的方法進(jìn)行修正。另外,計(jì)算機(jī)和人工相結(jié)合的方式也非常有效。對(duì)于含噪聲數(shù)據(jù),尤其是孤立點(diǎn)數(shù)據(jù),是不可以隨便以刪除的方式進(jìn)行處理的。由于某些孤立點(diǎn)數(shù)據(jù)和離群數(shù)據(jù)代表了某些有特定意義的、重要的潛在知識(shí),因此,對(duì)于孤立點(diǎn)數(shù)據(jù)應(yīng)將其先放入數(shù)據(jù)庫(kù),而不進(jìn)行任何處理。當(dāng)然,如果結(jié)合專(zhuān)業(yè)知識(shí)分析,確定該數(shù)據(jù)無(wú)用,那么可進(jìn)行刪除處理。實(shí)訓(xùn)二、數(shù)據(jù)預(yù)處理2.數(shù)據(jù)規(guī)范化處理例如,某電商平臺(tái)商家銷(xiāo)售的產(chǎn)品“水杯”在過(guò)去半年內(nèi)的月銷(xiāo)售量(件)分別為12,14,6,5,23,10,借助這組數(shù)據(jù)作為數(shù)據(jù)規(guī)范化的樣本數(shù)據(jù),采用最小-最大標(biāo)準(zhǔn)化及z-score標(biāo)準(zhǔn)化分別進(jìn)行處理。最小-最大標(biāo)準(zhǔn)化處理:在該組數(shù)據(jù)中,最大值為23,最小值為5,為使結(jié)果均落在[0,1]區(qū)間,在進(jìn)行轉(zhuǎn)化后,上述數(shù)值依次變?yōu)?.3889,0.5,0.0556,0,1,0.2778。z-score標(biāo)準(zhǔn)化:在該組數(shù)據(jù)中,μ為11.67,σ為6.53,則上述數(shù)值依次變?yōu)?.0505,0.3568,-0.8683,-1.0153,1.7351,-0.2557。實(shí)訓(xùn)三、數(shù)據(jù)的基本處理操作5.3.1重復(fù)數(shù)據(jù)處理5.3.2缺失數(shù)據(jù)處理5.3.3錯(cuò)誤數(shù)據(jù)處理實(shí)訓(xùn)三、數(shù)據(jù)的基本處理操作(一)重復(fù)數(shù)據(jù)處理采集得到的原始數(shù)據(jù)通常存在重復(fù)情形,對(duì)于重復(fù)數(shù)據(jù)如何識(shí)別和去重,通過(guò)Excel介紹兩種常用的方法。(1)高級(jí)篩選法

(2)條件格式法

實(shí)訓(xùn)三、數(shù)據(jù)的基本處理操作1.高級(jí)篩選法(1)如果只是需要將目標(biāo)數(shù)據(jù)的非重復(fù)值篩選出來(lái),可以選擇“數(shù)據(jù)”選項(xiàng)卡下“排序篩選”組中的“高級(jí)”按鈕(2)在彈出的對(duì)話框中進(jìn)行設(shè)置(3)點(diǎn)擊“確定”后,紅框部分為“來(lái)源”數(shù)據(jù)非重復(fù)項(xiàng)的篩選結(jié)果。實(shí)訓(xùn)三、數(shù)據(jù)的基本處理操作2.條件格式法(1)選中需要標(biāo)識(shí)重復(fù)值的區(qū)域,選擇“開(kāi)始”—“條件格式”—“突出顯示單元格規(guī)則”—“重復(fù)值”(2)在彈出的對(duì)話框中把重復(fù)的數(shù)據(jù)標(biāo)注為紅色,點(diǎn)擊確定(3)重復(fù)數(shù)據(jù)處理部分結(jié)果實(shí)訓(xùn)三、數(shù)據(jù)的基本處理操作

(二)缺失數(shù)據(jù)處理Excel表中如果出現(xiàn)缺失數(shù)據(jù),一般表示為空值或者錯(cuò)誤表示符,運(yùn)用“定位條件”功能可以進(jìn)行缺失數(shù)據(jù)的處理。(1)原始數(shù)據(jù)中G列“上次進(jìn)貨數(shù)量”有部分值缺失。現(xiàn)要求將其全部標(biāo)記為0,便于后期數(shù)據(jù)分析。(2)選定G列,選擇“開(kāi)始”—“查找和選擇”—“定位條件”(3)在“定位條件”對(duì)話框中,選擇“空值”,點(diǎn)擊“確定”(4)直接輸入“0”,按“Ctrl+Enter”,空值單元格一次性全部輸入“0”實(shí)訓(xùn)三、數(shù)據(jù)的基本處理操作(三)錯(cuò)誤數(shù)據(jù)處理使用Excel能夠控制和檢查數(shù)據(jù)統(tǒng)計(jì)中存在的錯(cuò)誤。(1)假設(shè)在源數(shù)據(jù)表中存在一列“銷(xiāo)售情況”,0表示銷(xiāo)售一般,1表示銷(xiāo)售良好,2表示銷(xiāo)售極好,其他所有數(shù)據(jù)均為錯(cuò)誤數(shù)據(jù)(2)選中H列,選擇“數(shù)據(jù)”—“數(shù)據(jù)驗(yàn)證”實(shí)訓(xùn)三、數(shù)據(jù)的基本處理操作(3)在彈出的對(duì)話框中進(jìn)行設(shè)置(4)選擇“數(shù)據(jù)驗(yàn)證”—“圈釋無(wú)效數(shù)據(jù)”(5)錯(cuò)誤數(shù)據(jù)處理結(jié)果本章知識(shí)小結(jié)本章主要學(xué)習(xí)運(yùn)用Excel進(jìn)行數(shù)據(jù)的導(dǎo)入導(dǎo)出操作,對(duì)重復(fù)、缺失、錯(cuò)誤數(shù)據(jù)的基本處理操作。從數(shù)據(jù)的清理、數(shù)據(jù)的融合、數(shù)據(jù)的變換以及數(shù)據(jù)的規(guī)約四個(gè)方面,學(xué)習(xí)了數(shù)據(jù)的預(yù)處理操作。通過(guò)本章的學(xué)習(xí),旨在掌握利用Excel處理數(shù)據(jù)的基本方法以及了解數(shù)據(jù)預(yù)處理的基本操作。課后提升案例1數(shù)據(jù)預(yù)處理在網(wǎng)絡(luò)社區(qū)數(shù)據(jù)分析中的應(yīng)用小紅書(shū)是一個(gè)生活方式分享社區(qū)。小紅書(shū)月活躍用戶數(shù)已過(guò)億,其中70%的新增用戶是90

后。小紅書(shū)通過(guò)大數(shù)據(jù)和人工智能技術(shù)將用戶線上分享的消費(fèi)體驗(yàn)內(nèi)容精準(zhǔn)匹配給對(duì)它感興趣的其他用戶,從而引發(fā)社區(qū)互動(dòng),再推動(dòng)其他用戶到線下消費(fèi),這些用戶反過(guò)來(lái)又會(huì)進(jìn)行更多的線上分享,最終形成一個(gè)正循環(huán)。小紅書(shū)已成為用戶線上相互交流發(fā)表意見(jiàn)的重要網(wǎng)絡(luò)社區(qū)。如果希望通過(guò)收集主題的特征信息對(duì)評(píng)論主題進(jìn)行關(guān)聯(lián)規(guī)則挖掘,那么數(shù)據(jù)預(yù)處理會(huì)成為一個(gè)關(guān)鍵環(huán)節(jié)。1)評(píng)論主題兩大因素的提取把每個(gè)評(píng)論主題的信息分為主題誘發(fā)的原因和主題影響力結(jié)果兩大因素。主題誘發(fā)的原因包含評(píng)論主題發(fā)表用戶、發(fā)生時(shí)間、IP地址、涉及人數(shù)、主題類(lèi)型等因素;主題影響力結(jié)果指該評(píng)論主題的影響作用。課后提升2)評(píng)論主題的數(shù)據(jù)清理提取出評(píng)論主題誘發(fā)的原因和主題影響力結(jié)果后,接下來(lái)對(duì)評(píng)論主題的信息進(jìn)行數(shù)據(jù)清理,具體步驟如下。(1)清理空缺值。對(duì)主題誘發(fā)的原因采用忽略元組法,即直接刪除數(shù)據(jù)庫(kù)中某個(gè)記錄元組的屬性值都為空或缺少大量數(shù)值的數(shù)據(jù),因?yàn)檫@些數(shù)據(jù)沒(méi)有太大的挖掘價(jià)值。對(duì)于評(píng)論的主題信息屬性值空缺數(shù)目較少的記錄,采用設(shè)置默認(rèn)值的方式填補(bǔ)空值。(2)泛化處理。針對(duì)不統(tǒng)一的數(shù)據(jù),必須對(duì)其進(jìn)行規(guī)范化處理,以減少數(shù)據(jù)之間的差異。例如,評(píng)論的主題內(nèi)容大多是商品的質(zhì)量問(wèn)題、耐久性問(wèn)題和材質(zhì)問(wèn)題等,則對(duì)這三個(gè)主題進(jìn)行泛化處理,全部用該商品的品質(zhì)來(lái)表示。3)主題信息的集成與轉(zhuǎn)換(1)數(shù)據(jù)轉(zhuǎn)換。用統(tǒng)一的符號(hào)表示網(wǎng)絡(luò)論壇主題及其包含的因素,并進(jìn)行必要的數(shù)據(jù)離散化處理,然后構(gòu)成具體的主題信息表,以便作為關(guān)聯(lián)規(guī)則挖掘的輸入?yún)?shù)。例如,設(shè)置符號(hào)topic表示網(wǎng)絡(luò)論壇主題,R1表示評(píng)論主題發(fā)表用戶;R2表示評(píng)論主題發(fā)生的時(shí)間;R3表示IP地址;R4表示涉及人數(shù);R5表示主題類(lèi)型;R6表示影響作用。課后提升(2)數(shù)據(jù)的規(guī)范化。將連續(xù)屬性進(jìn)行約簡(jiǎn),以符合關(guān)聯(lián)規(guī)則算法的要求。例如,將主題影響力分為4類(lèi),無(wú)注冊(cè)用戶評(píng)論的主題影響力是較差的;評(píng)論用戶數(shù)量低于整體注冊(cè)用戶10%的主題影響力為一般;評(píng)論用戶數(shù)量在整體注冊(cè)用戶的10%~30%的主題影響力為較大;整體用戶數(shù)量超過(guò)整體注冊(cè)用戶的30%的主題影響力為最大。在上述操作之后,可以把數(shù)據(jù)預(yù)處理結(jié)果作為挖掘網(wǎng)絡(luò)社區(qū)主題關(guān)聯(lián)規(guī)則的初始化數(shù)據(jù)再進(jìn)行算法計(jì)算。由此案例可知,數(shù)據(jù)預(yù)處理決定了整個(gè)主題影響力關(guān)聯(lián)規(guī)則挖掘的效率。由此說(shuō)明,全面的數(shù)據(jù)預(yù)處理工作是數(shù)據(jù)分析模型的開(kāi)端,也是提高數(shù)據(jù)分析算法效率的前提。課后提升案例2數(shù)據(jù)預(yù)處理專(zhuān)項(xiàng)應(yīng)用海量的原始數(shù)據(jù)存在著大量不完整、有缺失值、不一致、有異常的數(shù)據(jù),嚴(yán)重影響數(shù)據(jù)挖掘建模的執(zhí)行效率,甚至可能導(dǎo)致挖掘結(jié)果的偏差,所以進(jìn)行數(shù)據(jù)預(yù)處理顯得尤為重要。針對(duì)電子商務(wù)用戶特征分析、電子商務(wù)商品關(guān)聯(lián)銷(xiāo)售與組合營(yíng)銷(xiāo)、網(wǎng)絡(luò)金融風(fēng)險(xiǎn)管理等方面的數(shù)據(jù)分析的應(yīng)用需求,指出應(yīng)采用的數(shù)據(jù)導(dǎo)入、導(dǎo)出過(guò)程及預(yù)處理的方法。本章內(nèi)容結(jié)束!

電子商務(wù)數(shù)據(jù)分析與應(yīng)用項(xiàng)目六數(shù)據(jù)可視化本章提綱

課前自學(xué)一、數(shù)據(jù)可視化概述二、Excel數(shù)據(jù)表格和透視表三、標(biāo)簽云可視化

課中實(shí)訓(xùn)實(shí)訓(xùn)一、圖表的制作實(shí)訓(xùn)二、利用數(shù)據(jù)透視表制作統(tǒng)計(jì)表實(shí)訓(xùn)三、WordArt標(biāo)簽云工具的使用

課后提升案例1京東手機(jī)“6·18”數(shù)據(jù)實(shí)時(shí)戰(zhàn)報(bào)案例2圖表制作專(zhuān)項(xiàng)練習(xí)思維導(dǎo)圖思政園地案例1領(lǐng)悟華為精神,強(qiáng)化理想信念【思政教育元素:樹(shù)立民族自豪感與使命感】

我國(guó)華為的5G技術(shù),是世界進(jìn)入信息化時(shí)代的前奏,給世界帶來(lái)了革命性的影響。作為世界第一的我國(guó)華為5G通信技術(shù),不是簡(jiǎn)單釋意為2/3/4G通信技術(shù)的延伸,其在速率、帶寬和容量、覆蓋面等方面都有巨大的提升和無(wú)可倫比的優(yōu)勢(shì)。華為的5G技術(shù)不僅應(yīng)用于手機(jī),還廣泛運(yùn)用于通信、大數(shù)據(jù)、人工智能等各方面,使構(gòu)建萬(wàn)物互聯(lián)網(wǎng)絡(luò)有了最為現(xiàn)實(shí)的可能,將促進(jìn)世界從機(jī)械工業(yè)時(shí)代向信息智能工業(yè)時(shí)代邁進(jìn),前景廣闊、意義深遠(yuǎn)。華為5G肩負(fù)國(guó)家使命,不斷推進(jìn)中國(guó)高端制造業(yè)發(fā)展。雖然美國(guó)全球圍剿華為,但華為并沒(méi)有放棄對(duì)芯片的研究和投入,而正是這種自強(qiáng)不息、吃苦耐勞的精神,時(shí)刻激勵(lì)著華為人沖破美國(guó)設(shè)置的重重難關(guān),最終走向勝利。思政園地案例2加快冷鏈物流建設(shè),助力鄉(xiāng)村振興【思政教育元素:增強(qiáng)強(qiáng)農(nóng)興農(nóng)的責(zé)任意識(shí)】

全面推進(jìn)鄉(xiāng)村振興被列為我國(guó)“十四五”時(shí)期的重點(diǎn)工作之一,農(nóng)產(chǎn)品冷鏈物流則被視為帶動(dòng)鄉(xiāng)村振興的重要抓手。為推進(jìn)農(nóng)村冷鏈物流基礎(chǔ)設(shè)施建設(shè),國(guó)家有關(guān)部門(mén)提出加快實(shí)施農(nóng)產(chǎn)品倉(cāng)儲(chǔ)保鮮冷鏈物流設(shè)施建設(shè)工程,加大蔬菜、水果、茶葉、中藥材等鮮活農(nóng)產(chǎn)品倉(cāng)儲(chǔ)保鮮補(bǔ)貼力度,鼓勵(lì)有條件的地方建設(shè)產(chǎn)地低溫直銷(xiāo)配送中心。同時(shí),冷鏈物流企業(yè)也積極布局,如在生鮮農(nóng)產(chǎn)品產(chǎn)地新建或改建保鮮倉(cāng)、冷庫(kù)等,為生鮮農(nóng)產(chǎn)品的預(yù)冷、存儲(chǔ)、集散等環(huán)節(jié)提供最適宜的環(huán)境,降低損耗、延長(zhǎng)存儲(chǔ)時(shí)間,保障農(nóng)產(chǎn)品以最佳品質(zhì)到達(dá)消費(fèi)者的菜籃子。

農(nóng)村冷鏈物流基礎(chǔ)設(shè)施除服務(wù)于蓬勃發(fā)展的電商,滿足日益擴(kuò)大的市場(chǎng)需求外,還可以讓農(nóng)產(chǎn)品在走出田間后得到科學(xué)有效的保存。加快農(nóng)村冷鏈基礎(chǔ)設(shè)施建設(shè),是增強(qiáng)農(nóng)村“造血”功能,不僅有利于提升農(nóng)產(chǎn)品新鮮品質(zhì),也是促進(jìn)鄉(xiāng)村振興、農(nóng)戶收入持續(xù)穩(wěn)定增長(zhǎng)的一種產(chǎn)業(yè)延續(xù)。案例導(dǎo)入

在克里米亞戰(zhàn)爭(zhēng)期間,南丁格爾作為戰(zhàn)地護(hù)士赴前線為士兵服務(wù)。她發(fā)現(xiàn),很多病人并沒(méi)直接死于戰(zhàn)爭(zhēng),而是因?yàn)樨?fù)傷后沒(méi)得到妥善照顧,死于斑疹傷寒、痢疾、霍亂等疾病。面對(duì)這種情況,南丁格爾希望用獨(dú)特的統(tǒng)計(jì)表格,簡(jiǎn)明扼要地將這危機(jī)的情況畫(huà)出來(lái)。于是,著名的“南丁格爾玫瑰圖”應(yīng)運(yùn)而生。南丁格爾玫瑰圖是將柱圖轉(zhuǎn)化為更美觀的餅圖形式,是極坐標(biāo)化的柱圖,看似怪異卻又簡(jiǎn)單易懂。她將三種死亡情況也分別用不同顏色標(biāo)記出來(lái):藍(lán)色表示死于可預(yù)防的疾病、紅色表示死于戰(zhàn)爭(zhēng)傷害、黑色表示死于其它原因。這一可視化方式,直觀地展示了衛(wèi)生條件對(duì)死亡人數(shù)的影響,因而說(shuō)服決策者并爭(zhēng)取到了更好的醫(yī)療條件。

從該案例中,你能體會(huì)到數(shù)據(jù)可視化的魅力嗎?數(shù)據(jù)可視化又如何應(yīng)用于電商領(lǐng)域?并試著說(shuō)說(shuō)它在數(shù)據(jù)分析上所發(fā)揮的重要作用。課前自學(xué)一、數(shù)據(jù)可視化概述1.數(shù)據(jù)可視化的概念2.數(shù)據(jù)可視化的關(guān)鍵3.統(tǒng)計(jì)表格的編制規(guī)則1.數(shù)據(jù)可視化的概念數(shù)據(jù)可視化是關(guān)于數(shù)據(jù)視覺(jué)表現(xiàn)形式的科學(xué)技術(shù),它是一種利用圖形、表格、動(dòng)畫(huà)等手段將數(shù)據(jù)內(nèi)在的規(guī)律直觀地進(jìn)行展現(xiàn)的方式。數(shù)據(jù)可視化已被廣泛地應(yīng)用于各個(gè)領(lǐng)域。數(shù)據(jù)可視化已被廣泛地應(yīng)用于各個(gè)領(lǐng)域。2.數(shù)據(jù)可視化的關(guān)鍵數(shù)據(jù)可視化的關(guān)鍵在于借助圖形手段,清晰有效地傳達(dá)數(shù)據(jù)背后的規(guī)律和數(shù)據(jù)分析的結(jié)論。這并不意味著數(shù)據(jù)可視化就一定因?yàn)橐獙?shí)現(xiàn)其功能和用途而生搬硬套,或者是為了表面色彩豐富而把簡(jiǎn)單的問(wèn)題復(fù)雜化。為了有效地傳達(dá)思想、理念,需要美學(xué)形式與功能并重,直觀地傳達(dá)關(guān)鍵的內(nèi)容與特征,從而實(shí)現(xiàn)對(duì)于稀疏而復(fù)雜數(shù)據(jù)集的深入洞察。要特別注意的是,如果不能很好地把握設(shè)計(jì)與功能之間的平衡,而創(chuàng)造出華而不實(shí)的數(shù)據(jù)可視化形式,是無(wú)法達(dá)到其本質(zhì)目的——傳達(dá)與溝通信息。2.數(shù)據(jù)可視化的關(guān)鍵設(shè)計(jì)功能傳達(dá)與溝通信息3.統(tǒng)計(jì)表格的編制規(guī)則在數(shù)據(jù)描述過(guò)程中,不僅需要整理以數(shù)據(jù)形式表現(xiàn)的資料,有時(shí)也需要整理以文字形式表現(xiàn)的資料,如性別、職業(yè)、文化程度等。這些資料可以通過(guò)統(tǒng)計(jì)表來(lái)呈現(xiàn)。3.統(tǒng)計(jì)表格的編制規(guī)則統(tǒng)計(jì)表格編制規(guī)則主要包括:(1)統(tǒng)計(jì)表的欄數(shù)如果過(guò)多,要加以編號(hào),主詞和計(jì)量單位各欄用(甲)、(乙)、(丙)等文字編寫(xiě);賓詞指標(biāo)各欄則用(1)、(2)、(3)等數(shù)字編號(hào)。(2)表中數(shù)字要填寫(xiě)整齊,位數(shù)對(duì)準(zhǔn)。當(dāng)不存在這項(xiàng)數(shù)字時(shí),用符號(hào)“—”表示;當(dāng)缺乏某項(xiàng)資料時(shí),用符號(hào)“…”表示。(3)數(shù)字資料要注明計(jì)量單位。當(dāng)全表只有一種計(jì)量單位時(shí),可把它寫(xiě)在表頭的右上方。如果表中需要分別注明不同單位時(shí),橫行的計(jì)量單位可專(zhuān)設(shè)“計(jì)量單位”一欄,縱欄的計(jì)量單位可與縱標(biāo)題寫(xiě)在一起用小字標(biāo)明。(4)統(tǒng)計(jì)表的文字、數(shù)字要書(shū)寫(xiě)工整、清晰,數(shù)位要對(duì)齊。(5)某些特殊資料需要說(shuō)明的,應(yīng)在表的下方加以注解;數(shù)字資料要在表下說(shuō)明來(lái)源,以備查考。(6)統(tǒng)計(jì)表編制完畢經(jīng)審核后,制表人和主管部門(mén)負(fù)責(zé)人要簽名,并加蓋公章以示負(fù)責(zé)。二、Excel數(shù)據(jù)表格和透視表工作簿是指Excel環(huán)境中用來(lái)儲(chǔ)存并處理工作數(shù)據(jù)的文件,其擴(kuò)展名為XLS或者XLSX(2007以上版本)。每一本工作簿可以擁有許多不同的工作表,工作簿中最多可建立255個(gè)工作表工作表是顯示在工作簿窗口中的表格,一個(gè)工作表可以由1048576行和256列構(gòu)成,行的編號(hào)從1到1048576,列的編號(hào)依次用字母A、B、……、IV表示,行號(hào)顯示在工作簿窗口的左邊,列號(hào)顯示在工作簿窗口的上邊。使用工作表可以對(duì)數(shù)據(jù)進(jìn)行組織和分析??梢酝瑫r(shí)在多張工作表上輸入并編輯數(shù)據(jù),并且可以對(duì)來(lái)自不同工作表的數(shù)據(jù)進(jìn)行匯總計(jì)算。在創(chuàng)建圖表之后,既可以將其置于源數(shù)據(jù)所在的工作表上,也可以放置在單獨(dú)的圖表工作表上。二、Excel數(shù)據(jù)表格和透視表(一)常用的可視化圖表(二)數(shù)據(jù)透視表的注意事項(xiàng)(一)常用的可視化圖表簡(jiǎn)單的圖表往往能夠有效、形象、快速地傳達(dá)信息。常用的可視化圖表包括:餅圖、柱形圖、直方圖、雷達(dá)圖、折線圖、散點(diǎn)圖,這六類(lèi)圖表可以滿足大部分?jǐn)?shù)據(jù)展現(xiàn)與分析的需求。同時(shí)還能衍生出其他稍微復(fù)雜些的圖表,比如柱形圖還包括簇狀柱形圖、堆積柱形圖、百分比柱形圖等。(一)常用的可視化圖表常用的可視化圖形柱形圖折線圖雷達(dá)圖餅圖直方圖散點(diǎn)圖(一)常用的可視化圖表Excel對(duì)各類(lèi)圖表進(jìn)行了詳細(xì)的分類(lèi)歸納,可以打開(kāi)Excel,在插入圖表功能中看到Excel提供的主要圖表模板。在新版本的Excel中不斷增加圖表功能,例如:樹(shù)狀圖、旭日?qǐng)D、直方圖、箱型圖、瀑布圖、漏斗圖、地圖、組合圖等。(二)數(shù)據(jù)透視表的注意事項(xiàng)數(shù)據(jù)透視表緩存位置要求更改會(huì)同時(shí)影響兩個(gè)報(bào)表數(shù)據(jù)透視圖報(bào)表(二)數(shù)據(jù)透視表的注意事項(xiàng)1.數(shù)據(jù)透視表緩存每次在新建數(shù)據(jù)透視表或數(shù)據(jù)透視圖時(shí),Excel均將報(bào)表數(shù)據(jù)的副本存儲(chǔ)在內(nèi)存中,并將其保存為工作簿文件的一部分。這樣每張新的報(bào)表均需要額外的內(nèi)存和磁盤(pán)空間。但是,如果將現(xiàn)有數(shù)據(jù)透視表作為同一個(gè)工作簿中新報(bào)表的源數(shù)據(jù),則兩張報(bào)表就可以共享同一個(gè)數(shù)據(jù)副本。2.位置要求如果要將某個(gè)數(shù)據(jù)透視表用作其他報(bào)表的源數(shù)據(jù),則兩個(gè)報(bào)表必須位于同一工作簿中。如果源數(shù)據(jù)透視表位于另一工作簿中,則需要將源報(bào)表復(fù)制到要新建報(bào)表的工作薄位置。不同工作簿中的數(shù)據(jù)透視表和數(shù)據(jù)透視圖是獨(dú)立的,它們?cè)趦?nèi)存和工作簿文件中都有各自的數(shù)據(jù)副本。(二)數(shù)據(jù)透視表的注意事項(xiàng)3.更改會(huì)同時(shí)影響兩個(gè)報(bào)表在刷新新報(bào)表中的數(shù)據(jù)時(shí),Excel也會(huì)更新源報(bào)表中的數(shù)據(jù),反之亦然。如果對(duì)某個(gè)報(bào)表中的項(xiàng)進(jìn)行分組或取消分組,那么也將同時(shí)影響兩個(gè)報(bào)表。如果在某個(gè)報(bào)表中創(chuàng)建了計(jì)算字段或計(jì)算項(xiàng)(使用用戶創(chuàng)建的公式進(jìn)行字段或者字段中項(xiàng)的計(jì)算)也將同時(shí)影響兩個(gè)報(bào)表。4.數(shù)據(jù)透視圖報(bào)表可以基于其他數(shù)據(jù)透視表創(chuàng)建新的數(shù)據(jù)透視表或數(shù)據(jù)透視圖報(bào)表,但是不能直接基于其他數(shù)據(jù)透視圖報(bào)表創(chuàng)建報(bào)表。不過(guò),每當(dāng)創(chuàng)建數(shù)據(jù)透視圖報(bào)表時(shí),Excel都會(huì)基于相同的數(shù)據(jù)創(chuàng)建一個(gè)相關(guān)聯(lián)的數(shù)據(jù)透視表(為數(shù)據(jù)透視圖提供源數(shù)據(jù)的數(shù)據(jù)透視表)。如果更改其中一個(gè)報(bào)表的布局,另外一個(gè)報(bào)表也會(huì)隨之更改。因此,可以基于相關(guān)聯(lián)的報(bào)表創(chuàng)建一個(gè)新報(bào)表。對(duì)數(shù)據(jù)透視圖報(bào)表所做的更改將影響相關(guān)聯(lián)的數(shù)據(jù)透視表,反之亦然。三、標(biāo)簽云可視化標(biāo)簽云的定義標(biāo)簽云,又稱文字云、詞云,是對(duì)文本數(shù)據(jù)中出現(xiàn)頻率較高的“關(guān)鍵詞”在視覺(jué)上的突出呈現(xiàn),通過(guò)關(guān)鍵詞的渲染形成類(lèi)似云一樣的彩色圖片,從而一眼就可以領(lǐng)略文本數(shù)據(jù)的主要表達(dá)意思,常見(jiàn)于博客、微博、文章分析等。標(biāo)簽云是最為簡(jiǎn)單有效的文本可視化技術(shù),它可以幫助人們理解復(fù)雜文本的內(nèi)容和內(nèi)在規(guī)律等信息。課中實(shí)訓(xùn)實(shí)訓(xùn)一、圖表的制作(一)制作餅圖(二)制作柱形圖(三)制作直方圖(四)制作雷達(dá)圖(五)制作折線圖(六)制作散點(diǎn)圖(一)制作餅圖餅圖是一種用圓內(nèi)扇形的面積大小來(lái)反映統(tǒng)計(jì)分組數(shù)據(jù)的圖形,主要用于反映總體內(nèi)部的結(jié)構(gòu)及其變化,對(duì)研究結(jié)構(gòu)性問(wèn)題比較適用。餅圖通常只能用于一個(gè)數(shù)據(jù)系列,可方便比較一個(gè)總計(jì)的每個(gè)部分所占比例,其各部分百分比之和為100%,主要用來(lái)分析內(nèi)部各個(gè)組成部分對(duì)事件的影響。(一)制作餅圖下面主要介紹Excel制作餅圖的詳細(xì)過(guò)程。“環(huán)保、低脂”已成為了當(dāng)下人們對(duì)于食品最熱門(mén)的需求。某國(guó)外電商公司是一家定位于純互聯(lián)網(wǎng)食品品牌的企業(yè),為迎合消費(fèi)者的最新需求,需要對(duì)平臺(tái)的商品進(jìn)行分析,從而決定今后企業(yè)的發(fā)展方向。通過(guò)數(shù)據(jù)爬蟲(chóng)獲取網(wǎng)店上架食品的品牌名稱、商品名稱、包裝是否可回收、是否低脂等數(shù)據(jù)資料。利用Excel制作餅圖以描述平臺(tái)商品包裝是否可回收的比例。(一)制作餅圖1.制作常規(guī)餅圖打開(kāi)“數(shù)據(jù)可視化”工作簿,選擇“商品”工作表。將“包裝是否可回收”一列復(fù)制、粘貼至“餅圖”工作表。利用數(shù)據(jù)透視表將其按“FALSE”與“TRUE”值歸類(lèi)(請(qǐng)參考6.4節(jié)中關(guān)于“計(jì)數(shù)項(xiàng)值匯總”的相關(guān)操作),重新制作表格。(一)制作餅圖1.制作常規(guī)餅圖單擊“插入”選項(xiàng)卡中的“餅圖”下拉按鈕,選擇“二維餅圖”→“餅圖”選項(xiàng)。單擊“設(shè)計(jì)”選項(xiàng)卡中的“選擇數(shù)據(jù)”按鈕,打開(kāi)“選擇數(shù)據(jù)源”對(duì)話框。設(shè)置“圖表數(shù)據(jù)區(qū)域”數(shù)據(jù)區(qū)域,單擊“確定”按鈕。在“設(shè)計(jì)”選項(xiàng)卡中,選擇圖表布局和圖表樣式。將餅圖標(biāo)題設(shè)置為“平臺(tái)商品包裝是否可回收比例”。(一)制作餅圖2.制作復(fù)合型餅圖單擊“插入”選項(xiàng)卡中“餅圖”下拉按鈕,選擇“二維餅圖”→“復(fù)合餅圖”。單擊“設(shè)計(jì)”選項(xiàng)卡中的“選擇數(shù)據(jù)”按鈕,打開(kāi)“選擇數(shù)據(jù)源”對(duì)話框。設(shè)置“圖表數(shù)據(jù)區(qū)域”數(shù)據(jù)區(qū)域,單擊“確定”按鈕。(一)制作餅圖2.制作復(fù)合型餅圖右擊餅圖,在彈出的快捷菜單中選擇“設(shè)置數(shù)據(jù)系列格式”命令,打開(kāi)“設(shè)置數(shù)據(jù)系列格式”對(duì)話框。在“設(shè)置數(shù)據(jù)系列格式”對(duì)話框中,設(shè)置“第二繪圖區(qū)中的值”為“2”,單擊“關(guān)閉”按鈕。(一)制作餅圖2.制作復(fù)合型餅圖右擊餅圖,在彈出的快捷菜單中選擇“設(shè)置數(shù)據(jù)標(biāo)簽格式”命令,打開(kāi)“設(shè)置數(shù)據(jù)標(biāo)簽格式”對(duì)話框。在“設(shè)置數(shù)據(jù)標(biāo)簽格式”對(duì)話框中,單擊“數(shù)字”選項(xiàng)卡,將“類(lèi)別”設(shè)置為“百分比”,單擊“關(guān)閉”按鈕。(二)制作柱形圖柱形圖可以非常清晰地表達(dá)不同項(xiàng)目之間的差距和數(shù)值,通常用于不同時(shí)期或不同類(lèi)別數(shù)據(jù)之間的比較,也可以用來(lái)反映不同時(shí)期和不同數(shù)據(jù)的差異。柱形圖可以縱向放置條形,也可以橫向放置條形(也稱條形圖)。在縱向柱形中,通常水平軸表示分組類(lèi)別,垂直軸表示各分組類(lèi)別的數(shù)值。橫向條形圖的坐標(biāo)軸表示剛好同縱向柱形圖相反。其中,堆積柱形圖可以比較不同數(shù)值在總計(jì)中所占的比重,可選擇使用單位或百分比顯示,常用于比較總計(jì)的每個(gè)部分,看出各個(gè)組成總體的具體比重。(二)制作柱形圖下面主要介紹利用Excel制作柱形圖。仍以6.3.2節(jié)“商品”工作表為例,根據(jù)該表中的數(shù)據(jù)分析該電商平臺(tái)中品牌名稱以B開(kāi)頭的商品數(shù)量,并采用柱形圖描述,具體操作如下。打開(kāi)“數(shù)據(jù)可視化”工作簿,選擇“商品”工作表。利用數(shù)據(jù)透視表獲取不同品牌名稱的匯總數(shù)(請(qǐng)參考6.4節(jié)中關(guān)于“計(jì)數(shù)項(xiàng)值匯總”的相關(guān)操作),選擇B開(kāi)頭的字段,復(fù)制數(shù)值至“柱形圖”工作表。(二)制作柱形圖單擊“插入”選項(xiàng)卡中的“柱形圖”下拉按鈕,選擇“二維柱形圖”→“簇狀柱形圖”選項(xiàng)。單擊“設(shè)計(jì)”選項(xiàng)卡中的“選擇數(shù)據(jù)”按鈕,打開(kāi)“選擇數(shù)據(jù)源”對(duì)話框。設(shè)置“圖表數(shù)據(jù)區(qū)域”,單擊“確定”按鈕。在“設(shè)計(jì)”選項(xiàng)卡中選擇圖表布局“布局6”和圖表樣式“樣式2”。(二)制作柱形圖右擊柱狀圖,在彈出的快捷菜單中選擇“添加數(shù)據(jù)標(biāo)簽”命令。右擊數(shù)值,在彈出的快捷菜單中選擇“設(shè)置數(shù)據(jù)標(biāo)簽格式”命令,打開(kāi)“設(shè)置數(shù)據(jù)標(biāo)簽格式”對(duì)話框。(二)制作柱形圖在“設(shè)置數(shù)據(jù)標(biāo)簽格式”對(duì)話框中,單擊“數(shù)字”選項(xiàng)卡,將“類(lèi)別”設(shè)置為“數(shù)字”,“小數(shù)位數(shù)”設(shè)置為“0”,單擊“關(guān)閉”按鈕。將柱形圖標(biāo)題設(shè)置為“以B開(kāi)頭品牌名稱的商品比例”。(三)制作直方圖直方圖是各條形之間沒(méi)有間距的柱形圖。直方圖用條形的寬度和高度來(lái)表示統(tǒng)計(jì)分組數(shù)據(jù),是以組距(寬度)為底邊,以落入各組的數(shù)據(jù)頻數(shù)(高度)為依據(jù),由按比例構(gòu)成的若干矩形排列而成的圖。直方圖主要用于表示分組數(shù)據(jù)的頻數(shù)分布特征,是分析總數(shù)數(shù)據(jù)分布特征的工具之一。柱形圖和直方圖的區(qū)別:柱形圖的各矩形高度表示分組類(lèi)別的頻數(shù)多少,寬度是固定的;而直方圖的各矩形高度表示該組距內(nèi)的頻數(shù),寬度則表示組距。生成直方圖有兩種方式:一是用先對(duì)數(shù)據(jù)進(jìn)行歸類(lèi)然后使用柱形圖制作直方圖;二是直接使用Excel中提供的直方圖制作功能。(三)制作直方圖仍以6.3.2節(jié)“商品”工作表為例,打開(kāi)“數(shù)據(jù)可視化”工作簿,新建“直方圖”工作表。利用表中數(shù)據(jù),對(duì)“匯總量”一列數(shù)據(jù)進(jìn)行適當(dāng)分組,選擇合適的區(qū)間長(zhǎng)度,此處選擇區(qū)間長(zhǎng)度為5,區(qū)間個(gè)數(shù)為8,起點(diǎn)為0,終點(diǎn)為39,形成新的歸類(lèi)數(shù)據(jù)如下所示。利用直方圖分析以B開(kāi)頭品牌名稱的商品比例。(三)制作直方圖單擊“插入”選項(xiàng)卡中的“所有圖表”下拉按鈕,選擇“直方圖”選項(xiàng)。雙擊直方圖進(jìn)入設(shè)置數(shù)據(jù)系列格式。在系列選項(xiàng)中將分類(lèi)間距調(diào)整到0。(三)制作直方圖在“設(shè)置數(shù)據(jù)系列格式”對(duì)話框中選擇“邊框”選項(xiàng)卡,選中“實(shí)線”單選按鈕,將“顏色”設(shè)置為“黑色”,“寬度”設(shè)置為“0.5磅”,單擊“關(guān)閉”按鈕。修改直方圖標(biāo)題。在“設(shè)計(jì)”一欄的“添加圖表元素”中選擇“坐標(biāo)軸標(biāo)題”,設(shè)置橫縱坐標(biāo)軸名稱。(四)制作雷達(dá)圖將評(píng)價(jià)某一系統(tǒng)的各指標(biāo)要素構(gòu)成坐標(biāo)軸,再由各要素之間的數(shù)值構(gòu)成環(huán)繞的網(wǎng),就形成了雷達(dá)圖。雷達(dá)圖主要用來(lái)評(píng)估某個(gè)事件多個(gè)指標(biāo)的綜合水平,可以對(duì)多組變量進(jìn)行多種項(xiàng)目的對(duì)比,反映數(shù)據(jù)相對(duì)中心點(diǎn)和其他數(shù)據(jù)點(diǎn)的變化情況。常用于多項(xiàng)指標(biāo)的全面分析,明晰各項(xiàng)指標(biāo)變動(dòng)情況和好壞趨向。(四)制作雷達(dá)圖仍以6.3.2節(jié)“商品”數(shù)據(jù)為例,打開(kāi)“數(shù)據(jù)可視化”工作簿,新建“雷達(dá)圖”工作表。利用數(shù)據(jù)透視表,統(tǒng)計(jì)品牌名稱為“Club”、“RedSpade”、“BlueMedalSmallBrownEggs”、“GoldenLowFatWaffles”的可回收情況(請(qǐng)參考6.4節(jié)中關(guān)于“計(jì)數(shù)項(xiàng)值匯總”的相關(guān)操作)。制作雷達(dá)圖分析這些品牌的包裝可回收情況并進(jìn)行比較。(四)制作雷達(dá)圖單擊“插入”選項(xiàng)卡中的“其他圖表”下拉按鈕,選擇“雷達(dá)圖”選項(xiàng)。

單擊“設(shè)計(jì)”選項(xiàng)卡中的“選擇數(shù)據(jù)”按鈕,打開(kāi)“選擇數(shù)據(jù)源”對(duì)話框。設(shè)置“圖表數(shù)據(jù)區(qū)域”數(shù)據(jù)區(qū)域,單擊“確定”按鈕。(五)制作折線圖折線圖是用來(lái)表達(dá)數(shù)據(jù)隨時(shí)間推移而發(fā)生變化的一種圖表,可以預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì)。常通過(guò)若干條折線來(lái)繪制若干組數(shù)據(jù),判斷每組數(shù)據(jù)的峰值與谷值,以及折線變化的方向、速率和周期等特征。(五)制作折線圖仍以6.3.2節(jié)“商品”數(shù)據(jù)為例,打開(kāi)“數(shù)據(jù)可視化”工作簿,新建“折線圖”工作表。利用數(shù)據(jù)透視表,統(tǒng)計(jì)品牌名稱為“Club”、“RedSpade”、“BlueMedalSmallBrownEggs”、“GoldenLowFatWaffles”的包裝可回收商品數(shù)量(請(qǐng)參考6.4節(jié)中關(guān)于“計(jì)數(shù)項(xiàng)值匯總”的相關(guān)操作),制作折線圖分析這些品牌可回收商品數(shù)量的變化。(五)制作折線圖單擊“插入”選項(xiàng)卡中的“二維折線圖”下拉按鈕,選擇“折線圖”選項(xiàng)。單擊“設(shè)計(jì)”選項(xiàng)卡中的“選擇數(shù)據(jù)”按鈕,打開(kāi)“選擇數(shù)據(jù)源”對(duì)話框。設(shè)置“圖表數(shù)據(jù)區(qū)域”數(shù)據(jù)區(qū)域,單擊“確定”按鈕。(六)制作散點(diǎn)圖散點(diǎn)圖用來(lái)說(shuō)明若干組變量之間的相互關(guān)系,可表示因變量隨自變量變化的大致趨勢(shì)。一般呈現(xiàn)簇狀不規(guī)則的分布,可用數(shù)據(jù)點(diǎn)來(lái)說(shuō)明數(shù)據(jù)的變化趨勢(shì)、離散程度以及不同系列數(shù)據(jù)間的相關(guān)性。(六)

制作散點(diǎn)圖以下展示了某公司2018年和2019年客戶交易額量化情況,選中B、C列數(shù)據(jù)插入“散點(diǎn)圖”。有時(shí)為了便于分析,還可添加趨勢(shì)線。具體操作方法是,選中數(shù)據(jù)點(diǎn),單擊右鍵,在彈出的快捷菜單中選中“添加趨勢(shì)線”。實(shí)訓(xùn)二、利用數(shù)據(jù)透視表制作統(tǒng)計(jì)表切片操作數(shù)據(jù)透視表查看特定數(shù)據(jù)值篩選多維數(shù)據(jù)分析建立數(shù)據(jù)透視圖標(biāo)簽篩選旋轉(zhuǎn)計(jì)數(shù)項(xiàng)值匯總實(shí)訓(xùn)二、利用數(shù)據(jù)透視表制作統(tǒng)計(jì)表1.計(jì)數(shù)項(xiàng)值匯總針對(duì)6.3.2節(jié)中的商品數(shù)據(jù),利用數(shù)據(jù)透視表對(duì)不同品牌名稱的商品數(shù)量進(jìn)行匯總計(jì)數(shù)。其具體操作如下:打開(kāi)“數(shù)據(jù)可視化”工作簿,選擇“商品”工作表。單擊“插入”選項(xiàng)卡中的“數(shù)據(jù)透視表”下拉按鈕,選擇“數(shù)據(jù)透視表”選項(xiàng)。打開(kāi)“創(chuàng)建數(shù)據(jù)透視表”對(duì)話框,設(shè)置“表/區(qū)域”為數(shù)據(jù)區(qū)域,選擇將數(shù)據(jù)透視表放在“現(xiàn)有工作表”,然后單擊“確定”按鈕。實(shí)訓(xùn)二、利用數(shù)據(jù)透視表制作統(tǒng)計(jì)表頁(yè)面右側(cè)彈出“數(shù)據(jù)透視表字段列表”對(duì)話框,單擊“品牌名稱”字段并按住鼠標(biāo)左鍵將其拖曳到“行標(biāo)簽”處,因按品牌名稱進(jìn)行計(jì)數(shù),將“品牌名稱”字段拖曳到“數(shù)據(jù)”處,形成品牌名稱計(jì)數(shù)結(jié)果即不同品牌下包含的商品數(shù)量。計(jì)數(shù)項(xiàng)的匯總方式有多種形式,如“求和”“最大值”“平均值”和“方差”等;數(shù)據(jù)顯示方式也有多種,如“普通”“百分比”“占同列數(shù)據(jù)總和的百分比”和“占總和的百分比”等,這些都可以根據(jù)分析的目標(biāo)進(jìn)行選擇實(shí)訓(xùn)二、利用數(shù)據(jù)透視表制作統(tǒng)計(jì)表“計(jì)數(shù)項(xiàng):品牌名稱”一列默認(rèn)按字母順序進(jìn)行了升序排序,還可查看降序排序結(jié)果。點(diǎn)擊“行標(biāo)簽”一列白色箭頭,選擇“降序”。計(jì)數(shù)項(xiàng)顯示內(nèi)容按降序進(jìn)行排列。實(shí)訓(xùn)二、利用數(shù)據(jù)透視表制作統(tǒng)計(jì)表2.多維數(shù)據(jù)分析針對(duì)“數(shù)據(jù)透視表”工作簿中“員工”工作表的數(shù)據(jù),該工作表共有1155條記錄、17個(gè)字段,進(jìn)行其他的數(shù)據(jù)透視表操作。創(chuàng)建數(shù)據(jù)透視表,選擇將其放置在新工作表中。實(shí)訓(xùn)二、利用數(shù)據(jù)透視表制作統(tǒng)計(jì)表為分析薪水與學(xué)歷和職位之間的關(guān)系,選擇將“管理職位”和“職稱”字段放入行標(biāo)簽,將“教育水平”拖入列字段,將“薪水”放入值區(qū)域,即可得到相關(guān)表。將值字段的匯總方式由“求和”改為“平均值”,即可得到薪水的平均值情況。實(shí)訓(xùn)二、利用數(shù)據(jù)透視表制作統(tǒng)計(jì)表3.值篩選為了解平均薪水大于或等于5000的有哪些部門(mén),使用值篩選的方式。點(diǎn)擊“行標(biāo)簽”的“值篩選”,選擇“大于或等于”,輸入5000后,單擊“確定”鍵。實(shí)訓(xùn)二、利用數(shù)據(jù)透視表制作統(tǒng)計(jì)表4.標(biāo)簽篩選為了解管理層職工的信息,可點(diǎn)擊“行標(biāo)簽”的“標(biāo)簽篩選”,選擇“包含”后,輸入“Management”。實(shí)訓(xùn)二、利用數(shù)據(jù)透視表制作統(tǒng)計(jì)表5.旋轉(zhuǎn)對(duì)上一步驟得到的數(shù)據(jù)表進(jìn)行旋轉(zhuǎn)操作中的行列交換,由此可得到不同視角的數(shù)據(jù)。實(shí)訓(xùn)二、利用數(shù)據(jù)透視表制作統(tǒng)計(jì)表6.查看特定

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論