




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第八章
數(shù)據(jù)分析概述在此輸入副標題·
數(shù)據(jù)分析的背景·什么是數(shù)據(jù)分析·數(shù)據(jù)分析的流程·為什么選擇Python做數(shù)據(jù)分析·
Anaconda的安裝和使用·常見的數(shù)據(jù)分析工具了解熟悉掌握掌握
1234學(xué)習(xí)目標掌握Anaconda與JupyterNotebook的使用了解
數(shù)據(jù)分析的背景,應(yīng)用場景熟悉常見的數(shù)據(jù)分析工具掌握數(shù)據(jù)分析的流程8.18.28.38.48.58.6目錄CONTENTS8.78.8數(shù)據(jù)分析的背景什么是數(shù)據(jù)分析數(shù)據(jù)分析的應(yīng)用場景數(shù)據(jù)分析的流程為什么選擇Python做數(shù)據(jù)分析創(chuàng)建新的Python環(huán)境—Anaconda啟用JupyterNotebook常見的數(shù)據(jù)分析工具
第一部分PART018.1數(shù)據(jù)分析的背景隨著計算機技術(shù)全面地融入社會生活,網(wǎng)絡(luò)數(shù)據(jù)得到了爆發(fā)性地增長,驅(qū)使著人們進入了一個嶄新的大數(shù)據(jù)時代。8.1數(shù)據(jù)分析的背景思考:數(shù)據(jù)庫里面的數(shù)據(jù)這么多,怎么快速地拿到有價值的數(shù)據(jù)呢?8.1數(shù)據(jù)分析的背景數(shù)據(jù)分析就可以從海量數(shù)據(jù)中獲得潛藏的有價值的信息,幫助企業(yè)或個人預(yù)測未來的趨勢和行為。8.1數(shù)據(jù)分析的背景不管你從事什么行業(yè),掌握了數(shù)據(jù)分析能力,往往在其崗位上更有競爭力。結(jié)論8.1數(shù)據(jù)分析的背景
第二部分PART028.2什么是數(shù)據(jù)分析思考:什么是數(shù)據(jù)分析呢?8.2什么是數(shù)據(jù)分析數(shù)據(jù)分析是使用適當(dāng)?shù)慕y(tǒng)計分析方法對收集來的大量數(shù)據(jù)進行分析,從中提取有用信息和形成結(jié)論,并加以詳細研究和概括總結(jié)的過程。數(shù)據(jù)分析的目的在于,將隱藏在一大批看似雜亂無章的數(shù)據(jù)信息集中提煉出來有用的數(shù)據(jù),以找出所研究對象的內(nèi)在規(guī)律。8.2什么是數(shù)據(jù)分析在統(tǒng)計學(xué)領(lǐng)域中,數(shù)據(jù)分析可以劃分為如下三類:描述性數(shù)據(jù)分析從一組數(shù)據(jù)中,可以摘要并且描述這份數(shù)據(jù)的集中和離散情形。探索性數(shù)據(jù)分析從海量數(shù)據(jù)中找出規(guī)律,并產(chǎn)生分析模型和研究假設(shè)。驗證性數(shù)據(jù)分析驗證科研假設(shè)測試所需的條件是否達到,以保證驗證性分析的可靠性。8.2什么是數(shù)據(jù)分析
第三部分PART038.3數(shù)據(jù)分析的應(yīng)用場景營銷方面的應(yīng)用通過會員卡形式獲得消費者的個人信息,以便對消費者的購買信息進一步研究其購買習(xí)慣,發(fā)現(xiàn)各類有價值的目標群體。8.3數(shù)據(jù)分析的應(yīng)用場景醫(yī)療方面的應(yīng)用醫(yī)生通過記錄和分析嬰兒的心跳來監(jiān)視早產(chǎn)嬰兒和患病嬰兒的情況,并針對嬰兒的身體可能會出現(xiàn)的不適癥狀做出預(yù)測,這樣可以幫助醫(yī)生更好的救助患兒。8.3數(shù)據(jù)分析的應(yīng)用場景零售方面的應(yīng)用在美國零售業(yè)曾經(jīng)有這樣一個傳奇故事,某家商店將紙尿褲和啤酒并排放在一起銷售,結(jié)果紙尿褲和啤酒的銷量雙雙增長!8.3數(shù)據(jù)分析的應(yīng)用場景網(wǎng)絡(luò)安全方面的應(yīng)用新型的病毒防御系統(tǒng)可以使用數(shù)據(jù)分析技術(shù),建立潛在攻擊識別分析模型,監(jiān)測大量網(wǎng)絡(luò)活動數(shù)據(jù)和相應(yīng)的訪問行為,識別可能進行入侵的可疑模式。8.3數(shù)據(jù)分析的應(yīng)用場景交通物流方面的應(yīng)用用戶可以通過業(yè)務(wù)系統(tǒng)和GPS定位系統(tǒng)獲得數(shù)據(jù),使用數(shù)據(jù)構(gòu)建交流狀況預(yù)測分析模型,有效預(yù)測實時路況、物流狀況、車流量、貨物吞吐量,進而提前補貨,制定庫存管理策略。8.3數(shù)據(jù)分析的應(yīng)用場景
第四部分PART048.4數(shù)據(jù)分析的流程數(shù)據(jù)分析大致可以分為以下五個階段:要解決什么業(yè)務(wù)問題?收集與整合數(shù)據(jù)數(shù)據(jù)進行清洗、加工和整理對數(shù)據(jù)進行探索與分析以圖表來展現(xiàn)分析結(jié)果8.4數(shù)據(jù)分析的流程
第五部分PART058.5為什么選擇Python做數(shù)據(jù)分析思考?為什么選擇Python做數(shù)據(jù)分析?
8.5為什么選擇Python做數(shù)據(jù)分析選擇Python做數(shù)據(jù)分析,主要考慮的是Python具有以下優(yōu)勢:方便對接其它語言8.5為什么選擇Python做數(shù)據(jù)分析語法簡單精煉,適合初學(xué)者入門擁有一個巨大且活躍的科學(xué)計算社區(qū)擁有強大的通用編程能力人工智能時代的通用語言
第六部分PART068.6創(chuàng)建新的Python環(huán)境—AnacondaAnaconda是一個可以便捷獲取和管理包,同時對環(huán)境可以統(tǒng)一管理的發(fā)行版本。包含了眾多流行的科學(xué)、數(shù)學(xué)、工程和數(shù)據(jù)分析的Python庫完全開源和免費對于學(xué)術(shù)用途,可以申請免費的License全平臺支持Linux、Windows、MacOSX8.6.1Anaconda發(fā)行版本概述我們推薦數(shù)據(jù)分析的初學(xué)者安裝Anaconda進行學(xué)習(xí)8.6.1Anaconda發(fā)行版本概述(1)在瀏覽器的地址欄中輸入/download/進入Anaconda的官方網(wǎng)站。8.6.2在Windows系統(tǒng)中安裝Anaconda(2)單擊Windows系統(tǒng)下“Python3.11版本”的安裝程序進行下載。8.6.2在Windows系統(tǒng)中安裝Anaconda(3)建議采用默認安裝路徑,在指定完安裝路徑后,持續(xù)點擊下一步,窗口會提示是否勾選如下復(fù)選框選項。8.6.2在Windows系統(tǒng)中安裝Anaconda(4)安裝完成以后,在系統(tǒng)左下角的【開始菜單】->【所有程序】中找到Anaconda3文件夾,可以看到該目錄下包含了多個組件。8.6.2在Windows系統(tǒng)中安裝Anaconda(5)AnacondaNavigator成功打開后的首頁界面如下圖所示。8.6.2在Windows系統(tǒng)中安裝AnacondaAnaconda集成了常用的擴展包,能夠方便地對這些擴展包進行管理,比如安裝和卸載包,這些操作都需要依賴conda。conda是一個在Windows、MacOS和Linux上運行的開源軟件包管理系統(tǒng)和環(huán)境管理系統(tǒng),可以快速地安裝、運行和更新軟件包及其依賴項。8.6.3通過Anaconda管理Python包在Windows系統(tǒng)下,用戶可以在AnacondaPrompt中通過命令檢測conda是否被安裝。>>>(base)C:\Users\admin>conda--versionconda4.5.4如果希望快速了解如何使用conda命令管理包,則可以在AnacondaPrompt中輸入“conda-h”或“conda--help”命令來查看幫助文檔。8.6.3通過Anaconda管理Python包使用list命令可以獲取當(dāng)前環(huán)境中已經(jīng)安裝的包信息。>>>condalist執(zhí)行上述命令后,終端會顯示當(dāng)前環(huán)境下已安裝的包名及版本號。8.6.3通過Anaconda管理Python包使用search命令可以查找可供安裝的包。>>>condasearch--full-name包的全名上述命令中,--full-name為精確查找的參數(shù),后面緊跟的是包的全名。8.6.3通過Anaconda管理Python包如果希望在指定的環(huán)境中進行安裝,則可以在install
命令的后面顯式地指定環(huán)境名稱。>>>condainstall--nameenv_namepackage_name上述命令中,env_name參數(shù)表示包安裝的環(huán)境名稱,package_name表示將要安裝的包名稱。8.6.3通過Anaconda管理Python包如果要在指定的環(huán)境中卸載包,則可以在指定環(huán)境下使用remove命令進行移除。>>>condaremove--nameenv_namepackage_name如果要卸載當(dāng)前環(huán)境中的包,可以直接使用remove命令進行卸載。8.6.3通過Anaconda管理Python包更新當(dāng)前環(huán)境下所有的包,可使用如下命令完成:>>>condaupdate--all8.6.3通過Anaconda管理Python包如果只想更新某個包或某些包,則直接在update命令的后面加上包名即可,多個包之間使用空格隔開。>>>condaupdatepandasnumpymatplotlib8.6.3通過Anaconda管理Python包Miniconda,它是最小的conda安裝環(huán)境,只包含最基本的Python與conda以及相關(guān)的必須依賴項。對于空間要求嚴格的用戶,Miniconda是一種選擇,它只包含了最基本的庫,其它的庫需要自己手動安裝。8.6.3通過Anaconda管理Python包
第七部分PART078.7啟用JupyterNotebook在“開始菜單”中打開Anaconda3目錄,找到并單擊“JupyterNotebook”會彈出啟動窗口。8.7.1啟動Anaconda自帶的JupyterNotebook同時,系統(tǒng)默認的瀏覽器會彈出如下頁面。8.7.1啟動Anaconda自帶的JupyterNotebook上圖是瀏覽器中打開的JupyterNotebook主界面,默認打開和保存的目錄為C:\Users\當(dāng)前用戶名。8.7.1啟動Anaconda自帶的JupyterNotebook除了上述的啟動方式外,還可以用命令行打開,這種方式可以控制JupyterNotebook的顯示和保存路徑,是推薦的啟動方式。8.7.1啟動Anaconda自帶的JupyterNotebook
點擊主界面中右上方的“New”按鈕,打開如圖所示的下拉列表,選擇Folder,創(chuàng)建名為“AnacondaProjects”的文件夾。8.7.2JupyterNotebook界面詳解
單擊“AnacondaProjects”進入該目錄,繼續(xù)單擊右上方的“New”按鈕,選擇“Python3”,創(chuàng)建一個基于Python3的筆記本。8.7.2JupyterNotebook界面詳解打開新建的筆記本,可以看到Notebook的界面。8.7.2JupyterNotebook界面詳解標題欄菜單欄快捷鍵編輯區(qū)域單元格編輯和運行代碼選中單元格,按下“Enter”鍵進入單元格的編輯模式,此時可以輸入任意代碼并執(zhí)行。8.7.3JupyterNotebook的基本使用編輯和運行代碼接著,在新的單元格中輸入如下代碼:foriinrange(5):print(i)8.7.3JupyterNotebook的基本使用編輯和運行代碼再次運行后,筆記本的編輯界面如圖所示。8.7.3JupyterNotebook的基本使用編輯和運行代碼除此之外,還可以修改之前的單元格,對其重新運行。8.7.3JupyterNotebook的基本使用設(shè)置標題選中最上面的單元格,單擊【Insert】->【InsertCellAbove】在單元格的上方插入一個新的單元格。8.7.3JupyterNotebook的基本使用設(shè)置標題在快捷鍵按鈕區(qū)域中找到設(shè)置單元格類型的下拉框,單擊打開下拉列表,選擇“Heading”將單元格變?yōu)闃祟}單元格,彈出如下窗口。8.7.3JupyterNotebook的基本使用設(shè)置標題在Markdown單元格中,以一個#字符開頭的文本表示一級標題,以兩個#字符開頭的文本表示二級標題。8.7.3JupyterNotebook的基本使用導(dǎo)出功能JupyterNotebook還有另一個強大的功能,就是導(dǎo)出功能,它可以將筆記本導(dǎo)出為多種格式。8.7.3JupyterNotebook的基本使用
第八部分PART088.8常見的數(shù)據(jù)分析工具Python本身的數(shù)據(jù)分析功能并不強,需要安裝一些第三方的擴展庫來增強它的能力。NumPyPandasMatplot
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Module7 Unit1 He spent about twenty-one hours in space(教學(xué)設(shè)計)-2023-2024學(xué)年外研版(三起)英語六年級下冊
- 華北理工大學(xué)冀唐學(xué)院《研究型建筑設(shè)計》2023-2024學(xué)年第二學(xué)期期末試卷
- 山西國際商務(wù)職業(yè)學(xué)院《計算機組成原理理論》2023-2024學(xué)年第二學(xué)期期末試卷
- 哈爾濱鐵道職業(yè)技術(shù)學(xué)院《班級活動的組織》2023-2024學(xué)年第二學(xué)期期末試卷
- 遼寧民族師范高等??茖W(xué)?!稒C電系統(tǒng)設(shè)計與控制》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣州東華職業(yè)學(xué)院《海洋生物技術(shù)綜合實驗》2023-2024學(xué)年第二學(xué)期期末試卷
- 南昌大學(xué)科學(xué)技術(shù)學(xué)院《新編大學(xué)生安全教育》2023-2024學(xué)年第二學(xué)期期末試卷
- 河北科技師范學(xué)院《西方財務(wù)會計雙語》2023-2024學(xué)年第二學(xué)期期末試卷
- 共青科技職業(yè)學(xué)院《學(xué)前兒童保育學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 陜西理工大學(xué)《數(shù)字信號處理》2023-2024學(xué)年第二學(xué)期期末試卷
- 醫(yī)師定期考核人文醫(yī)學(xué)考試題庫500題(含參考答案)
- 三年級全一冊《勞動與技術(shù)》第二單元 活動1《包書皮》課件
- 讀書分享課件:《一句頂一萬句》
- 物業(yè)消防安全管理培訓(xùn)【共54張課件】
- 空心杯電機基礎(chǔ)知識
- DL-T+5839-2021土石壩安全監(jiān)測系統(tǒng)施工技術(shù)規(guī)范
- 歷年交管12123駕照學(xué)法減分復(fù)習(xí)題庫帶答案下載
- 人教鄂教版-科學(xué)-三年級下冊-知識點
- 2024-2034年中國注射用賴氨匹林行業(yè)市場競爭格局及投資前景展望報告
- 供應(yīng)鏈可持續(xù)采購實踐
- 菌菇智慧方艙栽培及食用菌菌包中心生產(chǎn)基地項目可行性研究報告
評論
0/150
提交評論