




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
4.1數(shù)據(jù)分析概述數(shù)據(jù)分析內(nèi)容概要數(shù)據(jù)分析的方法數(shù)據(jù)分析的工具數(shù)據(jù)導(dǎo)入與導(dǎo)出的方法(用Python)數(shù)據(jù)分析1.數(shù)據(jù)分析的必要性
從大量的數(shù)據(jù)中發(fā)掘有用的信息,揭示隱含其中的內(nèi)在規(guī)律,指導(dǎo)科學(xué)的推斷和決策,需要對(duì)紛繁復(fù)雜的數(shù)據(jù)進(jìn)行分析。2.數(shù)據(jù)分析的概念數(shù)據(jù)分析是運(yùn)用數(shù)據(jù)分析的工具和方法,根據(jù)研究的目的,對(duì)數(shù)據(jù)進(jìn)行深層次挖掘和分析,找出內(nèi)在的聯(lián)系和變化,從而揭示事物的本質(zhì)狀態(tài),預(yù)測(cè)事物的發(fā)展趨勢(shì)。4.1.1數(shù)據(jù)分析的方法常見(jiàn)的數(shù)據(jù)分析方法從現(xiàn)狀、原因和預(yù)測(cè)三大方面展開(kāi),數(shù)據(jù)分析目的不同,選用的分析方法也不一樣?;貧w分析法時(shí)間序列決策樹(shù)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)分析分組分析交叉分析杜邦分法結(jié)構(gòu)分析聚類(lèi)分析關(guān)聯(lián)分析漏斗圖分析矩陣關(guān)聯(lián)分析原因分析對(duì)比分析法平均分析法綜合評(píng)價(jià)分析法現(xiàn)狀分析4.1.1數(shù)據(jù)分析的方法探究:以“中學(xué)生體質(zhì)健康數(shù)據(jù)管理系統(tǒng)的數(shù)據(jù)分析”項(xiàng)目為例,請(qǐng)你利用上面的數(shù)據(jù)分析方法,從現(xiàn)狀、原因和預(yù)測(cè)三個(gè)方面的數(shù)據(jù)分析。學(xué)生身體形態(tài)、身體機(jī)能、身體素質(zhì)狀況現(xiàn)狀分析學(xué)校間,男、女生之間顯著差異的原因原因分析預(yù)測(cè)學(xué)生個(gè)體和群體體質(zhì)健康發(fā)展趨勢(shì)預(yù)測(cè)分析4.1.2數(shù)據(jù)分析的工具數(shù)據(jù)分析軟件的使用是必不可少的,數(shù)據(jù)分析的工具很多,根據(jù)分析數(shù)據(jù)層次結(jié)構(gòu)的不同,常用的數(shù)據(jù)分析軟件可分為四類(lèi)。ACCESSMySQLSQLServerOracle數(shù)據(jù)存儲(chǔ)層(數(shù)據(jù)庫(kù)技術(shù),理解SQL查詢(xún)語(yǔ)言的基本結(jié)構(gòu)和數(shù)據(jù)讀?。〤rystalReport水晶報(bào)表Tableau軟件數(shù)據(jù)報(bào)表層(報(bào)表制作、報(bào)表分析及數(shù)據(jù)可視化)Excel軟件SPSS軟件SAS軟件R語(yǔ)言Python語(yǔ)言數(shù)據(jù)分析層(統(tǒng)計(jì)分析和數(shù)據(jù)挖掘)VisioSmartDraw數(shù)據(jù)展現(xiàn)層(數(shù)據(jù)可視化)4.1.3數(shù)據(jù)導(dǎo)入與導(dǎo)出的必要性在進(jìn)行數(shù)據(jù)分析前需要從數(shù)據(jù)庫(kù)或者現(xiàn)有的數(shù)據(jù)文件中提取符合要求的數(shù)據(jù)。4.1.3數(shù)據(jù)導(dǎo)入的形式導(dǎo)入TXT文件:read_table(file,names=[列名1,列名2,…],sep=“”,…)導(dǎo)入CSV文件:read_csv(file,names=[列名1,列名2,…],sep=“”,…)參數(shù)說(shuō)明:file為文件路徑和文件名;names為列的名稱(chēng),sep為分隔符,默認(rèn)為空。TXT文件主要存儲(chǔ)文本信息。一般用記事本打開(kāi)和保存。CSV文件最早是使用在簡(jiǎn)單的數(shù)據(jù)庫(kù)里,由于其格式簡(jiǎn)單,并具備很強(qiáng)的開(kāi)放性,用來(lái)實(shí)現(xiàn)簡(jiǎn)單的數(shù)據(jù)存儲(chǔ)。4.1.3數(shù)據(jù)導(dǎo)入的形式導(dǎo)入Excel文件:①read_excel(file,sheetname,header=0)
②ExcelFile(file).parse(sheetname)參數(shù)說(shuō)明:file為文件路徑和文件名;sheetname為表格的名稱(chēng),如sheet1。Excel文件為Office里面的電子表格文件。探究活動(dòng)1:數(shù)據(jù)的導(dǎo)入導(dǎo)入本地學(xué)習(xí)資源包“test4-1.xlsx”文件。4.1.3數(shù)據(jù)導(dǎo)入的形式導(dǎo)入MySQL庫(kù):read_sql(sql,con=數(shù)據(jù)庫(kù))參數(shù)說(shuō)明:sql為需要執(zhí)行的sql語(yǔ)句;con為連接數(shù)據(jù)庫(kù)所需的engine,而engine需要在導(dǎo)入之前建立,包含數(shù)據(jù)庫(kù)的用戶名、密碼、地址、端口號(hào)及數(shù)據(jù)庫(kù)名稱(chēng)。MySQL庫(kù)是一個(gè)關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)。4.1.4數(shù)據(jù)導(dǎo)出的形式導(dǎo)出CSV文件:to_csv(file_path,sep=“,”,index=TRUE,header=TRUE)。導(dǎo)出Excel文件:to_excel(file_path,index=TRUE,header=TRUE)導(dǎo)出MySQL庫(kù):to_sql(tableName,con=數(shù)據(jù)庫(kù)鏈接)參數(shù)說(shuō)明:file_path為文件路徑;sep為分隔符,默認(rèn)為空;index,header默認(rèn)為T(mén)RUE,導(dǎo)出索引和列名
。探究活動(dòng)2:數(shù)據(jù)的導(dǎo)入與導(dǎo)出導(dǎo)入本地學(xué)習(xí)資源包“test4-1.xlsx”文件,嘗試將“標(biāo)準(zhǔn)分”與“附加分”相加得到“總分”,生成Excel文件并保存。兩種數(shù)據(jù)導(dǎo)入的對(duì)比除了語(yǔ)法外,沒(méi)有什么特別的區(qū)別。從技術(shù)上講,Excelfile是一個(gè)類(lèi),而read_excel是一個(gè)函數(shù)。使用ExcelFile.parse,你只需傳遞Excelfile對(duì)象。因此,excel工作表僅加載一次,就可以使用它來(lái)獲取數(shù)據(jù)。而read_excel,傳遞路徑不是Excelfile對(duì)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 以職業(yè)能力為導(dǎo)向:高職公共英語(yǔ)教學(xué)改革的探索與實(shí)踐
- 醫(yī)護(hù)人員違紀(jì)違法懺悔錄心得體會(huì)
- 養(yǎng)老院防火應(yīng)急預(yù)案范文
- 2025年小學(xué)秋季少先隊(duì)隊(duì)伍建設(shè)計(jì)劃
- 2025年春季學(xué)期小學(xué)少先隊(duì)關(guān)愛(ài)幫扶計(jì)劃
- 醫(yī)療機(jī)構(gòu)員工培訓(xùn)計(jì)劃
- 吉林食品加工管理辦法
- 福清公司賬目管理辦法
- 小區(qū)集資電梯管理辦法
- 撰寫(xiě)專(zhuān)項(xiàng)資金管理辦法
- GB/T 17145-2024廢礦物油回收與再生利用導(dǎo)則
- 小學(xué)數(shù)學(xué)課件和復(fù)習(xí)
- 普通高中生物學(xué)課程標(biāo)準(zhǔn)-(2024修訂版)
- 2024年山東濟(jì)南初中學(xué)業(yè)水平考試生物試卷真題(含答案解析)
- 住院患者心理需要及護(hù)理
- 空調(diào)設(shè)備吊裝與安裝方案
- 2024年寧夏中考生物真題卷及答案解析
- 公共體育場(chǎng)建設(shè)項(xiàng)目可行性研究報(bào)告
- 光纖通信系統(tǒng)(第3版) 課件 第1-3章 概述、光纖與光纜、光源和光發(fā)送機(jī)
- 貸款車(chē)電子合同模板
- 高空作業(yè)車(chē)外墻施工方案
評(píng)論
0/150
提交評(píng)論