python數(shù)據(jù)分析過程例如_第1頁
python數(shù)據(jù)分析過程例如_第2頁
python數(shù)據(jù)分析過程例如_第3頁
python數(shù)據(jù)分析過程例如_第4頁
python數(shù)據(jù)分析過程例如_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

本文格式為Word版,下載可任意編輯——python數(shù)據(jù)分析過程例如引言

幾年后發(fā)生了。在使用SAS工作超過5年后,我決定走出自己的舒適區(qū)。作為一個(gè)數(shù)據(jù)科學(xué)家,我尋覓其他有用的工具的旅程開始了!幸運(yùn)的是,沒過多久我就決定,Python作為我的開胃菜。

我總是有一個(gè)編寫代碼的傾向。這次我做的是我真正喜歡的。代碼。原來,寫代碼是如此簡單!

我一周內(nèi)學(xué)會了Python基礎(chǔ)。并且,從那時(shí)起,我不僅深度摸索了這門語言,而且也幫助了大量人學(xué)習(xí)這門語言。Python是一種通用語言。但是,多年來,具有強(qiáng)大的社區(qū)支持,這一語言已經(jīng)有了專門的數(shù)據(jù)分析和預(yù)計(jì)模型庫。

由于Python缺乏數(shù)據(jù)科學(xué)的資源,我決定寫這篇教程來幫助別人更快地學(xué)習(xí)Python。在本教程中,我們將講授一點(diǎn)關(guān)于如何使用Python進(jìn)行數(shù)據(jù)分析的信息,咀嚼它,直到我們覺得舒適并可以自己去實(shí)踐。

目錄

1.數(shù)據(jù)分析的Python基礎(chǔ)

o為什么學(xué)Python用來數(shù)據(jù)分析

oPython2.7v/s3.4

o怎樣安裝Python

o在Python上運(yùn)行一些簡單程序

2.Python的庫和數(shù)據(jù)結(jié)構(gòu)

oPython的數(shù)據(jù)結(jié)構(gòu)

oPython的迭代和條件結(jié)構(gòu)

oPython庫

3.在Python中使用Pandas進(jìn)行摸索性分析

o序列和數(shù)據(jù)框的簡介

o分析Vidhya數(shù)據(jù)集——貸款的預(yù)計(jì)問題

4.在Python中使用Pandas進(jìn)行數(shù)據(jù)再加工5.使用Python中建立預(yù)計(jì)模型

o規(guī)律回歸

o決策樹

o隨機(jī)森林

讓我們開始吧

1.數(shù)據(jù)分析的Python基礎(chǔ)

為什么學(xué)Python用來數(shù)據(jù)分析

好多人都有興趣選擇Python作為數(shù)據(jù)分析語言。這一段時(shí)間以來,我有比較過SAS和R。這里有一些原因來支持學(xué)習(xí)Python:

?

開源——免費(fèi)安裝

?極好的在線社區(qū)

?很簡單學(xué)習(xí)

?可以成為一種通用的語言,用于基于Web的分析產(chǎn)品數(shù)據(jù)科學(xué)和生產(chǎn)中。

不用說,它依舊有幾個(gè)缺點(diǎn):

?

它是一種解釋性的語言,而不是編譯的語言,因此可能占用更多的CPU時(shí)間。然而,由于它節(jié)省了程序員的時(shí)間(由于學(xué)習(xí)的便利),它可能依舊是一個(gè)很好的選擇。

Python2.7v/s3.4

這是關(guān)于Python的一個(gè)最具爭議的話題。你可能總是不能避免遇到,特別是假使你是一個(gè)初學(xué)者。這里沒有正確/錯(cuò)誤的選擇。它完全取決于具體狀況和你的需要。我會嘗試給你一些建議,以幫助你做出明智的選擇。

為什么選擇Python2.7

1.極好的社區(qū)支持!這是你在初期需要的東西。Python2發(fā)行于2000年末,已經(jīng)被

使用超過15年。

2.好多第三方庫!雖然大量庫已經(jīng)提供了3.X的支持,但依舊有大量的模塊只工作在

2.X。假使你計(jì)劃將Python用于具體的應(yīng)用,如Web開發(fā)這種高度依靠外部模塊的,你選擇2.7可能會更好。

3.3.X版本的一些特性有向后兼容性,可以使用2.7版本。

為什么選擇Python3.4

1.更整齊和更快!Python開發(fā)者修正了一些固有的問題和小缺點(diǎn),以此為未來建立

一個(gè)強(qiáng)大的基礎(chǔ)。這些可能不是很相關(guān),但最終會很重要。

2.這是未來!2.7是2.X族發(fā)布的最終一個(gè)版本,并且最終每個(gè)人都要轉(zhuǎn)移到3.X版

本。Python3在過去5年已經(jīng)發(fā)布的穩(wěn)定版本,并將繼續(xù)。

沒有明確的贏家,但我想,底線是,你應(yīng)當(dāng)專注于學(xué)習(xí)Python語言。版本之間的轉(zhuǎn)換應(yīng)當(dāng)只是一個(gè)時(shí)間問題。敬請期待,不久的將來一個(gè)專門對比Python2.X和3X的文章!

怎樣安裝Python

有兩種方法安裝Python

?

你可以直接從項(xiàng)目網(wǎng)站下載Python,然后單獨(dú)安裝你想要的組件和庫

?或者,你可以下載并安裝一個(gè)包,它附帶了預(yù)裝的庫。我建議您下載Anaconda。另一種選擇是EnthoughtCanopyExpress。

其次種方法提供了一個(gè)避免麻煩的安裝,因此我會推薦給初學(xué)者。這種方法是你必需等待整個(gè)包進(jìn)行升級,即使你只是對一個(gè)單一的庫的最新版本感興趣。它應(yīng)當(dāng)不重要,直到和除非,直到和除非,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論