機(jī)器學(xué)習(xí)初學(xué)者最常見(jiàn)的5個(gè)錯(cuò)誤_第1頁(yè)
機(jī)器學(xué)習(xí)初學(xué)者最常見(jiàn)的5個(gè)錯(cuò)誤_第2頁(yè)
機(jī)器學(xué)習(xí)初學(xué)者最常見(jiàn)的5個(gè)錯(cuò)誤_第3頁(yè)
機(jī)器學(xué)習(xí)初學(xué)者最常見(jiàn)的5個(gè)錯(cuò)誤_第4頁(yè)
機(jī)器學(xué)習(xí)初學(xué)者最常見(jiàn)的5個(gè)錯(cuò)誤_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

機(jī)器學(xué)習(xí)初學(xué)者最常見(jiàn)的5個(gè)錯(cuò)誤機(jī)器學(xué)習(xí)初學(xué)者最常見(jiàn)的5個(gè)錯(cuò)誤機(jī)器學(xué)習(xí)初學(xué)者最常見(jiàn)的5個(gè)錯(cuò)誤我一直在幫助初學(xué)者入門(mén)機(jī)器學(xué)習(xí),但我也一直看到初學(xué)者在思想和行動(dòng)上屢屢犯錯(cuò)。在這篇文章中,你將看到我總結(jié)的初學(xué)者上手機(jī)器學(xué)習(xí)時(shí)最常出現(xiàn)的5種錯(cuò)誤。我堅(jiān)定地認(rèn)為任何人都可以入門(mén)機(jī)器學(xué)習(xí)并且很好地應(yīng)用它們。希望這篇文章能夠幫助你避開(kāi)或解決你學(xué)習(xí)和實(shí)踐中的一些錯(cuò)誤。一、不要從理論開(kāi)始入手傳統(tǒng)的機(jī)器學(xué)習(xí)教學(xué)是自下而上的:努力掌握數(shù)學(xué)背景知識(shí)努力學(xué)習(xí)機(jī)器學(xué)習(xí)理論努力從頭開(kāi)始實(shí)現(xiàn)算法最后開(kāi)始使用機(jī)器學(xué)習(xí)(這是你的目標(biāo))這種方法非常慢,而且很困難。這是為想要拓展該領(lǐng)域前沿的學(xué)者設(shè)計(jì)的,并不適合只是想要得到結(jié)果的實(shí)踐者.如果你在想以下問(wèn)題,你就掉入了這個(gè)陷阱:我需要先完成線性代數(shù)的課程;我需要回去先拿個(gè)博士學(xué)位;我必須先讀完教科書(shū)。避開(kāi)陷阱4年的數(shù)學(xué)或深?yuàn)W的算法理論學(xué)習(xí)能夠怎樣幫助你實(shí)現(xiàn)目標(biāo)?你多半會(huì)停下來(lái)。會(huì)失敗。不會(huì)離你的目標(biāo)更進(jìn)一步.解決的方法是鼓搗模型。如果機(jī)器學(xué)習(xí)對(duì)市場(chǎng)的有價(jià)值的貢獻(xiàn)是準(zhǔn)確的預(yù)測(cè),那么你就學(xué)習(xí)對(duì)問(wèn)題進(jìn)行建模并得出準(zhǔn)確的預(yù)測(cè)吧.就從現(xiàn)在開(kāi)始!然后努力掌握它,做到非常擅長(zhǎng).如果你需要,就閱讀、竊取、收割別人的理論,但你只需要你的目標(biāo)所需要的——只要它能幫助你實(shí)現(xiàn)更好的價(jià)值。二、不要學(xué)習(xí)所有的機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)是一個(gè)非常大的研究領(lǐng)域。它是指計(jì)算機(jī)學(xué)習(xí)過(guò)程的自動(dòng)化,與人工智能有很大的交疊.從深?yuàn)W的學(xué)習(xí)理論到機(jī)器人技術(shù)-—這個(gè)領(lǐng)域的范圍非常廣.你不可能將它們整個(gè)拿下.陷阱如果你在想下面這些,你就落套了:我需要學(xué)習(xí)一個(gè)新網(wǎng)站上提到的每一種新技術(shù);我首先需要學(xué)習(xí)計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、語(yǔ)音等等;我需要了解每項(xiàng)技術(shù)的每個(gè)方面。避開(kāi)陷阱選擇一個(gè)小方向并且保持專注.然后進(jìn)一步收窄。機(jī)器學(xué)習(xí)中最有價(jià)值的領(lǐng)域是預(yù)測(cè)建?!?jiǎng)?chuàng)建數(shù)據(jù)的模型以做出預(yù)測(cè).就從這里開(kāi)始。接下來(lái),專注于一種與你最相關(guān)或你最感興趣的預(yù)測(cè)建模.然后保持專注。也許你是根據(jù)技術(shù)選擇的(比如深度學(xué)習(xí)),也許你是根據(jù)問(wèn)題類(lèi)型選擇的(比如推薦系統(tǒng));也許你不確定,只是隨便選了一個(gè)。不管怎樣,努力掌握它或至少做到精通。接下來(lái)才開(kāi)始進(jìn)入下一個(gè)領(lǐng)域。三、不要在算法上花費(fèi)太多時(shí)間機(jī)器學(xué)習(xí)實(shí)際上就是算法。算法實(shí)在太多了。每一個(gè)算法都是一個(gè)復(fù)雜的系統(tǒng)而且擁有自己的小研究領(lǐng)域和生態(tài)系統(tǒng)。你可以將自己迷失在算法之中,這么做的人被稱為學(xué)者。陷阱如果你在說(shuō)這些,你就已經(jīng)在陷阱里了:在我使用它之前我需要知道它的工作原理;我首先需要深入理解超參數(shù);在進(jìn)行微調(diào)時(shí),我需要解釋其因果關(guān)系.避開(kāi)陷阱算法并非結(jié)果.它們只是實(shí)現(xiàn)結(jié)果的方法。事實(shí)上,機(jī)器學(xué)習(xí)算法是一種商品.切換它們。在你的問(wèn)題上實(shí)驗(yàn)各種各樣的算法.你可以對(duì)其中一些進(jìn)行調(diào)節(jié),但不要把自己困在這一步.使用一個(gè)系統(tǒng)過(guò)程(systematicprocess)。設(shè)計(jì)調(diào)試實(shí)驗(yàn)并將它們的執(zhí)行和分析自動(dòng)化。機(jī)器學(xué)習(xí)的關(guān)鍵是好好利用算法,而應(yīng)用算法不只是鼓搗算法本身.你的目標(biāo)應(yīng)該是為每一個(gè)項(xiàng)目得出一個(gè)結(jié)果——一組預(yù)測(cè)或一個(gè)能給出預(yù)測(cè)的模型。四、不要從頭開(kāi)始實(shí)現(xiàn)所有東西從頭開(kāi)始實(shí)現(xiàn)算法能夠教會(huì)你很多東西。有時(shí)候你需要實(shí)現(xiàn)一項(xiàng)技術(shù),因?yàn)闆](méi)有合適的或可用的實(shí)現(xiàn)。但是,通常來(lái)說(shuō),你不一定要也不應(yīng)該這么做。很抱歉地說(shuō):你的實(shí)現(xiàn)結(jié)果可能很糟糕.有各種漏洞速度很慢非常吃內(nèi)存無(wú)法很好地解決邊緣情況甚至可能是錯(cuò)的陷阱如果你在做下面這些事,你已經(jīng)掉入陷阱了:你在編寫(xiě)載入CSV文件的代碼(搞什么鬼???);你在編寫(xiě)線性回歸這種標(biāo)準(zhǔn)算法的代碼;你在編寫(xiě)用于交叉驗(yàn)證或超參數(shù)調(diào)整的代碼.避開(kāi)陷阱別這么做就好了!使用一個(gè)已被成千上萬(wàn)的開(kāi)發(fā)者所使用過(guò)的能夠處理所有邊緣情況的庫(kù),眾所周知它是正確的;使用一個(gè)經(jīng)過(guò)了高度優(yōu)化的庫(kù),它能充分利用你的硬件的每一個(gè)計(jì)算周期和你的內(nèi)存的每一個(gè)字節(jié);為你的項(xiàng)目使用一個(gè)圖形用戶界面,從而完全避開(kāi)代碼。每次都自己實(shí)現(xiàn)你想要使用的算法是非常緩慢的入門(mén)機(jī)器學(xué)習(xí)的方式.如果你是為了學(xué)習(xí)而實(shí)現(xiàn)它們,那么就要對(duì)自己誠(chéng)實(shí):你的實(shí)現(xiàn)還不夠好,你不能通過(guò)這樣應(yīng)用機(jī)器學(xué)習(xí)來(lái)帶來(lái)價(jià)值.五、不要總改變使用的工具目前有很多的很棒的機(jī)器學(xué)習(xí)工具。事實(shí)上,很棒的工具加上數(shù)據(jù)的可用性和更快的硬件使得機(jī)器學(xué)習(xí)的復(fù)興成為了可能。但你可能陷入這樣一個(gè)坑中:跳入每個(gè)你偶然發(fā)現(xiàn)的新工具中.陷阱如果發(fā)現(xiàn)自己符合以下三點(diǎn)那你就陷入了該陷阱中:使用每個(gè)你聽(tīng)到過(guò)的新工具發(fā)現(xiàn)自己每周或每個(gè)月都學(xué)習(xí)一項(xiàng)新工具或語(yǔ)言學(xué)習(xí)一個(gè)庫(kù)時(shí)半途而廢并轉(zhuǎn)向新的庫(kù)避開(kāi)陷阱有策略的學(xué)習(xí)和使用新工具,在解決機(jī)器學(xué)習(xí)問(wèn)題的系統(tǒng)處理過(guò)程中融合你學(xué)到的新工具。如果你選擇一個(gè)主要的大型平臺(tái)并堅(jiān)持使用它,那在解決機(jī)器學(xué)習(xí)問(wèn)題時(shí)會(huì)更加高效,至少也要足夠精通該平臺(tái)。這里我推薦3個(gè)頂尖的平臺(tái):WekaWorkbenchPythonEcosystemRPlatform該領(lǐng)域也有其他的更專門(mén)化的工具,根

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論