



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
11個(gè)機(jī)器學(xué)習(xí)開源項(xiàng)目隨著機(jī)器學(xué)習(xí)越來越受到開發(fā)者關(guān)注,出現(xiàn)了很多機(jī)器學(xué)習(xí)的開源項(xiàng)目,在本文列舉的11個(gè)機(jī)器學(xué)習(xí)開源項(xiàng)目中,無論你是Java愛好者還是Python狂人,在這里你都可以找到自己想要的機(jī)器學(xué)習(xí)開源項(xiàng)目。垃圾郵件過濾、人臉識(shí)別、推薦引擎——當(dāng)你有一個(gè)大數(shù)據(jù)集并且希望利用它們執(zhí)行預(yù)測(cè)分析和模式識(shí)別,機(jī)器學(xué)習(xí)是必經(jīng)之路。這門科學(xué),計(jì)算機(jī)可以在沒有事先規(guī)劃的前提下自主學(xué)習(xí)、分析和操作數(shù)據(jù),現(xiàn)在越來越多的開發(fā)人員關(guān)注機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)技術(shù)的興起不僅是因?yàn)橛布杀驹絹碓奖阋艘约靶阅茉絹碓綇?qiáng)大,促使機(jī)器學(xué)習(xí)在單機(jī)或大規(guī)模集群上輕松部署的免費(fèi)軟件激增也是重要因素。機(jī)器學(xué)習(xí)庫的多樣性意味著無論你喜歡什么語言或環(huán)境,都有可能是獲得你喜歡的。1.Scikit-learnPython由于其易用性以及豐富的函數(shù)庫,已經(jīng)成為數(shù)學(xué)、自然科學(xué)和統(tǒng)計(jì)學(xué)的首選編程語言。Scikit-learn通過在現(xiàn)有Python包上構(gòu)建——NumPySciPy和matplotlib——服務(wù)于數(shù)學(xué)和自然科學(xué)。生成的庫要么可以使用交互式“工作臺(tái)”應(yīng)用程序,要么被嵌入到其他軟件和重用。工具箱可以在BSD許可下獲取,所以它是完全開放和可重用的。
2.Shogun在最古老、最值得尊敬的機(jī)器學(xué)習(xí)庫中,Shogun創(chuàng)建于1999年,用C++編寫,但并不限于在C++工作。由于SWIG庫,Shogun可以輕松在Java、Python、C#、Ruby、R、Lua、Octave、Matlab語言和環(huán)境下使用。雖然德高望重,Shogun也有其他的競(jìng)爭者。另一個(gè)基于C++的機(jī)器學(xué)習(xí)庫Mlpack在2011年出現(xiàn),它宣稱比其他競(jìng)爭者速度更快并且更容易使用(一個(gè)更完整的API集)。
3.AccordFramework/AFAccord,一個(gè).Net的機(jī)器學(xué)習(xí)和信號(hào)處理框架,是早前類似一個(gè)項(xiàng)目AF的擴(kuò)展。順便說一下,“信號(hào)處理”這里是指一系列對(duì)圖像和音頻的機(jī)器學(xué)習(xí)算法,如圖片無縫縫合或執(zhí)行人臉檢測(cè)。包含一組視覺處理算法;它作用于圖像流(如視頻),并且可用于實(shí)現(xiàn)移動(dòng)對(duì)象的跟蹤等功能。Accord還提供一個(gè)從神經(jīng)網(wǎng)絡(luò)到?jīng)Q策樹系統(tǒng)的機(jī)器學(xué)習(xí)常見庫。
4.MahoutMahout框架一直與Hadoop相關(guān)聯(lián),但旗下很多算法還可以脫離Hadoop運(yùn)行。他們對(duì)那些可能最終遷移到Hadoop上的應(yīng)用程序或從Hadoop上剝離成為獨(dú)立應(yīng)用程序的項(xiàng)目非常有用。Mahout缺點(diǎn)之一:目前幾乎沒有算法支持高性能的Spark框架,反而使用日益過時(shí)的MapReduce框架。該項(xiàng)目目前不接受基于MapReduce的算法,那些想要獲得更高性能的開發(fā)者轉(zhuǎn)而用MLlib替代。
5.MLlibApache自己的Spark和Hadoop機(jī)器學(xué)習(xí)庫,旨在為大規(guī)模和高速度而設(shè)計(jì)的MLlib自稱擁有所有常見的算法和有用數(shù)據(jù)類型。與任何Hadoop項(xiàng)目一樣,Java是MLlib上的基本語言,但是Python用戶可以用MLlibNumPy庫連接(也用于scikit-learn),并且Scala用戶可以針對(duì)MLlib編寫代碼。如果不能設(shè)置一個(gè)Hadoop集群,MLlib可以在沒有Hadoop的情況下部署在Spark上——以及在EC2或Mesos上。
6.H2O0xdataH2O的算法是面向業(yè)務(wù)流程——欺詐或趨勢(shì)預(yù)測(cè)。Hadoop專家可以使用Java與H2O相互作用,但框架還提供了對(duì)Python、R以及Scala的捆綁。
7.ClouderaOryx另一個(gè)為Hadoop設(shè)計(jì)的機(jī)器學(xué)習(xí)項(xiàng)目Oryx由?ClouderaHadoopdistribution?創(chuàng)造者提供。Oryx是為了允許機(jī)器學(xué)習(xí)模型部署在實(shí)時(shí)流數(shù)據(jù)上而設(shè)計(jì)的,如實(shí)時(shí)垃圾郵件過濾器或推薦引擎。該項(xiàng)目的全新版本暫時(shí)定名為Oryx2,目前正在準(zhǔn)備階段。它使用Apache項(xiàng)目如Spark和Kafka實(shí)現(xiàn)更高性能,其組件構(gòu)建走松散耦合路線以便能經(jīng)得住時(shí)間考驗(yàn)。
8.GoLearn谷歌的Go語言已經(jīng)開始被廣泛使用,隨著庫越來越多,據(jù)其開發(fā)者StephenWitworth介紹,GoLearn被構(gòu)建為Go語言的一體化的機(jī)器學(xué)習(xí)庫,目標(biāo)是“簡單可定制”。簡單主要是由于數(shù)據(jù)在庫內(nèi)被加載和處理,因?yàn)樗欠抡誗ciPy和R;可定制性在于庫的開放源碼特性以及一些數(shù)據(jù)結(jié)構(gòu)可以很容易地在一個(gè)應(yīng)用程序中擴(kuò)展。Witworth也為VowpalWabbit庫創(chuàng)建了一個(gè)包裝器,其中一個(gè)庫存放在Shogun工具箱中。
9.WekaWeka是新西蘭Waikato大學(xué)開發(fā)的,收集一組專門為數(shù)據(jù)挖掘設(shè)計(jì)的Java機(jī)器學(xué)習(xí)算法。這組GNU得到GPLv3許可的集有一個(gè)包系統(tǒng)擴(kuò)展其功能,有官方和非官方包兩種。Weka甚至還有專門一本書解釋其軟件和實(shí)戰(zhàn)技術(shù),所以那些想要在概念和軟件上取得優(yōu)勢(shì)的開發(fā)者可以關(guān)注下。雖然Weka并不是專門針對(duì)Hadoop用戶,但是Weka的最新版本的一組封裝器可以用于Hadoop。請(qǐng)注意,它還不能支持Spark,只有MapReduc。Clojure用戶還可以通過?Clj-ml??庫利用Weka。
10.CUDA-Convnet現(xiàn)在大多數(shù)人都知道GPU在處理某些問題上的速度比CPU快。但應(yīng)用程序不會(huì)自動(dòng)利用GPU的加速功能;他們必須明確通過程序?qū)懭?。CUDA-Convne是一個(gè)神經(jīng)網(wǎng)絡(luò)應(yīng)用程序機(jī)器學(xué)習(xí)庫,用C++編寫來開發(fā)Nvidia的CUDAGPU處理技術(shù)。對(duì)于那些使用Python而不是C++用戶,由此產(chǎn)生的神經(jīng)網(wǎng)絡(luò)可以保存為Pythonpickle對(duì)象,因此可以從Python存取。注意,原始版本的項(xiàng)目不再被開發(fā),但是已經(jīng)被重組為CUDA-Convnet2,支持多個(gè)GPU和Kepler-generationGPU。與之類似的項(xiàng)目Vulpes,已經(jīng)用F#編寫,并且通常和.Net框架一起使用。
11.ConvNetJS顧名思義,ConvNetJS是一個(gè)基于js
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 傳媒公司協(xié)議合同范本
- 制作簡易合同范本
- 農(nóng)戶貸款保證合同范本
- 農(nóng)村住宅設(shè)計(jì)合同范本
- 上海植物租擺合同范本
- 公積金租房合同范本
- 五人合伙合同范本
- 二手公寓房購買合同范本
- 正規(guī)合同范本買賣
- 倉庫貨品保管合同范本
- GB/T 3452.2-2007液壓氣動(dòng)用O形橡膠密封圈第2部分:外觀質(zhì)量檢驗(yàn)規(guī)范
- GB/T 30797-2014食品用洗滌劑試驗(yàn)方法總砷的測(cè)定
- GB/T 20057-2012滾動(dòng)軸承圓柱滾子軸承平擋圈和套圈無擋邊端倒角尺寸
- GB/T 19808-2005塑料管材和管件公稱外徑大于或等于90mm的聚乙烯電熔組件的拉伸剝離試驗(yàn)
- GB/T 12771-2019流體輸送用不銹鋼焊接鋼管
- 工程驗(yàn)收及移交管理方案
- 班組建設(shè)工作體系課件
- 圖片編輯概述課件
- 第章交通調(diào)查與數(shù)據(jù)分析課件
- 2023年岳陽職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試筆試題庫及答案解析
- 北師大版八年級(jí)數(shù)學(xué)上冊(cè)《認(rèn)識(shí)無理數(shù)(第2課時(shí))》參考課件2
評(píng)論
0/150
提交評(píng)論