下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、DataGuru專業(yè)數(shù)據(jù)分析社區(qū)網(wǎng)址: Spark大數(shù)據(jù)分析平臺2015年,Spark只用了一年多時間,已實(shí)現(xiàn)開源到火爆,亦逐漸顯露出與通用大數(shù)據(jù)平臺Hadoop的分庭抗?fàn)幹畡?。在這個大背景下,在大數(shù)據(jù)領(lǐng)域時代,誰將是獨(dú)領(lǐng)風(fēng)騷?Spark無疑是最大的競爭者,無論是2015Spark技術(shù)峰會,還是國內(nèi)的大數(shù)據(jù)大會,可以看到中國力量正在崛起,Spark最大的集群來自騰訊8000個節(jié)點(diǎn),單個Job最大分別是阿里巴巴和Databricks1PB,震撼人心!同時,截止2015年6月,Spark的Contributor比2014年漲了3倍,達(dá)到730人;總代碼行數(shù)也比2014年漲了2倍多,達(dá)到40萬行,不
2、但大量的互聯(lián)網(wǎng)企業(yè)已經(jīng)在使用或者正準(zhǔn)備使用Spark,而且大量的電信、金融、證券和傳統(tǒng)企業(yè)已經(jīng)開始引入了Spark。然而作為一個高速發(fā)展中的開源項(xiàng)目,其部署過程中存在的門檻和挑戰(zhàn)亦不可謂不大,本課程將主要介紹Spark1.4.0,引領(lǐng)大家進(jìn)入大數(shù)據(jù)Spark入門。課程大綱:第一課:Spark生態(tài)和安裝部署Spark概述Spark現(xiàn)狀安裝部署Spark安裝簡介Spark的源碼編譯SparkStandalone安裝SparkStandaloneHA安裝Spark工具Spark交互式工具spark-shellSpark應(yīng)用程序部署工具spark-submit第二課:Spark編程模型和解析Spark
3、的編程模型RDD的特點(diǎn)、操作、依賴關(guān)系緩存策略廣播變量和累加器Spark編程環(huán)境搭建Spark編程實(shí)例第三課:Spark運(yùn)行架構(gòu)和解析Spark的運(yùn)行架構(gòu)基本術(shù)語運(yùn)行架構(gòu)(DAGScheduler、TaskSeduler、Task、容錯性、推測機(jī)制、數(shù)據(jù)本地性)SparkonStandalone運(yùn)行過程SparkonYARN運(yùn)行過程第四課:hive入門hive的運(yùn)行架構(gòu)hive的安裝hive的實(shí)例演示第五課:SparkSQL原理和實(shí)踐Spark的運(yùn)行架構(gòu)CatalystsqlontexthiveContextThriftServer和CLIThriftServerCLISparkSQL的實(shí)例演
4、示和編程spark-shell實(shí)例演示spark-sql實(shí)例演示SparkSQL的編程第六課:SparkStreaming原理和實(shí)踐SparkStreaming原理SparkStreaming的原理SparkStreaming的運(yùn)行方式DStream的特點(diǎn)和操作SparkStreaming實(shí)例演示網(wǎng)絡(luò)數(shù)據(jù)演示文本實(shí)例演示W(wǎng)indow操作演示第七課:MLlib入門什么是機(jī)器學(xué)習(xí)MLlib的架構(gòu)Mllib實(shí)例演示聚類算法演示推薦系統(tǒng)演示第八課:GraphX入門圖論基礎(chǔ)GraphX的架構(gòu)GraphX實(shí)例演示圖的基本操作PageRank演示第九課:Spark運(yùn)維SparkOnYARNhistoryse
5、rverjobserverSpark的監(jiān)控SparkUI監(jiān)控第十課:scalaonSparkspark常用的scala基礎(chǔ)如何閱讀spark源代碼如何構(gòu)建spark項(xiàng)目技術(shù)成就夢想DataGuru專業(yè)數(shù)據(jù)分析社區(qū)網(wǎng)址: ATABURU第十一課:Spark編程RDD的編程Spark綜合實(shí)例(SparkSQL+sparkMlib+R)第十二課:Spark源碼研讀Spark源碼總體介紹SparkCore源碼細(xì)解SparkExamples介紹第十三課:雜談Spark相關(guān)項(xiàng)目BlinkDB簡介SparkR的安裝和實(shí)例Techyon授課對象:有Java開發(fā)經(jīng)驗(yàn)或Scala開發(fā)經(jīng)驗(yàn),最好了解Hadoop,H
6、ive等使用經(jīng)驗(yàn)。課程對于Spark初學(xué)者,Spark開發(fā)人員及Spark運(yùn)維人員都具有比較大的學(xué)習(xí)價值。收獲預(yù)期:深入理解Spark的運(yùn)行原理學(xué)會搭建Spark,hadoop集群環(huán)境完全掌握Spark編程基礎(chǔ),了解Spark運(yùn)維的基礎(chǔ)知識完成大數(shù)據(jù)入門,可逐漸轉(zhuǎn)崗大數(shù)據(jù)相關(guān)職位。課程環(huán)境:Spark版本:Sparkl.4準(zhǔn)備環(huán)境:CentOS,eclipse或IntelliJIDEA,Scala,JDK,Maven,sbt,Hadoop,hive,建議三臺虛擬機(jī)。授課講師:冰風(fēng)影,超過12年的軟件研發(fā)經(jīng)驗(yàn),曾在ERP,醫(yī)學(xué),互聯(lián)網(wǎng)行業(yè)企業(yè)擔(dān)任高級軟件工程ATABURU歸50技術(shù)成就夢想DataGuru專業(yè)數(shù)據(jù)分析社區(qū)網(wǎng)址: 師、架構(gòu)師,技術(shù)總監(jiān)。具備軟件產(chǎn)品設(shè)計(jì)和開發(fā)經(jīng)驗(yàn),豐富的大型項(xiàng)目架構(gòu)設(shè)計(jì)和編碼經(jīng)驗(yàn)。目前主要的研究方向是大數(shù)據(jù),分布式技術(shù),Hadoop和spark。國內(nèi)知名的開源分布式數(shù)據(jù)庫中間件MyCAT的核心開發(fā)成員,在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版實(shí)習(xí)期員工勞動合同-實(shí)習(xí)期間安全防護(hù)3篇
- 二零二五年度酒店客房裝修與設(shè)施更新合同4篇
- 二零二五版?zhèn)D(zhuǎn)股投資合作協(xié)議書(產(chǎn)業(yè)鏈整合)3篇
- 二零二五年度個人寵物醫(yī)療借款協(xié)議(寵物健康保障)3篇
- 二零二五年度商業(yè)地產(chǎn)土地轉(zhuǎn)讓買賣合同3篇
- 長葛小區(qū)透水磚施工方案
- 二零二五版學(xué)校食堂調(diào)料批發(fā)協(xié)議2篇
- 2025年度個人房產(chǎn)買賣與裝修設(shè)計(jì)一體化服務(wù)協(xié)議4篇
- 二零二五年度創(chuàng)新型工程項(xiàng)目管理咨詢服務(wù)合同范本2篇
- 二零二五年度企業(yè)內(nèi)部員工股權(quán)激勵協(xié)議4篇
- 幼兒園美術(shù)教育研究策略國內(nèi)外
- 高中英語選擇性必修一單詞表
- 物業(yè)公司介紹
- (正式版)SHT 3551-2024 石油化工儀表工程施工及驗(yàn)收規(guī)范
- 2024屆河南省五市高三第一次聯(lián)考英語試題及答案
- 【永輝超市公司員工招聘問題及優(yōu)化(12000字論文)】
- 孕婦學(xué)校品管圈課件
- 《愿望的實(shí)現(xiàn)》交流ppt課件2
- 中國直銷發(fā)展四個階段解析
- 2024屆浙江省寧波市鎮(zhèn)海區(qū)鎮(zhèn)海中學(xué)高一物理第一學(xué)期期末質(zhì)量檢測試題含解析
- 《一次函數(shù)與方程、不等式》說課稿
評論
0/150
提交評論