![PySpark大數(shù)據(jù)技術(shù)與應(yīng)用 教案 第2章 PySpark安裝配置_第1頁](http://file4.renrendoc.com/view11/M00/11/0F/wKhkGWX0DleAI0MtAAD0HLq2fX4987.jpg)
![PySpark大數(shù)據(jù)技術(shù)與應(yīng)用 教案 第2章 PySpark安裝配置_第2頁](http://file4.renrendoc.com/view11/M00/11/0F/wKhkGWX0DleAI0MtAAD0HLq2fX49872.jpg)
![PySpark大數(shù)據(jù)技術(shù)與應(yīng)用 教案 第2章 PySpark安裝配置_第3頁](http://file4.renrendoc.com/view11/M00/11/0F/wKhkGWX0DleAI0MtAAD0HLq2fX49873.jpg)
![PySpark大數(shù)據(jù)技術(shù)與應(yīng)用 教案 第2章 PySpark安裝配置_第4頁](http://file4.renrendoc.com/view11/M00/11/0F/wKhkGWX0DleAI0MtAAD0HLq2fX49874.jpg)
![PySpark大數(shù)據(jù)技術(shù)與應(yīng)用 教案 第2章 PySpark安裝配置_第5頁](http://file4.renrendoc.com/view11/M00/11/0F/wKhkGWX0DleAI0MtAAD0HLq2fX49875.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第2章PySpark安裝配置教案課程名稱:PySpark大數(shù)據(jù)分析與應(yīng)用課程類別:必修適用專業(yè):大數(shù)據(jù)技術(shù)類相關(guān)專業(yè)總學(xué)時(shí):64學(xué)時(shí)(其中理論32學(xué)時(shí),實(shí)驗(yàn)32學(xué)時(shí))總學(xué)分:4.0學(xué)分本章學(xué)時(shí):8學(xué)時(shí)材料清單《PySpark大數(shù)據(jù)分析與應(yīng)用》教材。配套PPT。引導(dǎo)性提問。探究性問題。拓展性問題。教學(xué)目標(biāo)與基本要求教學(xué)目標(biāo)根據(jù)目前數(shù)據(jù)分析發(fā)展?fàn)顩r,將數(shù)據(jù)分析具象化。而后介紹數(shù)據(jù)分析的概念,流程,目的以及應(yīng)用場(chǎng)景。闡述使用Python進(jìn)行數(shù)據(jù)分析的優(yōu)勢(shì)。列舉說明Python數(shù)據(jù)分析重要庫的功能。緊接著闡述Anaconda簡(jiǎn)介,實(shí)現(xiàn)在Windows和Linux兩個(gè)系統(tǒng)下Anaconda數(shù)據(jù)分析環(huán)境。最后展現(xiàn)Python數(shù)據(jù)分析工具JupyterNotebook的優(yōu)異特性及使用方法。為后學(xué)課程學(xué)習(xí)搭建數(shù)據(jù)分析環(huán)境,首先介紹在windows系統(tǒng)中搭建單機(jī)模式的數(shù)據(jù)分析環(huán)境,能夠運(yùn)行PySpark程序代碼;然后,介紹在Linux系統(tǒng)中搭建分布式模式的數(shù)據(jù)分析環(huán)境,了解Spark分布式模式的運(yùn)行機(jī)理,進(jìn)一步體會(huì)PySpark大數(shù)據(jù)處理能力。最后介紹Python中重要的數(shù)據(jù)結(jié)構(gòu)(元組、列表、字典)和函數(shù)式編程。基本要求掌握單機(jī)模式和分布式模式下PySpark開發(fā)環(huán)境的搭建過程。熟悉Linux操作系統(tǒng)虛擬機(jī)的安裝過程。掌握單機(jī)模式和分布式模式下Hadoop集群配置。掌握分布式模式下Spark集群配置。掌握Python重要的數(shù)據(jù)結(jié)構(gòu)及函數(shù)編程。問題引導(dǎo)性提問引導(dǎo)性提問需要教師根據(jù)教材內(nèi)容和學(xué)生實(shí)際水平,提出問題,啟發(fā)引導(dǎo)學(xué)生去解決問題,提問,從而達(dá)到理解、掌握知識(shí),發(fā)展各種能力和提高思想覺悟的目的。搭建單機(jī)模式的PySpark開發(fā)環(huán)境需要哪些組件。單機(jī)模式的PySpark開發(fā)環(huán)境有哪些優(yōu)缺點(diǎn)。搭建分布式模式的PySpark開發(fā)環(huán)境需要哪些組件。分布式模式的PySpark開發(fā)環(huán)境有哪些優(yōu)缺點(diǎn)。單機(jī)模式和分布式模式PySpark開發(fā)環(huán)境的應(yīng)用場(chǎng)景。探究性問題探究性問題需要教師深入鉆研教材的基礎(chǔ)上精心設(shè)計(jì),提問的角度或者在引導(dǎo)性提問的基礎(chǔ)上,從重點(diǎn)、難點(diǎn)問題切入,進(jìn)行插入式提問?;蛘呤菍?duì)引導(dǎo)式提問中尚未涉及但在課文中又是重要的問題加以設(shè)問。單機(jī)模式中,安裝Hadoop組件的作用?大數(shù)據(jù)分析中數(shù)據(jù)庫與Hive的區(qū)別是什么?分布式模式中,計(jì)算機(jī)節(jié)點(diǎn)為什么要建立互信機(jī)制?拓展性問題拓展性問題需要教師深刻理解教材的意義,學(xué)生的學(xué)習(xí)動(dòng)態(tài)后,根據(jù)學(xué)生學(xué)習(xí)層次,提出切實(shí)可行的關(guān)乎實(shí)際的可操作問題。亦可以提供拓展資料供學(xué)生研習(xí)探討,完成拓展性問題。分布式模式下,使用HDFS文件系統(tǒng)存儲(chǔ)大文件的優(yōu)勢(shì)。Spark與Hadoop進(jìn)行數(shù)據(jù)分析有哪些優(yōu)缺點(diǎn)。使用Python語言進(jìn)行數(shù)據(jù)分析的優(yōu)勢(shì)。主要知識(shí)點(diǎn)、重點(diǎn)與難點(diǎn)主要知識(shí)點(diǎn)掌握單機(jī)模式和分布式模式下PySpark開發(fā)環(huán)境的搭建過程。安裝Linux操作系統(tǒng)虛擬機(jī)。開發(fā)環(huán)境中的各組件的安裝與配置。掌握Python重要的數(shù)據(jù)結(jié)構(gòu)及函數(shù)編程。重點(diǎn)搭建單機(jī)模式的PySpark開發(fā)環(huán)境。搭建分布式模式的PySpark開發(fā)環(huán)境。難點(diǎn)搭建分布式模式的PySpark開發(fā)環(huán)境。教學(xué)過程設(shè)計(jì)理論教學(xué)過程在Windows系統(tǒng)中安裝JDK。在Windows系統(tǒng)中安裝Anaconda。在Windows系統(tǒng)中安裝Hadoop。在Windows系統(tǒng)中安裝MySQL。在Windows系統(tǒng)中安裝Hive。在Windows系統(tǒng)中配置PySpark模塊。在Windows系統(tǒng)中安裝Linux虛擬機(jī)。在Linux系統(tǒng)中安裝Java。在Linux系統(tǒng)中搭建Hadoop分布式集群。在Linux系統(tǒng)中安裝MySQL數(shù)據(jù)庫。在Linux系統(tǒng)中安裝Hive數(shù)據(jù)倉庫。在Linux系統(tǒng)中搭建Spark完全分布式集群。Python中的常用數(shù)據(jù)結(jié)構(gòu)。Python函數(shù)式編程基礎(chǔ)。實(shí)驗(yàn)教學(xué)過程在Windows系統(tǒng)中安裝JDK。在Windows系統(tǒng)中安裝Anaconda。在Windows系統(tǒng)中安裝Hadoop。在Windows系統(tǒng)中安裝MySQL。在Windows系統(tǒng)中安裝Hive。在Windows系統(tǒng)中配置PySpark模塊。在Windows系統(tǒng)中安裝Linux虛擬機(jī)。在Linux系統(tǒng)中安裝Java。在Linux系統(tǒng)中搭建Hadoop分布式集群。在Linux系統(tǒng)中安裝MySQL數(shù)據(jù)庫。在Linux系統(tǒng)中安裝Hive數(shù)據(jù)倉庫。在Linux系統(tǒng)中搭建Spark完全分布式集群。教材與參考資料教材戴剛,張良均.《PySpark大數(shù)據(jù)分析與應(yīng)用》[M].北京:人民郵電出版社.2024.參考資料[1] 肖芳,張良均.Spark大數(shù)據(jù)技術(shù)與應(yīng)用(第2版)(微課版)[M].北京:人民郵電出版社.2022.[2] 王哲,張良均.Hadoop與大數(shù)據(jù)挖掘(第2版)[M].北京:機(jī)械工業(yè)出版社.2022.[3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- Unit 9 What's your hobby 說課稿(說課稿)-2024-2025學(xué)年湘少版(三起)英語五年級(jí)上冊(cè)
- Unit 3 What Would you like(說課稿)-2024-2025學(xué)年人教PEP版英語五年級(jí)上冊(cè)
- 2023九年級(jí)數(shù)學(xué)上冊(cè) 第六章 反比例函數(shù)1 反比例函數(shù)說課稿 (新版)北師大版
- 10《爬山虎的腳》說課稿-2024-2025學(xué)年語文四年級(jí)上冊(cè)統(tǒng)編版
- 2023三年級(jí)英語下冊(cè) Unit 2 Animals at the Zoo Lesson 8 Tigers and Bears說課稿 冀教版(三起)
- 2025民間個(gè)人借款合同書范文
- 2024-2025學(xué)年高一歷史第13周 6.2卓爾不群的雅典說課稿
- 2025常年法律顧問合同
- 19《一只窩囊的大老虎》第二課時(shí)(說課稿)-2024-2025學(xué)年統(tǒng)編版語文四年級(jí)上冊(cè)001
- 2025獨(dú)家經(jīng)銷合同范本
- GMS要素-持續(xù)改進(jìn)(CI)-上汽通用五菱-課件
- 《插畫設(shè)計(jì)》課程標(biāo)準(zhǔn)
- 九九乘法口訣表(超清晰打印版)
- 高考作文答題卡(作文)
- 在鄉(xiāng)村治理中深化推廣運(yùn)用清單制、積分制、一張圖工作方案
- 營養(yǎng)學(xué)基礎(chǔ)知識(shí)-課件
- 梅毒的診斷與治療課件
- 工程倫理第二講工程中的風(fēng)險(xiǎn)、安全與責(zé)任課件
- 高中數(shù)學(xué)《橢圓》方程典型例題20例(含標(biāo)準(zhǔn)答案)
- 中山大學(xué)孫逸仙紀(jì)念醫(yī)院醫(yī)用耗材試用登記表【模板】
評(píng)論
0/150
提交評(píng)論