版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
教案首頁(第1次課)
(以2課時為單元)
課序授課日期授課班次授課教師批準(zhǔn)人
1
《大數(shù)據(jù)技術(shù)原理及應(yīng)用》是學(xué)習(xí)大數(shù)據(jù)技術(shù)的入門課程,是計算機科學(xué)與
技術(shù)、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)、人工智能等專業(yè)的一門學(xué)科基礎(chǔ)與專業(yè)核心課程。
該課程著重講述大數(shù)據(jù)技術(shù)的知識體系,闡明其基本原理,引導(dǎo)學(xué)生進行初級實
踐和了解相關(guān)應(yīng)用,培養(yǎng)學(xué)生運用大數(shù)據(jù)平臺搭建、大數(shù)據(jù)收集與預(yù)處理、大數(shù)
據(jù)遷移、大數(shù)據(jù)存儲與管理、大數(shù)據(jù)處理與分析、數(shù)據(jù)可視化等方法和技術(shù)工具
完成大數(shù)據(jù)應(yīng)用的能力,在整個大數(shù)據(jù)課程體系中起著承前啟后重要作用。該課
課程描述程由理論教學(xué)和實驗教學(xué)兩個部分組成,其先修課程包括面向?qū)ο蟪绦蛟O(shè)計、
Python語言程序設(shè)計、操作系統(tǒng)、數(shù)據(jù)庫原理等,后續(xù)課程包括數(shù)據(jù)采集與預(yù)處
理、大數(shù)據(jù)存儲與管理技術(shù)、數(shù)據(jù)挖掘、大數(shù)據(jù)開發(fā)技術(shù)、大數(shù)據(jù)高級編程、數(shù)
據(jù)可視化技術(shù)等。
總學(xué)時理論教學(xué)實踐教學(xué)周學(xué)時學(xué)分
483216單4雙23
《大數(shù)據(jù)技術(shù)原理及應(yīng)用》圍繞“構(gòu)建知識體系、闡明基本原理、引導(dǎo)初級
實踐、了解相關(guān)應(yīng)用”的指導(dǎo)思想,著重講述大數(shù)據(jù)技術(shù)的基本原理、基本方法、
技術(shù)工具和相關(guān)應(yīng)用,幫助學(xué)生構(gòu)建完整的大數(shù)據(jù)技術(shù)知識體系,使學(xué)生了解大
數(shù)據(jù)技術(shù)在行業(yè)領(lǐng)域中的最新發(fā)展趨勢和前沿知識,熟悉大數(shù)據(jù)應(yīng)用的整個生命
周期,能夠熟練使用Hadoop、Spark等主流大數(shù)據(jù)平臺及其生態(tài)系統(tǒng)中的技術(shù)工
具完成基本的大數(shù)據(jù)應(yīng)用閉環(huán)操作,達到知行合一、以用促學(xué)的目的。
知識目標(biāo):
1.理解大數(shù)據(jù)基本概念,了解大數(shù)據(jù)與云計算、物聯(lián)網(wǎng)、人工智能的關(guān)系,
課程教學(xué)了解當(dāng)前大數(shù)據(jù)的崗位及需求、學(xué)習(xí)路線;
目標(biāo)2.認(rèn)識大數(shù)據(jù)處理平臺Hadoop,熟練掌握全分布模式Hadoop集群的部署基
本過程;
3.理解分布式文件系統(tǒng)HDFS的體系架構(gòu)、文件存儲機制和數(shù)據(jù)讀寫過程,
熟練掌握HDFSWebUI的使用、HDFSShell常用命令的使用和HDFS編程;
4.理解分布式計算框架MapReduce的編程思想和作業(yè)執(zhí)行流程,掌握
MapReduce簡單編程,了解當(dāng)前其他主流的大數(shù)據(jù)計算框架如Spark、Storm、FIink
等;
5.理解YARN體系架構(gòu)和工作原理,掌握YARNWebUI、YARNShell的基本
使用,了解ResourceManager高可用機制的原理與配置,了解HDFSNameNode
高可用機制、HDFSNameNodeFederation,HDFSSnapshots;
6.理解分布式協(xié)調(diào)框架ZooKeeper的執(zhí)行原理和應(yīng)用場景,掌握ZooKeeper
集群的部署和ZooKeeperShell常用命令的使用;
7.理解NoSQL數(shù)據(jù)庫與關(guān)系數(shù)據(jù)庫的區(qū)別、分布式數(shù)據(jù)庫HBase的數(shù)據(jù)模
型、體系架構(gòu)和運行機制,熟練掌握HBase集群的部署、HBaseShell常用命令
的使用;
8.理解Hive的體系架構(gòu)和執(zhí)行流程,掌握Hive的部署和連接方式,熟練
掌握Hive基本操作包括HiveDDL、HiveDML的書寫和HiveShell命令的使用;
9.理解數(shù)據(jù)遷移框架Sqoop、日志采集系統(tǒng)Flume、分布式發(fā)布/訂閱消息
系統(tǒng)Kafka的作用、架構(gòu)和工作原理,掌握Sqoop、Flume、Kafka的部署和使用;
課程教學(xué)
10.了解數(shù)據(jù)可視化的概念、作用和過程,理解常用的數(shù)據(jù)可視化圖形,了
目標(biāo)
解當(dāng)前主流的數(shù)據(jù)可視化工具。
能力目標(biāo):培養(yǎng)學(xué)生學(xué)以致用,能夠綜合利用Hadoop大數(shù)據(jù)平臺及其生態(tài)中
各個工具解決實際大數(shù)據(jù)應(yīng)用方面的基本問題,提高學(xué)生閱讀外文科技文獻能
力,增強學(xué)生發(fā)現(xiàn)問題、分析問題、解決問題能力,與學(xué)科競賽和項目緊密結(jié)合,
穩(wěn)步培養(yǎng)和提高學(xué)生的動手實踐能力、自主創(chuàng)新能力、團隊協(xié)作能力、寫作表達
能力。
情感目標(biāo):通過對我國大數(shù)據(jù)技術(shù)、傳統(tǒng)優(yōu)秀文化的介紹,增強學(xué)生的民族
自豪感,提升學(xué)生的愛國主義精神,增強文化自信;將專業(yè)知識與服務(wù)社會相結(jié)
合,培養(yǎng)學(xué)生的社會責(zé)任感,樹立正確三觀,使學(xué)生更為深刻的理解專業(yè)內(nèi)涵,
提高學(xué)習(xí)內(nèi)驅(qū)力,培養(yǎng)科學(xué)素養(yǎng),內(nèi)化為道德準(zhǔn)則、科學(xué)思維和行為規(guī)范。
課題第1講開學(xué)第一課&大數(shù)據(jù)樓述
教材:
[1]徐魯輝.Hadoop大數(shù)據(jù)原理與應(yīng)用[M].西安:西安電子科技大學(xué)出版
社,2020年3月.
參考資料:
[2]徐魯輝.Hadoop大數(shù)據(jù)原理與應(yīng)用實驗教程[M].西安:西安電子科技
大學(xué)出版社,2020年1月.
[3]林子雨.大數(shù)據(jù)技術(shù)原理與應(yīng)用(第2版)[M].北京:人民郵電出版社,
授課教材2017年1月.
參考資料[4]呂林濤.大數(shù)據(jù)技術(shù)及其應(yīng)用[M].北京:科學(xué)出版社,2019年5月.
[5]維克托?邁爾-舍恩伯格,肯尼思?庫克耶.盛楊燕等譯.大數(shù)據(jù)時
代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013年1月.
[6]TomWhite.Hadoop:TheDefinitiveGuide(4thEdition)[M].
0'ReillyMedia,April2015.
[7]TomWhite,著.王海,譯.Hadoop權(quán)威指南(第4版)[M].北京:清華
大學(xué)出版社,2017年7月.
[8]BiIIChambers,MateiZaharia.Spark:TheDefinitiveGuide[M].
O'ReillyMedia,February2018.
[9]BiIIChambers,MateiZaharia,著.張巖峰,譯.Spark權(quán)威指南[M].
北京:中國電力出版社,2020年4月.
[10]LarsGeorge.HBase:TheDefinitiveGuide[M].O'ReillyMedia,
September2011.
[11]LarsGeorge,著.代志遠,譯.HBase權(quán)威指南[M].北京:人民郵電出
版社,2013.
[12]EdwardCaprioIo,DeanWampIer,JasonRuthergIen.Programming
Hive[M].0,ReillyMedia,September2012.
[13]EdwardCaprioIo,DeanWampIer,JasonRutherglen,著.曹坤,
譯.Hive編程指南[M].北京:人民郵電出版社,2013.
[14]蔡斌.Hadoop技術(shù)內(nèi)幕:深入解析HadoopCommon和HDFS架構(gòu)設(shè)計與
實現(xiàn)原理[M].北京:機械工業(yè)出版社,2013年5月.
[15]董西成.Hadoop技術(shù)內(nèi)幕:深入解析MapReduce架構(gòu)設(shè)計與實現(xiàn)原理
[M].北京:機械工業(yè)出版社,2013年5月.
[16]董西成.Hadoop技術(shù)內(nèi)幕:深入解析YARN架構(gòu)設(shè)計與實現(xiàn)原理[M].
北京:機械工業(yè)出版社,2014年1月.
[17]ApacheHadoopProject,https://hadoop.apache.org.
[18]ApacheSparkProject,https://spark,apache,org.
[19]TheHadoopEcosystemTabIe.
https://hadoopecosystemtabIe.github.io
[20]高校大數(shù)據(jù)課程公共服務(wù)平臺.
http://dbIab.xmu.edu.cn/post/bigdata-teaching-pIatform.
[21]林子雨.中國大學(xué)M00C《大數(shù)據(jù)技術(shù)原理與應(yīng)用》.
https://www.icourse163.org/course/XMU-1002335004.
其它教學(xué)
學(xué)堂云:大數(shù)據(jù)技術(shù)原理及應(yīng)用
資源
開學(xué)第一課
1.明確該課程的教學(xué)目標(biāo)。
2.明確該課程的教學(xué)進度、教材、參考資料、上機軟件。
3.明確該課程的考核方式。
4.熟悉學(xué)堂云、雨課堂的使用方法。
目的要求第1章大數(shù)據(jù)概述
1.理解大數(shù)據(jù)的概念(重點),了解大數(shù)據(jù)的內(nèi)涵。
2.理解大數(shù)據(jù)的4V特征:Volume(海量化)、Variety(多樣化)、Value(價值
密度低)、Velocity(快速化)。(重點)
3.了解大數(shù)據(jù)處理關(guān)鍵技術(shù):數(shù)據(jù)采集與預(yù)處理、數(shù)據(jù)存儲與管理、數(shù)據(jù)處理與
分析、數(shù)據(jù)可視化。(難點)
4.了解大數(shù)據(jù)產(chǎn)業(yè)。
5.理解大物云智5G技術(shù),掌握大物云智5G之間的關(guān)系。(重點難點)
6.了解大數(shù)據(jù)的崗位。
7.了解大數(shù)據(jù)的學(xué)習(xí)路線。
開學(xué)第一課
1.自我介紹。
2.課程地位、先修及后續(xù)課程。
3.教學(xué)目標(biāo)及知識圖譜。
4.課時分配(理論+實驗)及進度、教材、參考資料、上機軟件。
5.考核方式:平時+實臉+期末。
6.學(xué)堂云、雨課堂的使用方法。
教學(xué)內(nèi)容第1章大數(shù)據(jù)概述
1.1大數(shù)據(jù)內(nèi)涵(重點)
1.2大數(shù)據(jù)特征(重點)
1.3大數(shù)據(jù)關(guān)鍵技術(shù)(難點)
1.4大數(shù)據(jù)產(chǎn)業(yè)
1.5大數(shù)據(jù)與物聯(lián)網(wǎng)、云計算、人工智能、5G的關(guān)系(重點,難點)
1.6大數(shù)據(jù)崗位介紹
1.7大數(shù)據(jù)學(xué)習(xí)路線
重點:大數(shù)據(jù)概念,大數(shù)據(jù)特征,大物云智5G之間的關(guān)系。
重點難點
難點:大數(shù)據(jù)關(guān)鍵技術(shù),大物云智5G之間的關(guān)系。
教學(xué)方法
講授法,討論法,任務(wù)驅(qū)動法
手段
開學(xué)第一課
1.進行自我介紹。
2.進行頭腦風(fēng)暴,提問問題,引入為何學(xué)習(xí)此課程。
3.闡述課程地位、先修及后續(xù)課程。
4.明確該課程教學(xué)目標(biāo),了解該課程知識思維導(dǎo)圖。
5.介紹該課程的課時分配及進度、教材、參考資料、上機軟件。
教學(xué)步驟6.公布考核方式:平時考核30%(在線考勤、課堂表現(xiàn)、作業(yè)、在線測試)+實
驗考核20%(實臉態(tài)度、實驗報告)+期末考核(筆試或大作業(yè))。
7.介紹學(xué)堂云、雨課堂的使用方法。
8.完成在線測試,對先修課程的知識和技能進行綜合測試。
第1章大數(shù)據(jù)概述
1.提問問題引入“大數(shù)據(jù)”。2.精講本節(jié)內(nèi)容。3.進行本節(jié)小結(jié)。
4.布置課后作業(yè)。
1.當(dāng)今IT界的熱門技術(shù)有哪些?
復(fù)習(xí)提問
2.你平時用的哪些應(yīng)用使用到了云計算和大數(shù)據(jù)技術(shù)?
1.章節(jié)測試
完成線上測試“章節(jié)測試1-大數(shù)據(jù)概述”。
2.預(yù)習(xí)作業(yè)
預(yù)習(xí)“初識Hadoop”。
作業(yè)
3.思考題
(1)根據(jù)自己的專業(yè)領(lǐng)域和研究興趣,調(diào)研大數(shù)據(jù)技術(shù)在自己所屬領(lǐng)域中的應(yīng)用
現(xiàn)狀?
(2)調(diào)查分析大數(shù)據(jù)從業(yè)人員常用方法、技術(shù)與工具。
教學(xué)環(huán)節(jié)復(fù)習(xí)提問新課講解課堂討論每課小結(jié)布置作業(yè)
時間分配(以分鐘計算))10701532
教案首頁(第2次課)
(以2課時為單元)
課序授課日期授課班次授課教師批準(zhǔn)人
2
課題第2講初識Hadoop
1.理解Hadoop是什么(重點),了解Hadoop的發(fā)展簡史、特點、版本。
2.理解Hadoop生態(tài)系統(tǒng)組成及各組件基本功能。(重點)
3.理解Hadoop體系架構(gòu)。(重點)
4.了解Hadoop在國內(nèi)外應(yīng)用現(xiàn)狀。
5.理解部署Hadoop集群所需系統(tǒng)環(huán)境、Hadoop運行模式,熟練掌握在Linux
目的要求
下部署全分布模式Hadoop過程:規(guī)劃集群、準(zhǔn)備機器及軟件環(huán)境(配置靜態(tài)
IP、修改主機名、編輯域名映射、安裝和配置Java、安裝和配置SSH免密登
錄)、安裝不口酉已置Hadoop集群(hadoop-env.sh>yarn-env.sh、mapred-env.sh^
core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml、sIaves)>
關(guān)閉防火墻、格式化文件系統(tǒng)、啟動和驗證Hadoop、關(guān)閉Hadoopo(重點難點)
第2章初識Hadoop
2.1Hadoop概,述(重點)
2.2Hadoop生態(tài)系統(tǒng)(重點)
教學(xué)內(nèi)容
2.3Hadoop體系架構(gòu)(重點)
2.4Hadoop應(yīng)用現(xiàn)狀
2.5部署和運行Hadoop(重點,難點)
重點:Hadoop是什么,Hadoop生態(tài)系統(tǒng),Hadoop體系架構(gòu),部署和運行Hadoop。
重點難點
難點:部署和運行Hadoopo
教學(xué)方法
講授法,討論法,演示法,案例法
手段
第2章初識Hadoop
1.復(fù)習(xí)提問,講評章節(jié)測試1,導(dǎo)入本節(jié)內(nèi)容。
教學(xué)步驟2.精講本節(jié)內(nèi)容。
3.進行本節(jié)小結(jié)。
4.布置課后作業(yè)。
1.根據(jù)你的理解,何為大數(shù)據(jù)?
復(fù)習(xí)提問2.大數(shù)據(jù)有哪些特征?
3.大數(shù)據(jù)關(guān)鍵技術(shù)有哪些?
1.章節(jié)測試
作業(yè)
w
完成線上測試“章節(jié)測試2-初識Hadoopo
2.思考題
(1)準(zhǔn)備Hadoop系統(tǒng)環(huán)境時,安裝SSH是必須的,但是配置SSH免密登錄并
作業(yè)不是必須的,試述為何還要配置SSH免密登錄。
(2)配置Hadoop是部署Hadoop過程中較為繁瑣的步臊,試述配置Hadoop偽
分布模式和全分布式模式的異同。
預(yù)習(xí)線上資源“實臉指導(dǎo)書-實臉1部署全分布模式Hadoop集群”,了解實臉
預(yù)習(xí)內(nèi)容
目的和實驗內(nèi)容,準(zhǔn)備實驗環(huán)境。
教學(xué)環(huán)節(jié)復(fù)習(xí)提問新課講解課堂討論每課小結(jié)布置作業(yè)
時間分配
10701532
(以分鐘計算)
實驗教學(xué)教案首頁(第3次課)
(以2課時為單元)
課序:3實驗日期:實驗教師:****批準(zhǔn)人:****
一、實驗名稱
實驗1部署全分布模式Hadoop集群
二、實驗?zāi)康?、要?/p>
1.熟練掌握Linux基本命令。
2.掌握靜態(tài)IP地址的配置、主機名和域名映射的修改。
3.掌握Linux環(huán)境下Java的安裝、環(huán)境變量的配置、Java基本命令的使用。
4.理解為何需要配置SSH免密登錄,掌握Linux環(huán)境下SSH的安裝、免密登錄的配
置。
5.熟練掌握在Linux環(huán)境下如何部署全分布模式Hadoop集群。
三、實驗重點、難點
重點:配置全分布模式Hadoop集群。
難點:配置SSH免密登錄。
四、實驗器材、設(shè)備
本實驗所需的軟硬件環(huán)境包括PC、VMwareWorkstationPro、CentOS安裝包、Oracle
JDK安裝包、Hadoop安裝包。
教學(xué)設(shè)計:
一、復(fù)習(xí)提問,回顧部署和運行Hadoop的關(guān)鍵點。教師講述本次實驗的先修技能、實
驗步驟和實驗重點難點。
二、采用實驗法教學(xué),學(xué)生按照本次實驗的實驗指導(dǎo)書進行實驗,教師指導(dǎo)。實驗步驟
如下:
1?酬?掌握
2.熟練簟提Java基本命令
先修技能3.理解SSH安全通信協(xié)議
4.理解Hadoop艇礎(chǔ)知識:運行環(huán)境、運行模式、生態(tài)系統(tǒng)、體系
架構(gòu)、配M文件等
集群架內(nèi)規(guī)劃:主節(jié)點、從節(jié)點、IPi也址、運行服務(wù)、軟硬件配置
1,規(guī)劃部善--------------------------------------------------------------
-------------軟件選擇:虛擬機工具、Linux攆作系統(tǒng)、Java、SSH、Hadoop
2,準(zhǔn)母機卷
配置一
修改主機€
3.準(zhǔn)省軟件環(huán)境,編場域名映射
,安裝和配置Java
f安裝和配置SSH免堂登錄
4,下新安裝Hadoop
Wrj4hddoop.sh:添1?HADOOP_HOME到系統(tǒng)處PATH
配Mhadoop-env.sh:JAVA_HOME,HADOOP_SSH_OPTS,
HADOOP_PID_DIR^
SKmapred-env.sh:JAVAHOME,
HADOOP_MAPRED_PID_DIR^
gBHyarn-env.sh:JAVA_HOME.YARN_PID_DIR^
£Kcore-site.xml:fs.defaultFS,io.file.buffer.size,
?5.配置全分布便式Hadoop集群hadoop.tmp.di售
部署全分布模式
實驗步驟fiiRhdfs-sitejcml:.dir,
Hadoop集群dfs.datanode.data.dir.node.checkpointdir,
dfs.replication等
配芭mapred-site*ml:等
gBMyarn-4ite.xml:yarn.re$ourcemanager.hostname,
yam-nodemanager.aux-services等
SBslaves
6.關(guān)閉防火墻
7.格式化文件系統(tǒng)
start-dfs.sh
start-yanxsh
啟動Hadoopmr-jobhistory-daemon.shstarthistoryserver
8.啟動和驗證Hadoop方法1:jps查看進程
蹈EHadoop方法2:WebUliS看界面
方法3:向Hadoopffe^提交MapReduce應(yīng)用?J?JWordCount
mr-jobhistory-daemon.shstophistoryserver
stop-yam.sh
9.關(guān)閉Hadoopstop-dfs.sh
圖實驗1部署全分布模式Hadoop集群知識地圖
1.規(guī)劃部署。
2.準(zhǔn)備機器。
3.準(zhǔn)備軟件環(huán)境:配置靜態(tài)IP;修改主機名;編輯域名映射;安裝和配置Java;安裝
和配置SSH免密登錄。
4.獲取和安裝Hadoop。
5.配置全分布模式Hadoop集群。
6.關(guān)閉防火墻。
7.格式化文件系統(tǒng)。
8.啟動和驗證Hadoop。
9.關(guān)閉Hadoopo
三、布置課后作業(yè)
1.完成本次實驗的電子版《實驗報告》,并與本周日前上傳至平臺。
2.預(yù)習(xí)“HDFS體系架構(gòu)和文件存儲機制”。
教案首頁(第4次課)
(以2課時為單元)
課序授課日期授課班次授課教師批準(zhǔn)人
4
課題第3講HDFS體系架構(gòu)和文件存儲機制
1.了解大數(shù)據(jù)存儲對文件系統(tǒng)的挑戰(zhàn),理解HDFS文件系統(tǒng)特點。
2,理解HDFS體系架構(gòu),掌握NameNode與DataNode的作用與關(guān)系,掌握HDFS
目的要求元數(shù)據(jù)文件的組成。(重點)
3.理解HDFS文件存儲機制:塊,副本策略。(重點)
4.掌握HDFS數(shù)據(jù)讀寫過程及涉及到的關(guān)鍵類。(重點)
第3章分布式文件系統(tǒng)HDFS
3.1HDFS簡介
教學(xué)內(nèi)容3.2HDFS體系架構(gòu)(重點)
3.3HDFS文件存儲機制(重點)
3.4HDFS數(shù)據(jù)讀寫過程(重點)
重點:HDFS體系架構(gòu),HDFS文件存儲機制,HDFS數(shù)據(jù)讀寫過程。
重點難點
難點:無。
教學(xué)方法
講授法,討論法,演示法,案例法
手段
第3章分布式文件系統(tǒng)HDFS
1.復(fù)習(xí)提問,講評章節(jié)測試2和實驗1,導(dǎo)入本節(jié)內(nèi)容。
教學(xué)步驟2.精講本節(jié)內(nèi)容。
3.進行本節(jié)小結(jié)。
4.布置課后作業(yè)。
復(fù)習(xí)提問簡述部署全分布模式Hadoop集群的基本步驟。
作業(yè)無
預(yù)習(xí)內(nèi)容預(yù)習(xí)“實戰(zhàn)HDFS“、"HDFS高可靠性機制
教學(xué)環(huán)節(jié)復(fù)習(xí)提問新課講解課堂討論每課小結(jié)布置作業(yè)
時間分配
10701532
(以分鐘計算)
教案首頁(第5次課)
(以2課時為單元)
課序授課日期授課班次授課教師批準(zhǔn)人
5
課題第4講實戰(zhàn)HDFS
1.掌握HDFSWebUI的使用,熟練掌握HDFSShelI常用命令使用和HDFS
JavaAPI編程。(重點,難點)
目的要求
2.了解HDFS高可靠性機制:元數(shù)據(jù)備份、SecondaryNameNode>BackupNode
備份、HDFSNameNodeHA^HDFSNameNodeFederation、HDFSSnapshotso
第3章分布式文件系統(tǒng)HDFS
3.5實戰(zhàn)HDFS(重點,難點)
3.5.1HDFSWebUI
教學(xué)內(nèi)容
3.5.2HDFSShelI
3.5.3HDFSJavaAPI編程
3.6HDFS高可靠性機制(了解)
重點:HDFS體系架構(gòu),HDFS文件存儲機制,HDFS數(shù)據(jù)讀寫過程。
重點難點
難點:無。
教學(xué)方法
講授法,討論法,演示法,案例法
手段
第3章分布式文件系統(tǒng)HDFS
教學(xué)步驟1.復(fù)習(xí)提問,導(dǎo)入本節(jié)內(nèi)容。
2.精講本節(jié)內(nèi)容。3.進行本節(jié)小結(jié)。4.布置課后作業(yè)。
1.簡述HDFS是什么。2.簡述HDFS體系架構(gòu)。3.簡述HDFS文件存儲機制。
復(fù)習(xí)提問
4.簡述HDFS數(shù)據(jù)讀寫過程。
1.章節(jié)測試
完成線上測試“章節(jié)測試3-分布式文件系統(tǒng)HDFS”。
作業(yè)2.思考題
(1)簡述HDFS元數(shù)據(jù)的更新和備份過程Checkpoint。
(2)簡述備份節(jié)點和SecondaryNameNode的區(qū)別是什么?
預(yù)習(xí)線上資源“實驗指導(dǎo)書-實驗2實戰(zhàn)HDFS”,了解實驗?zāi)康暮蛯嵞槂?nèi)容,
預(yù)習(xí)內(nèi)容
準(zhǔn)備實驗環(huán)境。
教學(xué)環(huán)節(jié)復(fù)習(xí)提問新課講解課堂討論每課小結(jié)布置作業(yè)
時間分配
5751532
(以分鐘計算)
實驗教學(xué)教案首頁(第3次課)
(以2課時為單元)
課序:6實驗日期:實驗教師:****批準(zhǔn)人:****
一、實驗名稱
實驗2實戰(zhàn)HDFS
二、實驗?zāi)康摹⒁?/p>
1.理解HDFS體系架構(gòu)。
2.理解HDFS文件存儲原理和數(shù)據(jù)讀寫過程。
3.熟練掌握HDFSWebUI界面的使用。
4.熟練掌握HDFSShell常用命令的使用。
5.熟練掌握HDFS項目開發(fā)環(huán)境的搭建。
6.掌握使用HDFSJavaAPI編寫HDFS文件操作程序。
三、實驗重點、難點
重點:使用HDFSWebUI、HDFSSheikHDFSJavaAPI編程。
難點:使用HDFSJavaAPI編程。
四、實驗器材、設(shè)備
本實驗所需的軟件環(huán)境包括全分布模式Hadoop集群、Eclipse。
教學(xué)設(shè)計:
一、復(fù)習(xí)提問,回顧使用HDFSWebUI、HDFSSheikHDFSJavaAPI編程的關(guān)鍵點。
教師講述本次實驗的先修技能、實驗步驟和實驗重點難點。
二、采用實驗法教學(xué),學(xué)生按照本次實驗的實驗指導(dǎo)書進行實驗,教師指導(dǎo)。實驗步驟
如下:
1熟練掌握Linux基本命令
2.掌握J(rèn)ava編程
3.熟練掌握全分布模式Hadoop集群的使用
先修技能
4.理解HDFS基礎(chǔ)知識:功能、體系架構(gòu)、文件存儲原理HDFS接
口等
1啟動Hadoop集群
會2.使用HDFSShell
★3.蝴HDFSWebUI
4.搭建HDFS開發(fā)環(huán)境Eclipse
在Eelipse中創(chuàng)建Java項目
—
實戰(zhàn)HDFS實驗步驟在項目中添加所需JAR包
F*5.使用HDFSJavaAPI編程的目中新建包
戶編寫Java程序
編譯運行程序
6.關(guān)閉Hadoop集群
★童點:使用HDFSWeb5、HDFSShell.HDFSJavaAPI編程
實驗重點難點,難點:使用HDFSJavaAPI編程
rHDFSNameNodeHA高可用環(huán)境搭建
拓展訓(xùn)練-----------------------------
圖實驗2實戰(zhàn)HDFS知識地圖
1.啟動全分布模式Hadoop集群,守護進程包括NameNode、DalaNode、
SecondaryNameNode、ResourceManager,NodeManager和JobHistoryServer(>
2.查看HDFSWeb界面。
3.練習(xí)HDFSShell文件系統(tǒng)命令和系統(tǒng)管理命令。
4.在Hadoop集群主節(jié)點上搭建HDFS開發(fā)環(huán)境Eclipse?
5.使用HDFSJavaAPI編寫HDFS文件操作程序,實現(xiàn)上傳本地文件到HDFS的功能,
采用本地執(zhí)行和集群執(zhí)行的兩種執(zhí)行方式測試,觀察結(jié)果。
6.使用HDFSJavaAPI編寫HDFS文件操作程序,實現(xiàn)查看上傳文件在HDFS集群中
位置的功能,采用本地執(zhí)行和集群執(zhí)行的兩種執(zhí)行方式測試,觀察結(jié)果。
7.關(guān)閉全分布模式Hadoop集群。
三、布置課后作業(yè)
1.完成本次實驗的電子版《實驗報告》,并與本周日前上傳至平臺。
2.預(yù)習(xí)“MapReduce概述和作業(yè)執(zhí)行流程”。
教案首頁(第7次課)
(以2課時為單元)
課序授課日期授課班次授課教師批準(zhǔn)人
7
課題第5講MapReduce概述及作業(yè)執(zhí)行流程
1.理解MapReduce編程思想。(重點)
2.掌握MapReduce應(yīng)用程序WordCount中Mapper類、Reducer類、main。方
法的編寫(重點、難點),并熟練掌握向Hadoop集群提交MR作業(yè)和查看結(jié)果
目的要求的方法(重點)。
3.理解MapReduce作業(yè)執(zhí)行流程的五個階段,理解MapReduce2.0作業(yè)執(zhí)行
時體系架構(gòu)。(重點)
4.理解Shuffle機制。(難點)
第4章分布式計算框架MapReduce
4.1MapReduce簡介(重點)
分而治之:鍵值對〈key,vaIue>
4.2第一個MapReduce案例:WordCount(重點)
教學(xué)內(nèi)容
Mapper類、Reducer類、main。方法的編寫
4.3MapReduce作業(yè)執(zhí)行流程(重點)
InputFormat,Map,ShuffIe,Reduce,OutputFormat
4.5Shuffle機制(難點)
重點:MapReduce編程思想;WordCount中Mapper類、Reducer類、main()方
法的編寫;MapReduce作業(yè)執(zhí)行流程。
重點難點
難點:WordCount中Mapper類、Reducer類、main。方法的編寫;Shuffle機
制。
教學(xué)方法
講授法,演示法,案例法
手段
1.復(fù)習(xí)提問,講評章節(jié)測試3和實驗2,導(dǎo)入本節(jié)內(nèi)容。2.精講教學(xué)內(nèi)容。
教學(xué)步驟
3.進行本節(jié)小結(jié)。4.布置課后作業(yè)。
復(fù)習(xí)提問簡述HDFS的體系架構(gòu)和接口。
作業(yè)自行編寫MapReduce程序WordCountDIY,并提交Hadoop集群運行。
預(yù)習(xí)內(nèi)容預(yù)習(xí)“MapReduce數(shù)據(jù)類型與格式”、“在MapReduce中自定義組件”。
教學(xué)環(huán)節(jié)復(fù)習(xí)提問新課講解課堂討論每課小結(jié)布置作業(yè)
時間分配
10701532
(以分鐘計算)
教案首頁(第8次課)
(以2課時為單元)
課序授課日期授課班次授課教師批準(zhǔn)人
8
課題第6講MapReduce數(shù)據(jù)類型和自定義組件
1.掌握MapReduce數(shù)據(jù)類型(重點),理解序列化和反序列化(難點)。
目的要求2.了解自定義輸入組件、自定義排序組件、自定義分區(qū)組件、自定義輸出組
件的編寫。(難點)
第4章分布式計算框架MapReduce
4.4MapReduce數(shù)據(jù)類型與格式
序列化,反序列化
IntWritable,LongWritable,FloatWritabIe,DoubleWritabIe,ByteWritabIe
BooIeanWritabIe,Text,NuIIWritabIe
4.6在MapReduce中自定義組件
輸入組件:org.apache,hadoop.mapreduce.InputFormat,RecordReader,重
教學(xué)內(nèi)容
寫createRecordReader()
排序組件:自定義類實現(xiàn)ComparabIe或WritabIeComparabIe,重寫
compareToO
分區(qū)組件:org.apache.hadoop.mapreduce.Partitioner,重寫
getPartition()
輸出組件:org.apache.hadoop.mapreduce.OutputFormat,RecordWriter,重
寫getRecordWriter()
重點:MapReduce數(shù)據(jù)類型。
重點難點
難點:序列化和反序列化;MapReduce自定義組件編寫。
教學(xué)方法
講授法,演示法,案例法
手段
1.復(fù)習(xí)提問,導(dǎo)入本節(jié)內(nèi)容。
教學(xué)步驟
2.精講教學(xué)內(nèi)容。3.進行本節(jié)小結(jié)。4.布置課后作業(yè)。
復(fù)習(xí)提問簡述MapReduce作業(yè)執(zhí)行流程。
作業(yè)重讀MapReduce示例程序WordCount,深入理解其中的數(shù)據(jù)類型。
預(yù)習(xí)內(nèi)容預(yù)習(xí)“實戰(zhàn)MapReduce”、“其它主流計算框架
教學(xué)環(huán)節(jié)復(fù)習(xí)提問新課講解課堂討論每課小結(jié)布置作業(yè)
時間分配
5701555
(以分鐘計算)
實驗教學(xué)教案首頁(第9次課)
(以2課時為單元)
課序:9實驗日期:實驗教師:****批準(zhǔn)人:****
一、實驗名稱
實驗3MapReduce編程(1)
二、實驗?zāi)康?、要?/p>
1.理解MapReduce編程思想。
2.理解MapReduce作業(yè)執(zhí)行流程。
3.理解MR-App編寫步驟,掌握使用MapReduceJavaAPI進行MapReduce基本編程,
熟練掌握如何在Hadoop集群上
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《實驗室生物安全》課件
- 2009年高考語文試卷(北京)(解析卷)
- 幼兒園科學(xué)活動說課稿
- 材料工程師工作總結(jié)
- 2023年-2024年安全教育培訓(xùn)試題含答案(B卷)
- 《電商營銷推廣》課件
- 云計算商業(yè)模式-洞察分析
- 星系團形成與演化-洞察分析
- 網(wǎng)絡(luò)電影與觀眾互動-洞察分析
- 水平轉(zhuǎn)移的進化意義-洞察分析
- 2024養(yǎng)老院消防設(shè)備升級與消防系統(tǒng)維護服務(wù)合同3篇
- 2024-2025學(xué)年寒假致學(xué)生家長的一封信(安全版)
- 單位內(nèi)部治安保衛(wèi)制度
- 人才引進政策購房合同模板
- 學(xué)生宿舍消防安全制度模版(3篇)
- GB/T 44990-2024激光熔覆修復(fù)層界面結(jié)合強度試驗方法
- 四川省成都市2023-2024學(xué)年高二上學(xué)期期末調(diào)研考試語文試題(解析版)
- ps經(jīng)典課程-海報設(shè)計(第六講)
- 江蘇省泰州市2023-2024學(xué)年高一上學(xué)期期末語文試題及答案
- 【MOOC】工程制圖解讀-西安交通大學(xué) 中國大學(xué)慕課MOOC答案
- 期末復(fù)習(xí)(試題)-2024-2025學(xué)年三年級上冊數(shù)學(xué)蘇教版
評論
0/150
提交評論