




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Hadoop自定義序列化類1.理解Hadoop序列化
2.了解序列化特點(diǎn)
3.掌握自定義序列化類1.
Hadoop序列化
2.序列化特點(diǎn)
3.自定義序列化類1、序列化(Serialization)是指把結(jié)構(gòu)化對(duì)象轉(zhuǎn)化為字節(jié)流。2、反序列化(Deserialization)是序列化的逆過程。即把字節(jié)流轉(zhuǎn)回結(jié)構(gòu)化對(duì)象。3、Java序列化(java.io.Serializable)Hadoop序列化作用:1、序列化在分布式環(huán)境的兩大作用:進(jìn)程間通信,永久存儲(chǔ)。2、Hadoop節(jié)點(diǎn)間通信。Hadoop的序列化格式:WritableHadoop序列化1、緊湊:高效使用存儲(chǔ)空間。2、快速:讀寫數(shù)據(jù)的額外開銷小3、可擴(kuò)展:可透明地讀取老格式的數(shù)據(jù)4、互操作:支持多語言的交互序列化格式特點(diǎn)publicclassTrafficApp{ publicstaticvoidmain(String[]args)throwsIOException,ClassNotFoundException,InterruptedException{ Jobjob=Job.getInstance(newConfiguration(),TrafficApp.class.getSimpleName()); job.setJarByClass(TrafficApp.class); FileInputFormat.setInputPaths(job,args[0]); job.setMapperClass(MyMapper.class); job.setMapOutputKeyClass(Text.class); job.setMapOutputValueClass(TrafficWritable.class); job.setReducerClass(MyReduce.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(TrafficWritable.class); FileOutputFormat.setOutputPath(job,newPath(args[1])); job.waitForCompletion(true); }自定義序列化類publicstaticclassMyMapperextendsMapper<LongWritable,Text,Text,TrafficWritable>{ Textk2=newText(); TrafficWritablev2=newTrafficWritable(); @Override protectedvoidmap(LongWritablekey,Textvalue, Mapper<LongWritable,Text,Text,TrafficWritable>.Contextcontext) throwsIOException,InterruptedException{ Stringline=value.toString(); String[]splited=line.split("\t"); k2.set(splited[1]); v2.set(splited[6],splited[7],splited[8],splited[9]); context.write(k2,v2); } }自定義序列化類publicstaticclassMyReduceextendsReducer<Text,TrafficWritable,Text,TrafficWritable>{ TrafficWritablev3=newTrafficWritable(); @Override protectedvoidreduce(Textk2,Iterable<TrafficWritable>v2s, Reducer<Text,TrafficWritable,Text,TrafficWritable>.Contextcontext) throwsIOException,InterruptedException{ longt1=0L; 自定義序列化類longt2=0L; longt3=0L; longt4=0L; for(TrafficWritablev2:v2s){ t1+=v2.t1; t2+=v2.t2; t3+=v2.t3; t4+=v2.t4; } v3.set(t1,t2,t3,t4); context.write(k2,v3); } }自定義序列化類longt2=0L; longt3=0L; longt4=0L; for(TrafficWritablev2:v2s){ t1+=v2.t1; t2+=v2.t2; t3+=v2.t3; t4+=v2.t4; } v3.set(t1,t2,t3,t4); context.write(k2,v3); } }自定義序列化類staticclassTrafficWritableimplementsWritable{ longt1; longt2; longt3; longt4; publicTrafficWritable(){} publicvoidset(longt1,longt2,longt3,longt4){ this.t1=t1; this.t2=t2; this.t3=t3; this.t4=t4; }自定義序列化類publicvoidset(Stringt1,Stringt2,Stringt3,Stringt4){ this.t1=Long.parseLong(t1); this.t2=Long.parseLong(t2); this.t3=Long.parseLong(t3); this.t4=Long.parseLong(t4); } publicvoidreadFields(DataInputin)throwsIOException{ this.t1=in.readLong(); this.t2=in.readLong(); this.t3=in.readLong(); this.t4=in.readLong(); }自定義序列化類publicvoidwrite(DataOutputout)throwsIOException{ out.writeLong(t1); out.writeLong(t2); out.writeLong(t3); out.write
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 四平職業(yè)大學(xué)《現(xiàn)代物流裝備》2023-2024學(xué)年第一學(xué)期期末試卷
- 11道心理測(cè)試題及答案
- 2024-2025學(xué)年福建省泉州市晉江市泉州五中學(xué)橋南校區(qū)數(shù)學(xué)七上期末學(xué)業(yè)質(zhì)量監(jiān)測(cè)試題含解析
- 天津商業(yè)大學(xué)寶德學(xué)院《導(dǎo)游基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 新疆理工學(xué)院《工程制圖》2023-2024學(xué)年第一學(xué)期期末試卷
- 蘇州科技大學(xué)《國際關(guān)系分析》2023-2024學(xué)年第一學(xué)期期末試卷
- 海南比勒費(fèi)爾德應(yīng)用科學(xué)大學(xué)《藝術(shù)史》2023-2024學(xué)年第一學(xué)期期末試卷
- 南京工業(yè)大學(xué)《中學(xué)生物教材分析》2023-2024學(xué)年第一學(xué)期期末試卷
- 蘇州農(nóng)業(yè)職業(yè)技術(shù)學(xué)院《私人教練》2023-2024學(xué)年第一學(xué)期期末試卷
- 大連東軟信息學(xué)院《數(shù)值計(jì)算方法A》2023-2024學(xué)年第一學(xué)期期末試卷
- PSS的生產(chǎn)工藝及原理課件
- 2023-2024學(xué)年浙江省富陽市小學(xué)數(shù)學(xué)五年級(jí)下冊(cè)期末自測(cè)試卷
- 防火墻安全策略檢查表
- 研究借鑒晉江經(jīng)驗(yàn)-加快縣域經(jīng)濟(jì)發(fā)展
- GB/T 12706.4-2020額定電壓1 kV(Um=1.2 kV)到35 kV(Um=40.5 kV)擠包絕緣電力電纜及附件第4部分:額定電壓6 kV(Um=7.2 kV)到35 kV(Um=40.5 kV)電力電纜附件試驗(yàn)要求
- 2023年鎮(zhèn)江丹陽市民政局系統(tǒng)事業(yè)單位招聘筆試模擬試題及答案
- 國開電大 操作系統(tǒng) 實(shí)驗(yàn)4:文件管理實(shí)驗(yàn)報(bào)告
- 北京理工附中小升初分班考試真題
- 安徽省小學(xué)學(xué)生學(xué)籍表
- 無創(chuàng)腦血氧監(jiān)護(hù)儀技術(shù)審評(píng)報(bào)告
- 糖尿病足的診斷與治療ppt課件
評(píng)論
0/150
提交評(píng)論