版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
主講:張義目錄0102Spark內(nèi)存分配MapReduce集群調(diào)優(yōu)總結(jié)Spark內(nèi)存分配1Spark內(nèi)存分配Spark使用內(nèi)存有兩個目的:執(zhí)行作業(yè)和存儲數(shù)據(jù)。執(zhí)行內(nèi)存是Spark用來執(zhí)行shuffle、join、sort和aggregation功能的。存儲內(nèi)存用于緩存數(shù)據(jù)和傳輸集群內(nèi)的內(nèi)部數(shù)據(jù)。當(dāng)不使用任何執(zhí)行內(nèi)存時,作業(yè)可以使用所有可用的內(nèi)存進行存儲。在使用的存儲內(nèi)存達到使用閾值之前,執(zhí)行內(nèi)存可以從內(nèi)存中取出可用的存儲內(nèi)存。Spark在其內(nèi)存中提供了一個子區(qū)域,在其中緩存可以長時間存活的數(shù)據(jù)塊,其不會被用作執(zhí)行內(nèi)存。然而,存儲內(nèi)存永遠不會被用作執(zhí)行內(nèi)存。Spark內(nèi)存分配Spark的動態(tài)自動內(nèi)存分配功能可以自動調(diào)整分配給shufle操作和緩存的內(nèi)存。對于Spark的內(nèi)存,可以通過命令行確定用于分組、連接和聚合的shuffle數(shù)據(jù)結(jié)構(gòu)的最大大小。Spark還需要一些非堆存儲內(nèi)存。Spark需要在RDDS內(nèi)存和用于運行shuffle進程的內(nèi)存及非堆存儲內(nèi)存之間進行權(quán)衡。作業(yè)由任務(wù)組成。任務(wù)執(zhí)行Spark代碼。驅(qū)動程序是老板一它將任務(wù)分配給工作節(jié)點。工作進程運行執(zhí)行器,其中可以包括多個任務(wù)。驅(qū)動程序負責(zé)運行應(yīng)用程序,并在應(yīng)用程序執(zhí)行時對所有必要的動作進行管理。MapReduce集群調(diào)優(yōu)總結(jié)2MapReduce集群調(diào)優(yōu)總結(jié)對前面的MapReduce集群調(diào)優(yōu)的學(xué)習(xí)內(nèi)容中,總結(jié)出以下幾點:給YARN作業(yè)合理地分配內(nèi)存是優(yōu)化集群資源使用的重要方法。如果為容器分配的內(nèi)存太多,則浪費了集群的資源。太少的內(nèi)存,意味著任務(wù)運行的時間會延長,甚至有時會失敗。當(dāng)配置集群的內(nèi)存時,再也沒有比學(xué)習(xí)和理解Hadoop的配置參數(shù)更重要的了。MapReduce集群調(diào)優(yōu)總結(jié)可以使用各種策略來優(yōu)化MapReduce作業(yè),其中一些策略需要管理員設(shè)置集群級別的配置屬性,而有些策略則需要進行程序開發(fā)方面的改動,包括編寫更有效的代碼和使用先進的概念,如combiners和partitioners等。可以利用多種優(yōu)化技術(shù)來提高Hive和Pig作業(yè)的性能。在進行重要改動時進行基準(zhǔn)測試是一個好主意,比如添加更多的服務(wù)器或更改重要的配置參數(shù)?;鶞?zhǔn)測試還可以用于比較不同集群的性能。理解Hadoop的內(nèi)置計數(shù)器有助于作業(yè)故障排除和作業(yè)性能調(diào)優(yōu)。MapReduce集群調(diào)優(yōu)總結(jié)MapReduce旨在處理大數(shù)據(jù)。由于在MapReduce框架中,在默認情況下,每個mapper任務(wù)都會處理一個HDFS文件,所以如果有大量輸入文件,則使用特殊輸入格式(如MultiIFileInputFormat)可以更有效地處理每個mapper任務(wù)中的多個文件。而且,讓每個mapper處理更大的數(shù)據(jù)塊是個好主意。那么一個好的策略是將多個小輸入文件
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 外貿(mào)代理合同
- 新農(nóng)村房屋買賣合同范本
- 房東租房合同
- 二零二五年度汽車維修行業(yè)專利申請簡易合同
- 2025年度酒店總經(jīng)理聘用合同書-酒店資產(chǎn)增值
- 二零二五年度超市租賃合同排他性技術(shù)支持協(xié)議
- 二零二五年度解除合同終止合同模板:新能源汽車產(chǎn)業(yè)鏈合作終止協(xié)議
- 二零二五年度藝人跨界合作市場推廣合同
- 二零二五年度船舶焊接維修與檢驗合同
- 2025年度智能設(shè)備采購合同終止及后續(xù)服務(wù)保障通知函
- 《諫太宗十思疏》《答司馬諫議書》-統(tǒng)編版高中語文必修下冊
- 02R112 拱頂油罐圖集
- GB/T 42249-2022礦產(chǎn)資源綜合利用技術(shù)指標(biāo)及其計算方法
- 扶梯吊裝方案
- GB/T 712-2011船舶及海洋工程用結(jié)構(gòu)鋼
- GB/T 26846-2011電動自行車用電機和控制器的引出線及接插件
- GB/T 18015.1-1999數(shù)字通信用對絞或星絞多芯對稱電纜第1部分:總規(guī)范
- 院醫(yī)學(xué)實習(xí)請假審批表
- 2020-2021學(xué)年青島版五年級上冊期末考試數(shù)學(xué)試卷(1)1
- 導(dǎo)師指導(dǎo)記錄表
- 七年級數(shù)學(xué)家長會課件
評論
0/150
提交評論