版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
主講:張義目錄0102內(nèi)存不足問(wèn)題Spark和JVM垃圾回收內(nèi)存不足問(wèn)題1內(nèi)存不足問(wèn)題在有的情況下,當(dāng)試圖使用hdfsdfs-ls命令列出HDFS上一個(gè)目錄下的所有文件時(shí),會(huì)遇到內(nèi)存溢出(OOM)問(wèn)題:java.lang.OutOfMemoryError:Javaheapspace或者會(huì)看到如下的錯(cuò)誤:Exceptioninthread“main”java.lang.OutOfMemoryError:Javaheapspace內(nèi)存不足問(wèn)題atjava.util.Arrays.copyof(Arrays.java:2367)atjava.lang.AbstractstringBuilder.expandCapacity(AbstractStringBuilder.java:130)atjava.lang.AbstractstringBuilder.ensureCapacityInternal(AbstractStringBuilder.java:114)at...內(nèi)存不足問(wèn)題這是因?yàn)?,?dāng)試圖列出一個(gè)包含大量對(duì)象的目錄的所有內(nèi)容時(shí),HDFS客戶端的默認(rèn)的246MB堆內(nèi)存顯得過(guò)小了。可以通過(guò)為堆內(nèi)存設(shè)置更高的值來(lái)提高Hadoop客戶端的堆內(nèi)存大小,如下所示:HADOOP_HEAPSIZE=1024hdfsdfs-ls/user/samHadoop客戶端現(xiàn)在擁有了更大的Java堆內(nèi)存,可以應(yīng)付對(duì)HDFS目錄內(nèi)容的檢索。內(nèi)存不足問(wèn)題下面是另外一個(gè)因OOM導(dǎo)致Spark作業(yè)崩潰的例子:ERRORExecutor:Exceptionintask25.0instage16.0(TID999)java.lang.OutOfMemoryError:GCoverheadlimitexceededResolution:spark.executor.memory:Amountofmemorytouseperexecutorprocess,inthesameformatasJVMmemorystrings.該例子中給出了問(wèn)題及問(wèn)題解決方案!需要通過(guò)提高spark.executor.memory配置參數(shù)的值來(lái)增大執(zhí)行器的內(nèi)存,如第19章所述。Spark和JVM垃圾回收2Spark和JVM垃圾回收Spark應(yīng)用程序使用100GB以及更高的堆內(nèi)存空間是不常見的。在Spark環(huán)境中,JVM的垃圾回收機(jī)制引起的暫停和崩潰是一個(gè)常見的需要關(guān)注的問(wèn)題。Spark和JVM垃圾回收J(rèn)ava應(yīng)用程序中常用的標(biāo)準(zhǔn)垃圾回收策略是并發(fā)標(biāo)記掃描(CMS)和老年代并行(ParallelOld)回收策略。CMS回收策略著重于低延遲,ParallelOld回收策略著重于更高的吞吐量。兩種回收策略都曾被證明是可能的性能瓶頸——CMS垃圾回收不執(zhí)行任何的壓縮,而ParallelOld垃圾回收只執(zhí)行整個(gè)堆的壓縮,這會(huì)引起較長(zhǎng)時(shí)間的停頓,從而影響應(yīng)用的性能。如果應(yīng)用程序要求實(shí)時(shí)響應(yīng),則通常情況下CMS垃圾回收策略是比較好的選擇;如果應(yīng)用程序更偏向于批處理分析,則可以使用ParallelOld垃圾回收策略。Spark和JVM垃圾回收由于Spark兼具流式與批處理的雙重功能,因此可以考慮在Hotspot的2.6版本JVM中引入的更新的Garbage-First(G1GC)垃圾回收器。G1垃圾回收器最終會(huì)取代CMS垃圾回收器,其目標(biāo)是同時(shí)提供低延遲與高吞吐。Spark和JVM垃圾回收無(wú)論采用何種GC回收策略,最關(guān)鍵的仍然是通過(guò)減少中間對(duì)象的創(chuàng)建或復(fù)制、長(zhǎng)時(shí)間運(yùn)行對(duì)象的堆外存放,以及限制超大對(duì)象的創(chuàng)建等來(lái)優(yōu)化內(nèi)存的使用。Spark和JVM垃圾回收在給一個(gè)執(zhí)行器分配的內(nèi)存中,75%用于存儲(chǔ)和執(zhí)行。如果不需要很多內(nèi)存來(lái)存儲(chǔ)RDD,則可以通過(guò)設(shè)置spark.storage.mem
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年甘肅會(huì)展中心有限責(zé)任公司招聘筆試參考題庫(kù)含答案解析
- 2025版智慧城市運(yùn)營(yíng)項(xiàng)目融資協(xié)議合同范本3篇
- 2025年度個(gè)人小戶型房產(chǎn)買賣及裝修改造合同4篇
- 2025年個(gè)人森林撫育與更新承包合同4篇
- 2025年全球及中國(guó)醫(yī)用協(xié)作機(jī)器人行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025-2030全球鄰氯苯腈(氯化法)行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球觸控?zé)粜袠I(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025版拖拉機(jī)銷售與保險(xiǎn)服務(wù)合同范本6篇
- 2025年度房產(chǎn)租賃合同(含租金調(diào)整及違約責(zé)任)3篇
- 2025年度個(gè)人設(shè)備租賃貸款合同范本7篇
- 2024年全國(guó)職業(yè)院校技能大賽高職組(研學(xué)旅行賽項(xiàng))考試題庫(kù)(含答案)
- 2025年溫州市城發(fā)集團(tuán)招聘筆試參考題庫(kù)含答案解析
- 2025年中小學(xué)春節(jié)安全教育主題班會(huì)課件
- 2025版高考物理復(fù)習(xí)知識(shí)清單
- 計(jì)量經(jīng)濟(jì)學(xué)練習(xí)題
- 除數(shù)是兩位數(shù)的除法練習(xí)題(84道)
- 2025年度安全檢查計(jì)劃
- 2024年度工作總結(jié)與計(jì)劃標(biāo)準(zhǔn)版本(2篇)
- 全球半導(dǎo)體測(cè)試探針行業(yè)市場(chǎng)研究報(bào)告2024
- 反走私課件完整版本
- 2024年注冊(cè)計(jì)量師-一級(jí)注冊(cè)計(jì)量師考試近5年真題附答案
評(píng)論
0/150
提交評(píng)論