版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
負責(zé)人:鄭美容01目錄系統(tǒng)日志數(shù)據(jù)采集系統(tǒng)日志數(shù)據(jù)采集1系統(tǒng)日志數(shù)據(jù)采集
Flume是由cloudera軟件公司產(chǎn)出的可分布式日志收集系統(tǒng),后與2009年被捐贈了apache軟件基金會,為hadoop相關(guān)組件之一。尤其近幾年隨著Flume的不斷被完善以及升級版本的逐一推出,特別是Flume-NG;同時flume內(nèi)部的各種組件不斷豐富,用戶在開發(fā)的過程中使用的便利性得到很大的改善,現(xiàn)已成為apachetop項目之一。系統(tǒng)日志數(shù)據(jù)采集Flume概述:(1)Flume是一個分布式、可靠、和高可用的海量日志采集、聚合和傳輸?shù)南到y(tǒng)。(2)Flume可以采集文件,socket數(shù)據(jù)包等各種形式源數(shù)據(jù),又可以將采集到的數(shù)據(jù)輸出到HDFS、hbase、hive、kafka等眾多外部存儲系統(tǒng)中。(3)一般的采集需求,通過對flume的簡單配置即可實現(xiàn)。(4)Flume針對特殊場景也具備良好的自定義擴展能力,因此,flume可以適用于大部分的日常數(shù)據(jù)采集場景。系統(tǒng)日志數(shù)據(jù)采集Flume架構(gòu):Flume的核心就是一個Agent,每個FlumeAgent有三個組件:Source、Channel、Sink。系統(tǒng)日志數(shù)據(jù)采集(1)Flume分布式系統(tǒng)中最核心的角色是agent,F(xiàn)lume采集系統(tǒng)就是由一個個agent所連接起來形成(2)每一個agent相當(dāng)于一個數(shù)據(jù)傳遞員,內(nèi)部有三個組件:
Source:采集源,用于跟數(shù)據(jù)源對接,以獲取數(shù)據(jù)
Channel:主要提供一個隊列的功能,對source提供中的數(shù)據(jù)進行簡單的緩存并傳遞到Sink中
Sink:下沉地,采集數(shù)據(jù)的傳送目的,用于往下一級agent傳遞數(shù)據(jù)或者往最終存儲系統(tǒng)傳遞數(shù)據(jù)。系統(tǒng)日志數(shù)據(jù)采集(1)Flume的核心組件Source的使用:
Flume提供了各種source的實現(xiàn),包括AvroSource、ExceSource、SpoolingDirectorySource、NetCatSource、SyslogSource等對現(xiàn)有系統(tǒng)影響最小的是ExecSource和SpoolSource這兩種方式:(1)ExecSource是以運行Linux命令的方式,持續(xù)的按照文件名輸出最新的數(shù)據(jù),如tail-F文件名指令(2)Spool
Source是監(jiān)測配置的目錄下新增的文件,并將文件中的數(shù)據(jù)讀取出來系統(tǒng)日志數(shù)據(jù)采集(2)Flume的核心組件Sink的使用Flume也提供了各種sink的實現(xiàn),包括HDFSsink、Loggersink、Avrosink、FileRollsink、Nullsink、HBasesink,etc等FlumeSink在設(shè)置存儲數(shù)據(jù)時,可以向文件系統(tǒng)中,數(shù)據(jù)中庫,hadoop中儲數(shù)據(jù)。(3)Flume的核心組件Chanel的使用Flume對于Channel,則提供了MemoryChannel、JDBCChanel、FileChannel,etc等實現(xiàn)MemoryChannel可以實現(xiàn)高速的吞吐,但是無法保證數(shù)據(jù)的完整性,MemoryRecoverChannel在官方文檔的建議上已經(jīng)建義使用FileChannel來替換。FileChannel保證
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 米高蒲志2024薪酬報告(雇主)
- 2025年廣東佛山市禪城區(qū)盈浩排水建設(shè)管養(yǎng)有限公司招聘筆試參考題庫附帶答案詳解
- 2025年甘肅玉門市玉門關(guān)文化旅游開發(fā)有限責(zé)任公司招聘筆試參考題庫附帶答案詳解
- 2025年青島地鐵集團有限公司招聘筆試參考題庫含答案解析
- 2025年安徽天航機電有限公司招聘筆試參考題庫含答案解析
- 綠色簡約風(fēng)我的家鄉(xiāng)揚州介紹
- 二零二五年度科技企業(yè)融資貨款擔(dān)保服務(wù)合同范本3篇
- 鋼鐵投資合同三篇
- 二零二五年度建筑工程施工合同違約責(zé)任限定3篇
- 二零二五年度房地產(chǎn)開發(fā)商與合伙人股權(quán)入股協(xié)議模板:入股合同6篇
- (完整版)鋼筋加工棚驗算
- 安徽省合肥市廬陽區(qū)2023-2024學(xué)年三年級上學(xué)期期末數(shù)學(xué)試卷
- 概念方案模板
- 西南交大畢業(yè)設(shè)計-地鐵車站主體結(jié)構(gòu)設(shè)計
- 2024年山東傳媒職業(yè)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 江蘇省南通市崇川區(qū)2023-2024學(xué)年三年級上學(xué)期期末語文試卷
- 華電行測題庫及答案2024
- crtd植入術(shù)護理查房
- 掃雪鏟冰安全教育培訓(xùn)
- 人教版三年級下冊必讀書目《中國古代寓言故事》
- 涉密內(nèi)網(wǎng)分級保護設(shè)計方案
評論
0/150
提交評論