版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Hadoop技術(shù)原理FlumeFlume簡(jiǎn)介01Flume簡(jiǎn)介01對(duì)于海量實(shí)時(shí)產(chǎn)生的日志,我們看出它需要經(jīng)過(guò)一個(gè)“橋梁”或中介,這就是這章要學(xué)的Flume(Flume翻譯成中文是水槽)。Flume把采集后的實(shí)時(shí)日志保存到HDFS或HBase中,可以進(jìn)行離線計(jì)算。比如,要統(tǒng)計(jì)出最近一周的用戶異常的數(shù)據(jù),按地區(qū)劃分,展示到一張地圖上。另一種方式,則是Flume可以把采集到的實(shí)時(shí)日志,發(fā)送給消息中間件,比如Kafka,然后送到實(shí)時(shí)計(jì)算引擎進(jìn)行計(jì)算,實(shí)時(shí)分析出當(dāng)前存在的異常情況Flume簡(jiǎn)介02Flume是一個(gè)高可用的,高可靠的,分布式的海量日志采集、聚合和傳輸?shù)南到y(tǒng)(Flume由Cloudera提供)Flume支持在日志系統(tǒng)中定制各類數(shù)據(jù)發(fā)送方,用于收集數(shù)據(jù)。Flume提供對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單處理,并寫到各種數(shù)據(jù)接收方(可定制)的能力。Flume簡(jiǎn)介03Flume在Hadoop生態(tài)圈中的地位Flume架構(gòu)04生活中的Flume(水槽)Flume架構(gòu)05Flume的核心(Agent)Flume架構(gòu)06Flume的核心(Agent)Source組件:從數(shù)據(jù)源接收數(shù)據(jù)(即采集數(shù)據(jù));Channel組件:連接Source和Sink的管道,緩存數(shù)據(jù)。Sink組件:傳遞數(shù)據(jù)給目的地(即保存數(shù)據(jù));Flume架構(gòu)07Flume傳遞的數(shù)據(jù):Event(事件)Event:Flume將數(shù)據(jù)表示為Event。Event是Flume的處理數(shù)據(jù)元,它可能是一條日志、一個(gè)Avro對(duì)象等,通常約4KB大小Flume安裝與應(yīng)用02Flume安裝01Flume安裝步驟下載安裝包apache-flume-1.8.0-bin.tar.gz解壓到指定目錄下tar-zxvfapache-flume-1.8.0-bin.tar.gz-C/usr/local/src/修改環(huán)境變量,在~/.bashrc文件增加exportFLUME_HOME=/usr/local/src/flumeexportPATH=$FLUME_HOME/bin:$PATH執(zhí)行source~/.bashrc,使配置生效。Flume應(yīng)用02Flume組件類型Channel類型Channel類型描述MemoryChannelEvent數(shù)據(jù)存儲(chǔ)在內(nèi)存中JDBCChannelEvent數(shù)據(jù)存儲(chǔ)在持久化存儲(chǔ)中FileChannelEvent數(shù)據(jù)存儲(chǔ)在磁盤文件中SpillableMemoryChannelEvent數(shù)據(jù)存儲(chǔ)在內(nèi)存中和磁盤上,當(dāng)內(nèi)存隊(duì)列已滿,將持久化到磁盤文件(不建議生產(chǎn)環(huán)境使用)PseudoTransactionChannel測(cè)試用途KafkaChannelEvent存儲(chǔ)在KafkaCustomChannel自定義更多屬性請(qǐng)參考官方文檔Flume應(yīng)用03Flume組件類型Source類型更多屬性請(qǐng)參考官方文檔Source類型描述AvroSource支持Avro協(xié)議,即AvroRPC,內(nèi)置支持ThriftSource支持Thrift協(xié)議,內(nèi)置支持ExecSource基于Unix的命令在標(biāo)準(zhǔn)輸出上生產(chǎn)數(shù)據(jù)JMSSource從JMS(JavaMessageServer)系統(tǒng)中讀取數(shù)據(jù)SpoolingDirectorySource監(jiān)控指定目錄內(nèi)數(shù)據(jù)變化NetcatSource監(jiān)控某個(gè)端口,將流經(jīng)端口的文本行數(shù)據(jù)作為Event輸入SequenceGeneratorSource序列生成器數(shù)據(jù)源,生產(chǎn)序列數(shù)據(jù)SyslogSource讀取syslog數(shù)據(jù),產(chǎn)生Event,支持UDP和TCP協(xié)議KafkaSource從kafkatopic中獲取數(shù)據(jù)HTTPSource基于HTTPPOST或GET方式的數(shù)據(jù)源,支持JSON等格式LegacySource兼容FlumeOG中Source(0.9.x版本)Flume應(yīng)用04Flume組件類型Sink類型更多屬性請(qǐng)參考官方文檔Sink類型描述HDFSSink數(shù)據(jù)寫入HDFSHBaseSink數(shù)據(jù)寫入HBaseHiveSink數(shù)據(jù)寫入HiveLoggerSink數(shù)據(jù)寫入日志文件AvroSink數(shù)據(jù)被轉(zhuǎn)換成AvroEvent,然后發(fā)送到配置的RPC端口上ThriftSink數(shù)據(jù)被轉(zhuǎn)換成ThriftEvent,然后發(fā)送到配置的RPC端口上IRCSink數(shù)據(jù)在IRC上進(jìn)行回放FileRollSink數(shù)據(jù)存儲(chǔ)到本地文件系統(tǒng)NullSink丟棄所有數(shù)據(jù)MorphineSolrSink數(shù)據(jù)發(fā)送到Solr搜索服務(wù)器(集群)ElasticSerachSink數(shù)據(jù)發(fā)送到ElasticSearch搜索服務(wù)器(集群)CustomSink自定義Flume配置方法05配置口訣:一個(gè)定義,三個(gè)配置注意:一個(gè)Source可以配置多個(gè)Channel,但一個(gè)Sink只能配置一個(gè)ChannelFlume配置方法06配置示例1監(jiān)控指定目錄,當(dāng)目錄有新增文件時(shí),把文件中的內(nèi)容一行行發(fā)送到控制臺(tái)Flume配置方法07配置示例2監(jiān)控指定目錄,當(dāng)目錄有新的日志時(shí),將它保存到HDFS中Flume工作方式08多agent流可以將多個(gè)Agent順序連接起來(lái),將最初的數(shù)據(jù)源經(jīng)過(guò)收集,存儲(chǔ)到最終的存儲(chǔ)系統(tǒng)中。前面agent的sink、當(dāng)前agent的source需要是avro類型sink指向source的主機(jī)名(或IP地址)和端口。Flume工作方式09多ag
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版服務(wù)合同終止條款具體執(zhí)行合同一
- 二零二五版建筑工地臨時(shí)應(yīng)急預(yù)案制定與演練合同3篇
- 二零二五年度設(shè)備維修保養(yǎng)合同for工業(yè)機(jī)器人2篇
- 二零二五年度視覺(jué)設(shè)計(jì)合同2篇
- 2024版智能家居系統(tǒng)集成服務(wù)合同
- 二零二五年黃金抵押貸款擔(dān)保投資合同3篇
- 二零二五年度新能源汽車充電樁建設(shè)標(biāo)前協(xié)議3篇
- 2024年生態(tài)修復(fù)技術(shù)支持協(xié)議
- 二零二五版工藝品電商平臺(tái)入駐與運(yùn)營(yíng)合作協(xié)議3篇
- 二零二五年度高凈值客戶黃金質(zhì)押貸款服務(wù)合同3篇
- 五年級(jí)上冊(cè)口算練習(xí)400題及答案
- 預(yù)防保健科主任競(jìng)聘課件
- 團(tuán)隊(duì)成員介紹
- 水泵行業(yè)銷售人員工作匯報(bào)
- 《流感科普宣教》課件
- 離職分析報(bào)告
- 春節(jié)家庭用電安全提示
- 醫(yī)療糾紛預(yù)防和處理?xiàng)l例通用課件
- 廚邦醬油推廣方案
- 乳腺癌診療指南(2024年版)
- 保險(xiǎn)產(chǎn)品創(chuàng)新與市場(chǎng)定位培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論