版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Row:(pk3,nil,f2)writeSortBuffer:(pk3,nil,f2),(pk2,f1,nil),(pk3,f1,nil),(pk1,nil,f2),(pk2,nil,f2),(pk1,f1,nil)sortSortBuffer:(pk1,f1,nil),(pk1,nil,f2),(pk2,f1,nil),(pk2,nil,f2)(pk3,f1,nil),(pk3,nil,f2)mergeFile:(pk1,f1,f2),(pk2,f1,f2)(pk3,f1,f2)flush/compact}1col_0col_0col_1……………..PackChangelogReaderPackChangelogReaderpk1,f1b,f2b,f1a,f2apk1,f1b,f2b,f1a,f2acol_0col_1[pk_col][pk_col][pk_col][pk_col][col_1]BinlogTableAsyncRefreshAsyncRefreshKeyValueFormatPartialcacheLookup DataFile MetaFullcacheLookupFullcacheLookupStateSnapshotrefreshasynchronousSnapshotOperatorOperatorInputStreamOperatorOperatorBucketPartitionerOperatorBucket1Bucket2BucketBucket1Bucket2Bucket6Bucket4BucketBucket6Bucket4spark.paimon.${config_key}SETspark.paimon.scan.timestamp-mills=ts1;spark.paimon.${catalogName}.${dbName}.${tableName}.${config_key}SETspark.paimon.scan.timestamp-mills=ts1;SETspark.paimon.*.default.T1.scan.timestamp-mills=ts2;數(shù)據(jù)質(zhì)量(Data數(shù)據(jù)質(zhì)量(Dataquality)查詢性能(Performance)實(shí)時(shí)分析(Realtime)數(shù)據(jù)治理(Governance)開放生態(tài)(Open)靈活統(tǒng)一(Singlesourceoftruth)可擴(kuò)展性(Scalability)高性價(jià)比(Costefficiency)極速統(tǒng)一極速統(tǒng)一簡(jiǎn)單易用…StarRocks主鍵表:高性能實(shí)時(shí)寫入和更新 ↓! !!!數(shù)據(jù)湖查詢加速WarehouseLocalCacheStarRocksPaimonLocalCacheAllinPaimonStarRocks數(shù)據(jù)湖查詢加速WarehouseLocalCacheStarRocksPaimonLocalCacheAllinPaimonStarRocksStarRocksStarRocksPaimonSinkPaimonSinkPaimon數(shù)據(jù)湖倉分層建模WarehouseADSStarRocksPaimon中?數(shù)據(jù)量vs中?數(shù)據(jù)量vs超?數(shù)據(jù)量數(shù)倉為基礎(chǔ)vs數(shù)據(jù)湖為基礎(chǔ)封閉內(nèi)表格式封閉內(nèi)表格式vs開放湖表格式開箱即?開箱即?vs中等運(yùn)維難度計(jì)算引擎統(tǒng)?計(jì)算引擎統(tǒng)?vs?湖多引擎StarRocks能?vs其他引擎能?StarRocks存算分離集群Warehouse-2查詢?nèi)蝿?wù)StarRocks存算分離集群Warehouse-2查詢?nèi)蝿?wù)StarRocksControlPlaneStarOS元倉分析DLF湖表元數(shù)據(jù)等StarRocksStarRocksSR的主鍵模型基于deleteandinsert模式實(shí)現(xiàn)SR通過主鍵索引定位原來這條記錄打個(gè)刪除標(biāo)記,update記錄appendPartialUpdate解決業(yè)務(wù)部分列更新的需求客戶問題客戶問題Schema變更操作繁瑣阿里云StarRocks與Flink團(tuán)隊(duì)推出的CTAS&CDAS功能,StarRocks建表、Flink-CDC任務(wù)創(chuàng)建、實(shí)時(shí)同步Schema變更StarRocks側(cè)提供了Begin、Prepare、Commit等接口StarRocks湖倉融合數(shù)倉:業(yè)務(wù)數(shù)據(jù)通過Flink加工后實(shí)時(shí)同步給StarRocks客戶問題客戶問題這也是我們遷移到StarRocks的主要原因FlinkStarRocks湖倉融合StarRocks湖倉融合數(shù)據(jù)湖:Paimon性能好、維護(hù)成本低客戶問題StarRocks數(shù)據(jù)湖分析StarRocks數(shù)據(jù)湖分析實(shí)時(shí)湖分析:PaimonvsHudi,時(shí)效性提StarRocks相對(duì)Trino提升3-10倍+客戶問題查詢查詢THANKYOU業(yè)務(wù)背景架構(gòu)設(shè)計(jì)阿里媽媽是阿里巴巴集團(tuán)旗下的一家數(shù)字營銷平臺(tái),主要為商家3.數(shù)據(jù)驅(qū)動(dòng)增長戰(zhàn)略:通過數(shù)據(jù)分析支4.提供技術(shù)服務(wù):為阿里媽媽全線廣告客戶提供營銷洞察、策略制定2.優(yōu)化預(yù)算:實(shí)時(shí)監(jiān)控可以幫助廣告主合理分配預(yù)算,將3.市場(chǎng)反應(yīng):實(shí)時(shí)分析能讓廣告主了解市場(chǎng)4.個(gè)性化營銷:基于實(shí)時(shí)洞察,廣告主可以實(shí)現(xiàn)更加精準(zhǔn)的I建設(shè)中建設(shè)中備主name>`.sys.remove_orphan_files('<datab 1.建表參數(shù)設(shè)置3.開啟異步compaction1.建表參數(shù)設(shè)置2.追數(shù)適當(dāng)調(diào)大sink并行度THANKYOU3.數(shù)據(jù)驅(qū)動(dòng)增長戰(zhàn)略:通過數(shù)據(jù)分4.提供技術(shù)服務(wù):為阿里媽媽全線支持。請(qǐng)掃微信?維碼采用湖Paimon方案入湖業(yè)務(wù)查詢?nèi)牒I(yè)務(wù)查詢THANKYOU湖倉一體湖倉一體大數(shù)據(jù)搜索AI湖倉一體大數(shù)據(jù)搜索AI湖倉一體0001010101100010110101011010多種數(shù)據(jù)形態(tài)多種數(shù)據(jù)形態(tài)多元計(jì)算方式提升訓(xùn)練數(shù)據(jù)準(zhǔn)備效率提升訓(xùn)練數(shù)據(jù)準(zhǔn)備效率(Hive,Spark,StarRocks,Trino,…)(Hive,Spark,StarRocks,Trino,…)Thrift協(xié)議(開源兼容)REST協(xié)議(湖表兼容)集中式的統(tǒng)一存儲(chǔ)(Singlesourceoftruth)BinlogAccesslogFlinkBinlogAccesslogFlinkCDCFlinkVVP???支持按Catalog/DB/Table進(jìn)行湖表compaction?支持按Catalog/DB/Tabl?支持按Catalog/DB/Table清理臨時(shí)文件(Hive,Spark,StarRocks,Trino,…)Apache米用戶場(chǎng)景價(jià)值與優(yōu)勢(shì)Database①一鍵入湖CTASCDASQueriesQueriesQueries②流讀流寫flinkQueriesQueriesQueries②流讀流寫flinkspark④AD-HOC查詢ApachePaimonApachePaimonApachePaimonApachePaimonApachePaimonOpenLakeOpenLake全鏈路實(shí)時(shí)化流批一體化開放兼容主流分析引擎THANKYOU大數(shù)據(jù)負(fù)責(zé)人,負(fù)責(zé)整裝場(chǎng)景下的大數(shù)據(jù)開發(fā)Part1、家裝行業(yè)特點(diǎn)及其實(shí)時(shí)數(shù)據(jù)解決方案QQ“孫小圣”例會(huì)/述職/盤客Part2、流式湖倉在貝殼家裝業(yè)務(wù)中的探索與實(shí)踐Lambda階段確客直簽確客直簽見面認(rèn)購見面認(rèn)購量房到店量房到店如次數(shù)、首末時(shí)間等聚合型結(jié)果,部分更新模型聚合模型聚合模型THANKYOU湖倉架構(gòu)模式的思考數(shù)據(jù)湖系統(tǒng)能力建設(shè)數(shù)據(jù)湖關(guān)鍵能力建設(shè)數(shù)據(jù)湖在數(shù)據(jù)領(lǐng)域的應(yīng)用未來展望?任務(wù)開發(fā),測(cè)試/灰度,鏈路管理/數(shù)據(jù)管理數(shù)據(jù)入湖多云存儲(chǔ)支持多維管理flinkactionjar writetaskwritetask 開啟/關(guān)閉內(nèi)存托管開啟/關(guān)閉內(nèi)存托管突發(fā)數(shù)據(jù)下寫失敗臟數(shù)據(jù)控制臟數(shù)據(jù)控制減少寫失敗限流控制減少寫限流控制減少寫?回放容量?回放時(shí)間?topic管理?topic清理?從0開始構(gòu)建狀態(tài)時(shí)間久?從0開始構(gòu)建狀態(tài)浪費(fèi)資源topic------------------------>paimon↓topic?分區(qū)和bucket保持一致?提前N天錄入數(shù)據(jù)到paimonstate?壓測(cè)任務(wù)保持相同UID?整體鏈路使用湖表?支持實(shí)時(shí)指標(biāo)+準(zhǔn)實(shí)時(shí)指標(biāo)+離線計(jì)算指標(biāo)融合告警?
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025農(nóng)村公益性服務(wù)合同書
- 展覽展示裝修合同范例
- 物流門頭定制合同范例
- 農(nóng)村合資建房合同范例
- 承包開挖石方合同范例
- 文案合同范例
- 合同范例公示寫
- 水電工合同范例
- 市場(chǎng)衛(wèi)生保潔合同范例
- 美發(fā)店上班合同范例
- 北京海淀區(qū)2024屆高三最后一模語文試題含解析
- 天津市南開區(qū)2023-2024學(xué)年四年級(jí)上學(xué)期期末語文試卷
- 數(shù)據(jù)中心智能運(yùn)維體系建設(shè)
- 2023年計(jì)劃訂單專員年度總結(jié)及下一年規(guī)劃
- 體質(zhì)測(cè)試成績(jī)表(自動(dòng)統(tǒng)計(jì)數(shù)據(jù))(小學(xué)、初中)
- 2022年全國垃圾分類知識(shí)競(jìng)賽試題庫(附含答案與解析)
- 2024版醫(yī)院手術(shù)安全管理學(xué)習(xí)培訓(xùn)課件
- 材料標(biāo)準(zhǔn)目錄
- 腦卒中后吞咽障礙患者進(jìn)食護(hù)理(2023年中華護(hù)理學(xué)會(huì)團(tuán)體標(biāo)準(zhǔn))
- 護(hù)士執(zhí)業(yè)注冊(cè)申請(qǐng)表 新
- 妊娠期高血壓疾病診治指南(2022版)解讀
評(píng)論
0/150
提交評(píng)論