




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)爆炸時代面臨的困境及突破口在大數(shù)據(jù)時代,更為核心的不是如何采集數(shù)據(jù),而是應(yīng)該聚焦在“數(shù)據(jù)應(yīng)用”上,數(shù)據(jù)產(chǎn)品的根源應(yīng)該是業(yè)務(wù)。本文作者根據(jù)自身的經(jīng)驗,對數(shù)據(jù)時代面臨的困境和突破口做了分析總結(jié),一起來看一下吧。
停更很久了,近期臨近年度大考雙十一,忙碌之前突發(fā)奇想對自己也對整個部門一路走過的經(jīng)歷做個總結(jié)。換句話說對我們2022年做個年度總結(jié),也希望分享一些實際業(yè)務(wù)歷程中遇到的問題場景,及面對問題該如何思考,如何落地,如何做效果評估等。文章開始前再補(bǔ)充下背景,筆者所在的公司所處互聯(lián)網(wǎng)行業(yè),性質(zhì)為toB,產(chǎn)品面向企業(yè)服務(wù),首先感謝您的閱讀,讓我們開始吧。一、面臨的處境筆者目前所處的部門成立于2020年,部門定位是基礎(chǔ)數(shù)據(jù)服務(wù)部門,所謂基礎(chǔ)數(shù)據(jù)服務(wù)也就是職能屬性,例如銷售部門所屬直接產(chǎn)能部門。對于我們當(dāng)初搭建時的初衷則和大多數(shù)數(shù)據(jù)產(chǎn)品成立的愿景一樣:“用數(shù)據(jù)賦能業(yè)務(wù)”,只有真正從事數(shù)據(jù)服務(wù)相關(guān)工作的同學(xué)才能明白這短短7個字的含義。DT時代以來,大數(shù)據(jù)殺熟,數(shù)據(jù)冗余,海量的數(shù)據(jù)已經(jīng)讓使用者應(yīng)接不暇。擁有數(shù)據(jù)從來不是可以使用好數(shù)據(jù)的理由,只是基礎(chǔ),當(dāng)然我不是指數(shù)據(jù)采集不重要,只是在大數(shù)據(jù)時代我理解更為核心的并不是如何采集數(shù)據(jù),目光更應(yīng)該聚焦在“數(shù)據(jù)應(yīng)用”,再龐大的數(shù)據(jù)中臺,數(shù)據(jù)產(chǎn)品的根源也應(yīng)該是業(yè)務(wù),拋開業(yè)務(wù)數(shù)據(jù)只是DB中的一行明細(xì),它并不能為公司,為業(yè)務(wù)帶來增益。整個公司的業(yè)務(wù)涉及到面對上下游的海量企業(yè)商家,同時也面臨著商家所使用的第三方平臺,如上游平臺:阿里,字節(jié),拼多多等;如下游物流:順豐、京東、三通一達(dá)等。我們需要為商家提供資源管理能力,這部分資源包含但不限于交易數(shù)據(jù)、成本數(shù)據(jù)、進(jìn)銷存數(shù)據(jù)等,這時首單其中的問題則是系統(tǒng)打通,單從國內(nèi)市場來看需要接入的平臺數(shù)量超過100,物流服務(wù)商也有大幾十,總結(jié)下來就是我們需要承擔(dān)數(shù)據(jù)的“進(jìn)出口”,“進(jìn)出口”進(jìn)行業(yè)務(wù)拆解可以分為以下。1.數(shù)據(jù)定義根據(jù)業(yè)務(wù)定義所需的數(shù)據(jù)源為哪些,如電商平臺交易單、物流承運商快遞單、商品成本數(shù)據(jù)。
根據(jù)數(shù)據(jù)渠道定義屬性,如交易類、商品類、成本類、庫存類。
根據(jù)屬性定義數(shù)據(jù)指標(biāo)如交易單量、發(fā)貨量、上行成功率、業(yè)務(wù)滲透率。
2.數(shù)據(jù)采集明確數(shù)據(jù)源后如何獲取,如開放式API,私有數(shù)據(jù)交互協(xié)議等。3.數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)源的多樣性造就數(shù)據(jù)格式的復(fù)雜性、數(shù)據(jù)形態(tài)的多樣性,需定義屬于我們的標(biāo)準(zhǔn)數(shù)據(jù)結(jié)構(gòu)。4.數(shù)據(jù)存儲海量數(shù)據(jù)如何選擇存儲方式:
數(shù)據(jù)格式考慮:結(jié)構(gòu)化數(shù)據(jù)or非結(jié)構(gòu)化數(shù)據(jù);行存儲or列存儲
性能考慮:批插,讀寫等性能指標(biāo)(可以以業(yè)務(wù)容忍度定義,如響應(yīng)需控制在50ms)
成本考慮:預(yù)估數(shù)據(jù)量大小,是否需要持久化存儲,能否建立歸檔庫,歸檔數(shù)據(jù)保留時間等
5.數(shù)據(jù)分析
根據(jù)多維度定義分析模型,定義算法對數(shù)據(jù)做加工解析,得到可產(chǎn)生業(yè)務(wù)價值的指導(dǎo)數(shù)據(jù)
根據(jù)業(yè)務(wù)屬性建立分析模型,可定時定量輸出分析結(jié)果
穩(wěn)定性,易用性分析等
6.數(shù)據(jù)應(yīng)用用數(shù)據(jù)引導(dǎo)業(yè)務(wù),反哺業(yè)務(wù),詮釋業(yè)務(wù)價值,協(xié)助業(yè)務(wù)做效果評估。7.數(shù)據(jù)治理海量的數(shù)據(jù)需約定規(guī)范,建立數(shù)據(jù)血緣關(guān)系;打造可持續(xù)發(fā)展的生態(tài),才能打下扎實基礎(chǔ),未來承載更多的業(yè)務(wù)量。8.數(shù)據(jù)開放可復(fù)用、易用的數(shù)據(jù)如何打造生態(tài),對外賦能更多的商家,賦能更多業(yè)務(wù)域。以上為職能的簡易拆解,拆解思路基本為按人員劃分(團(tuán)隊人員搭建的目標(biāo)也是按以上節(jié)點進(jìn)行組成)。說完了職能描述再來看下每種職能背后所面對的真實問題,結(jié)合實際場景才能讓讀者身臨其境,通過冰冷的文字感覺到價值或思路。1)數(shù)據(jù)定義這一步驟分為兩階段,一階段是團(tuán)隊搭建初期,數(shù)據(jù)需求則是企業(yè)需求,驅(qū)動力完全來源于使用者,企業(yè)需要什么數(shù)據(jù)我們就去接入什么數(shù)據(jù),截止到2022年11月已接入了371家上游平臺100余家下游服務(wù)商(快遞公司、貨代)為企業(yè)獲取到他們分布在各個渠道的交易數(shù)據(jù)、商品數(shù)據(jù)、庫存數(shù)據(jù)、價格數(shù)據(jù)、成交數(shù)據(jù)等等。第二階段則為本年度的狀態(tài),驅(qū)動力更多地傾向于團(tuán)隊自身、功能迭代、性能調(diào)優(yōu)、存儲降本、引入流式計算等存儲&計算引擎來提高我們自身系統(tǒng)的健壯性、穩(wěn)定性、及時性等。關(guān)于所謂的數(shù)據(jù)定義還是比較好理解,背后隱晦的問題在于如何降低維護(hù)成本,做過接口開發(fā)的同學(xué)應(yīng)該清楚維護(hù)接口的成本,特別是接入的外部系統(tǒng)數(shù)量增長到某個程度后接口參數(shù)發(fā)生微調(diào),或字段語義的不確定性就會到自身業(yè)務(wù)造成不可逆的影響。2)數(shù)據(jù)采集采集面臨的問題是渠道多樣性,數(shù)據(jù)格式多樣性等;渠道及格式多樣性意味著需要固定人力長期維護(hù),關(guān)注數(shù)據(jù)完整度,及時性等核心關(guān)鍵指標(biāo)。3)數(shù)據(jù)轉(zhuǎn)換ETL中比較復(fù)雜耗時的節(jié)點,初期人力有限的情況下接入一個渠道獲取一個渠道的數(shù)據(jù),再針對該渠道數(shù)據(jù)做相對應(yīng)的轉(zhuǎn)換,轉(zhuǎn)換為所需的業(yè)務(wù)格式。4)數(shù)據(jù)存儲相信每一家互聯(lián)網(wǎng)公司的同學(xué)多少遇到過存儲相關(guān)的問題(有可能在您公司當(dāng)前階段并未暴露出來)公司起步初期,數(shù)據(jù)量小、多樣化少,不會遇到太大的寫入讀取壓力。在當(dāng)前階段保留固定的數(shù)據(jù)入口及出口反而更能提高效率(針對每一種接入數(shù)據(jù)做相對應(yīng)的轉(zhuǎn)換,向指定DB進(jìn)行存儲,向指定DB進(jìn)行統(tǒng)一讀取),相信這個階段也并不會遇到成本壓力,一開始我們便是采取這種方式,伴隨市場發(fā)展及拓張,在20-21年面臨數(shù)據(jù)量爆發(fā)式增長。為了迎合市場產(chǎn)研部門按照不同的需求商家做了不同的數(shù)據(jù)源接入,多樣性已經(jīng)接近無法管理,多業(yè)務(wù)向DB進(jìn)行的讀寫也面臨著各種性能壓力,保證讀寫時序又做了大批量加鎖的行為導(dǎo)致各種表死鎖情況,年度成本數(shù)千萬。5)數(shù)據(jù)分析缺少分析經(jīng)驗,面對格式不一的數(shù)據(jù)更是無從下手,數(shù)據(jù)存儲量高到驚人,可惜都是冷數(shù)據(jù),長期以來并未讓數(shù)據(jù)產(chǎn)生與之對應(yīng)的價值。6)數(shù)據(jù)應(yīng)用缺少了分析的過程也就無從得知應(yīng)用,團(tuán)隊成本也并未養(yǎng)成“用數(shù)據(jù)說話”的習(xí)慣,更多業(yè)務(wù)決策更多的依賴人員的經(jīng)驗,也就是所謂的“閉門造車”。很頻繁地聽到各位同學(xué)脫口而出“我認(rèn)為xxxx”“我認(rèn)為客戶應(yīng)該xxxxx”,要善于用數(shù)據(jù)輔助我們做決策。7)數(shù)據(jù)治理多數(shù)互聯(lián)網(wǎng)企業(yè)可能并未經(jīng)歷過數(shù)據(jù)治理的過程,沒有體會過數(shù)據(jù)治理所帶來的價值,也并未理解為什么要投入大量的人力財力去做數(shù)據(jù)治理?!爸卫怼鳖櫭剂x是一種通過某種途徑做調(diào)節(jié)的機(jī)制,日常作業(yè)中可能會出現(xiàn)各種“數(shù)據(jù)不知道往哪里存”“數(shù)據(jù)不知道從哪里取”“這份數(shù)據(jù)誰在用”“改動此數(shù)據(jù)的影響評估無法做”等等問題。8)數(shù)據(jù)開放這一步可能聊的比較不切實際了,多數(shù)公司基本數(shù)據(jù)內(nèi)驅(qū),在內(nèi)部做循環(huán),能使自身業(yè)務(wù)做增量已經(jīng)是比較理想的情況。距離做生態(tài)、治理生態(tài)還有一些距離,在自身已產(chǎn)生價值的情況下可以考慮將數(shù)據(jù)包裝后豐富自身的開放生態(tài),賦能更多的協(xié)同或上下游,完善整個行業(yè)。9)價值這一步算補(bǔ)充條款了,上面并沒有提及到,相信這一節(jié)也能引起很多朋友的共鳴,要知道基礎(chǔ)數(shù)據(jù)服務(wù)部門應(yīng)該都存在這個共性問題“如何做價值”無論是業(yè)務(wù)決策性產(chǎn)品或數(shù)據(jù)產(chǎn)品,難道我們只能被動接受來自業(yè)務(wù)部門的數(shù)據(jù)需求嗎?總是一味地聽從別人的“你把xxx數(shù)據(jù)轉(zhuǎn)換為xxxx輸出給我”“我要xxxx你需要清洗好提供給我”,數(shù)據(jù)的價值并非止步于此,在不沖突的情況下,我們有沒有突破口去做出價值,或許在清洗數(shù)據(jù)提供給業(yè)務(wù)部門后我們也能提供到數(shù)據(jù)角度的效果評估?這份評估結(jié)果也可以表現(xiàn)為一種價值,一種左右業(yè)務(wù)方向的價值。二、如何思考解決方案面臨上述遇到的問題后,需要解決的問題也比較多,涉及到的業(yè)務(wù)域跨度比較廣。人力有限的情況下沒有辦法齊頭并進(jìn),只能對改造點做了列舉,列出優(yōu)先級和影響范圍劃定了整個部門Q1-Q4的目標(biāo)。這些任務(wù)多為內(nèi)驅(qū),同時需要保持來自業(yè)務(wù)團(tuán)隊的需求任務(wù),所以部門討論后得到了60%外部需求40%自驅(qū)的節(jié)奏。這里羅列下簡易的拆解過程:拆解過程簡單分為五步簡單概述為痛點,或者可以理解為核心目標(biāo),比較迫切在中短期內(nèi)解決或完善的內(nèi)容(居多的圍繞部門職能及核心價值),如我們屬于數(shù)據(jù)基礎(chǔ)部門,因而指標(biāo)多為數(shù)據(jù)相關(guān)。比較典型的就是數(shù)據(jù)幾個特性:穩(wěn)定性、及時性、完整性、易用性、成本。1.穩(wěn)定性這里描述的是集群穩(wěn)定性,規(guī)模龐大的商家群體意味著會存在規(guī)模龐大的數(shù)據(jù)鏈路,為了減免宕機(jī)等穩(wěn)定因素對業(yè)務(wù)產(chǎn)生不可逆的影響,也是業(yè)務(wù)的基石。集群分布也可以拆解為web集群(B/S架構(gòu)的網(wǎng)頁)和任務(wù)集群(Job調(diào)度集群),在云資源逐步增加的基礎(chǔ)上對集群做一定的“資源瘦身”。web集群比較好理解主要是監(jiān)控高并發(fā)的請求,及一些核心業(yè)務(wù)操作的穩(wěn)定性(如訂單操作,報表操作多為DB增刪改查操作),加入監(jiān)控體系。這也是我們搭建的第一組監(jiān)控系統(tǒng),凌駕于整個部門所涉及的全業(yè)務(wù)之上,這里想到了監(jiān)控系統(tǒng)設(shè)計的幾個核心:
報警的觸達(dá)應(yīng)當(dāng)是緊急的、重要的、可執(zhí)行的、真實的。
規(guī)則應(yīng)當(dāng)表示為服務(wù)處于過程中或者即將發(fā)生的問題。
為了保持報警項的精確、有效,寧可過度移除報警噪音,因為過度監(jiān)控比監(jiān)控不足更難解決。
你應(yīng)該總是能夠?qū)栴}分為以下幾種:基本功能的可用性問題;延遲;正確性(數(shù)據(jù)的完整性、新鮮性和持久性);以及特定功能問題。
規(guī)則描述癥狀是更好的方法,可以更輕松、更全面、更可靠地捕獲更多的問題。
在基于癥狀的頁面或儀表板中包含基于原因的信息,但要避免直接針對原因發(fā)出警報。
報警越往上層的服務(wù)走,在一個報警規(guī)則中可以抓住的明顯問題就越多。但不要走得太遠(yuǎn),無法充分區(qū)分發(fā)生了什么。
如果你想在值班時,報警系統(tǒng)保持安靜,那么需要有一套系統(tǒng)和標(biāo)準(zhǔn)化的流程能夠自動處理那些需要被盡快處理的事情,但不至于讓你半夜三點鐘爬起來上線的情況。
這里簡單說下監(jiān)控系統(tǒng)搭建的心路歷程。預(yù)警的目的不是為了預(yù)警,所以預(yù)警內(nèi)容必須具備緊急且可執(zhí)行的特性,這個指標(biāo)很重要,很多監(jiān)控系統(tǒng)的設(shè)計從最初就開始拆解各個業(yè)務(wù)指標(biāo),往往幾十個指標(biāo),報警一大堆,處理人員沒有頭緒無從下手。寧可過渡移除報警噪音這一點也需多多關(guān)注,報警并不是越多越好,也并不一定是越細(xì)越好,將最重要的內(nèi)容在合適的時間報向正確的人才是合理的;報警規(guī)則盡量貼近業(yè)務(wù),脫離現(xiàn)實的報警只會讓你增加無盡的煩惱。最后一條相信搭建過監(jiān)控系統(tǒng)的同學(xué)都感同身受(報警滴滴響,時間長了人員也開始疲勞,疏忽落實報警內(nèi)容)這時就引出了配套能力之一:值守系統(tǒng),何謂值守(自動化值班)可以抽出統(tǒng)一的數(shù)據(jù)交互錯誤格式,也就是標(biāo)準(zhǔn)異常碼,參與過接口開發(fā)的同學(xué)應(yīng)該比較清楚一個接口的響應(yīng)信息一般都存在兩層(code,msg)msg即消息主體,code即描述碼;如code=200即成功code=500001即業(yè)務(wù)錯誤,再進(jìn)行細(xì)分的話可以做到二級code,如code=500001&sub_code=9999等于系統(tǒng)宕機(jī),需要調(diào)度系統(tǒng)重試,這就是抽象出code映射關(guān)系后就可以建立自動化值守系統(tǒng),根據(jù)code定義的決策結(jié)果進(jìn)行自動化不間歇的”值班”從一定程度上釋放了產(chǎn)研人員的壓力。此處可以深挖的細(xì)節(jié)還有很多,例如可以根據(jù)code搭配AI機(jī)器人,從移動端接收產(chǎn)研人員的操作指令,完成權(quán)限分配、OA流程審批、資源購置等。亦或者根據(jù)預(yù)設(shè)code完成線程分配,調(diào)整任務(wù)集群步頻、步長、步幅等動作。有了監(jiān)控+值守后當(dāng)然少不了預(yù)警系統(tǒng),也就是所謂的消息分發(fā)系統(tǒng),經(jīng)過值守系統(tǒng)自動化處置后依然有一些關(guān)鍵性異常是系統(tǒng)無法自動消化的,需要人為介入,那這時需要用到分發(fā)系統(tǒng)??梢耘c多種消息渠道打通,如企業(yè)微信、釘釘、飛書、短信,更甚至可以電話,可根據(jù)預(yù)警等級推送至可執(zhí)行的人員或組里(需提前按照職責(zé)劃分對應(yīng)的接收組或接收人)預(yù)警通知需要建立固定的處理流程,個別高優(yōu)異常需建立駐留時間達(dá)到xx時問題上升,讓更多更專業(yè)的同學(xué)參與進(jìn)來協(xié)助處理。2.及時性做數(shù)據(jù)基礎(chǔ)服務(wù)避免不了的就是降低數(shù)據(jù)交互耗時,內(nèi)外部系統(tǒng)交互的RT值,需要把整體數(shù)據(jù)鏈路的耗時降下來。那么在調(diào)度資源不變的情況下需要如何做到,思路也比較明確,“讓資源在合適的時間用到合適的地方”服務(wù)器資源會存在高負(fù)載及低負(fù)載的時間段,如高頻計算的白天,多條數(shù)據(jù)鏈路需公用資源,那我們可以將資源量化后區(qū)分業(yè)務(wù)或商家的優(yōu)先級,將更多的資源分配至更高優(yōu)的業(yè)務(wù)鏈路。在凌晨負(fù)載降下來以后可以去執(zhí)行一些海量數(shù)據(jù)的離線計算服務(wù),如日報、歸檔、大規(guī)模業(yè)務(wù)數(shù)據(jù)重算等操作,可以在這些時間點做一些兜底的業(yè)務(wù)策略,一些數(shù)據(jù)稽核的過程可以放置于此,一方面資源沒有浪費,一方面也可以提升整體鏈路的健壯性,另一方面提高響應(yīng)。降低耗時的另一個思路就是“瘦身”,這個瘦身不止在資源上,對業(yè)務(wù)也一樣,一些涉及到與存儲介質(zhì)交互的業(yè)務(wù),例如對數(shù)據(jù)庫的讀寫操作,是否可以支持批量,是否會出現(xiàn)表鎖行鎖等情況,業(yè)務(wù)代碼是否會出現(xiàn)大量的逐條循環(huán)逐條更新的操作等等;扣業(yè)務(wù)細(xì)節(jié),通過各種細(xì)節(jié)做持續(xù)的優(yōu)化以達(dá)到一個良性循環(huán)。3.完整性這一步的背景是這樣的,在存在大量的數(shù)據(jù)入口時,很多數(shù)據(jù)來自于上下游系統(tǒng)、服務(wù)商。數(shù)據(jù)口徑不同不易維護(hù),外部數(shù)據(jù)字典發(fā)生變更會影響到我們自身業(yè)務(wù),如反序列化等步驟,這時為了保證業(yè)務(wù)可以獲得完整且結(jié)構(gòu)明確的數(shù)據(jù),我們可以封裝統(tǒng)一的數(shù)據(jù)模型校驗?zāi)芰?,根?jù)我們抽象出的業(yè)務(wù)模型(符合業(yè)務(wù)預(yù)期的)對實時數(shù)據(jù)做校驗。如果擔(dān)心對性能有壓力可以選擇性將一些比對工作做成異步操作,保證主鏈路順暢的同時如果比對出一些邊角數(shù)據(jù)可以通過第二步的預(yù)警體系完成回流,人工介入去確認(rèn)情況,更及時有效的感知數(shù)據(jù)變更,從而降低對業(yè)務(wù)系統(tǒng)的影響。4.易用性這一步更多的需要用到工程思維,在業(yè)務(wù)沉淀的過程中更多的考慮如何抽象,如何封裝統(tǒng)一方法、接口讓內(nèi)外部的協(xié)同更好更高效地使用數(shù)據(jù)?,F(xiàn)在微服務(wù)的概念越來越普及,很多模塊化、碎片化、服務(wù)化的系統(tǒng)更利于后期的業(yè)務(wù)拓展、業(yè)務(wù)重構(gòu)。通過封裝統(tǒng)一數(shù)據(jù)接口的方式降低數(shù)據(jù)的使用門檻,通過抽象模塊,服務(wù)的設(shè)計使得系統(tǒng)得到高可用的后期空間。在此基礎(chǔ)上,業(yè)務(wù)系統(tǒng)需要使用數(shù)據(jù)時,可以更多地把目光放在賦能業(yè)務(wù)上而不需要過多考慮數(shù)據(jù)使用問題。在此基礎(chǔ)上建立數(shù)據(jù)治理系統(tǒng),對數(shù)據(jù)血緣關(guān)系做完整鏈路記載,便于后續(xù)我們做追溯,更多的服務(wù)化也使得業(yè)務(wù)耦合度降低,降低迭代所帶來的影響范圍及灰度成本。5.成本最后這一段有關(guān)成本,歸根到底降本增效這條路是需要持續(xù)走下去。特別是互聯(lián)網(wǎng)行業(yè),除去人力這一最昂貴的成本之外,資源成本也讓人頭痛,各種技術(shù)棧所帶來的成本數(shù)不勝數(shù)。存儲成本如服務(wù)器資源成本,DB、數(shù)倉的存儲成本,中間件及計算引擎所帶來的計算成本等都是大頭,對于這個問題,我們初步的方案是在調(diào)度分配的策略優(yōu)化基礎(chǔ)上,對底層存儲結(jié)構(gòu)做了調(diào)整,即分庫分表規(guī)則,將數(shù)據(jù)&資源流量合理的分配后可以壓縮出更多的使用空間,將低負(fù)載的集群都合理分配到更多的業(yè)務(wù),減少集群閑置的頻率。當(dāng)然機(jī)器的使用空間不單單只是我們自身的業(yè)務(wù),在亞馬遜云初期的時候就是因為自身龐大的集群閑置了很多資源,才想到對外租賃一部分云資源并提供一系列的云服務(wù),這些高效的存儲、算力都可以為一些中小企業(yè)提供很好的基礎(chǔ),半托管&全托管的服務(wù)也隨之而來,總之合理利用現(xiàn)有資源來達(dá)成更多的業(yè)務(wù)目的就是關(guān)鍵。說了這么多,也簡單畫了個草圖,描述了下當(dāng)前我們的一套系統(tǒng)架構(gòu)圖,內(nèi)容不是很全面,不過也概括了目前基本的分布情況。從上至下可分為一層接口層,采用API、導(dǎo)入、數(shù)據(jù)推送等技術(shù)手段完成對外部數(shù)據(jù)的采集。二層為模型轉(zhuǎn)換層,數(shù)據(jù)格式校驗、模型校驗等皆在于此。三層多為一些中間件服務(wù),如消息隊列、集中式&分布式緩存、流失數(shù)據(jù)計算引擎、即席查詢報表等。四層為業(yè)務(wù)層,按業(yè)務(wù)域做了拆分,如交易、商品、庫存、財務(wù)等;按服務(wù)做了拆分,如交易服務(wù):多為處理交易數(shù)據(jù),對交易數(shù)據(jù)做清洗等,商品服務(wù)、發(fā)貨服務(wù)等。伴隨著業(yè)務(wù)則會有規(guī)則類服務(wù)進(jìn)行輔助,完成更多業(yè)務(wù)的限制,如綁贈規(guī)則、風(fēng)控策略等。規(guī)則服務(wù)之外會有業(yè)務(wù)系統(tǒng)權(quán)限管理,這里的權(quán)限類則做了抽象,是可以對業(yè)務(wù)層的上下游提供能力。五層為基礎(chǔ)數(shù)據(jù)存儲層,如關(guān)系型數(shù)據(jù)庫Mysql,非關(guān)系型數(shù)據(jù)庫MongoDB、數(shù)據(jù)倉庫等。在1-5層的基礎(chǔ)上提供了內(nèi)部網(wǎng)關(guān),多用于承載內(nèi)部業(yè)務(wù)接口,做一些流控策略、風(fēng)控策略、鑒權(quán)策略等,保障業(yè)務(wù)的穩(wěn)定性及安全性。在五層之外貫穿整體系統(tǒng)的有外部網(wǎng)關(guān),即內(nèi)部數(shù)據(jù)對外的網(wǎng)關(guān),可通過外部開發(fā)者身份進(jìn)駐在我們平臺之內(nèi),完成一些自研系統(tǒng)的開發(fā)數(shù)據(jù)獲取工作。調(diào)度中心即自行搭建的基于主從關(guān)系(Master-Slave)的調(diào)度集群,掌管著系統(tǒng)內(nèi)外部一些資源調(diào)度及分配??山Y(jié)合后續(xù)的日志服務(wù)及監(jiān)控中心完成一些健康度檢測,心跳檢測等自我健康策略,保證系統(tǒng)的核心足夠的穩(wěn)定。監(jiān)控中心及日志服務(wù)則滿足絕大多數(shù)環(huán)節(jié)的可植入性,通過封裝內(nèi)部接口使得全業(yè)務(wù)域均可低成本完成日志寫入,包括業(yè)務(wù)日志、用戶操作日志、用戶行為日志,更能使業(yè)務(wù)低成本地完成業(yè)務(wù)埋點,并指定分析策略完成后續(xù)的數(shù)據(jù)復(fù)盤,及提供迭代的數(shù)據(jù)支持。三、效果評估及思路了解了以上眾多問題后的解決思路后,我們來看一下效果評估部分,說了再說沒有收益那也等于白干,在基于上述架構(gòu)的系統(tǒng)上我們當(dāng)前日處理交易單量近億,每日產(chǎn)生的日志數(shù)據(jù)量達(dá)到EB級別。對于之前經(jīng)常遇到的機(jī)器高負(fù)載也有了明顯的改善,超過95%以上的調(diào)度集群全天保持穩(wěn)定水位。成本方面較為明顯,在原有的近千臺機(jī)器搭建的集群規(guī)模下完成了近80%的瘦身,成本方面每年節(jié)省的費用可達(dá)數(shù)百萬。最后對于現(xiàn)有的服務(wù)化設(shè)計使得我們產(chǎn)研成本極具降低,有利于我們做快速的版本迭代,及時感知市場的變化。也提供一些數(shù)據(jù)價值的思路,如車品覺老師的5類數(shù)據(jù)價值:
1)識別和串聯(lián)價值
賬號和Cookie-通過賬號,全站啡一鎖定同一個用戶
手機(jī)號、身份證號、銀行卡,郵箱等-可以把PC/手機(jī)/PAD等設(shè)備串聯(lián)
設(shè)備號-可以把設(shè)備上不同的APP串聯(lián)起來
2)描述價值①企業(yè)
經(jīng)營狀況:收入、資產(chǎn)、利潤、負(fù)債等
實體狀況:如電商
②用戶③商品或服務(wù)3)時間價值①歷史分析
通過對用戶歷史的行為分析,可以得到用戶在場景下的偏
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 臨時供應(yīng)合同范本
- 企業(yè)修路合同范本
- 2025年衡水駕駛員貨運從業(yè)資格證模擬考試題
- 中介交易服務(wù)合同范本
- 會展項目服務(wù)合同范例
- 2025年昆明道路貨運從業(yè)資格證模擬考試官方題下載
- 修車配件合同范本
- 出租合同范本版
- 農(nóng)村水源地租賃合同范本
- 與演員合作合同范本
- 收費站稽查管理制度
- 老年心房顫動診治中國專家共識(2024)解讀
- NB-T31056-2014風(fēng)力發(fā)電機(jī)組接地技術(shù)規(guī)范
- 部編版八年級上冊歷史期中復(fù)習(xí)重點總結(jié)
- DL5190.5-2019電力建設(shè)施工技術(shù)規(guī)范第5部分:管道及系統(tǒng)
- 農(nóng)信銀支付系統(tǒng)文檔
- 華為認(rèn)證HCIA-Security安全H12-711考試題庫及答案
- 建筑工地春節(jié)前安全教育
- (正式版)YST 1682-2024 鎂冶煉行業(yè)綠色工廠評價要求
- DL-T 5148-2021水工建筑物水泥灌漿施工技術(shù)條件-PDF解密
- JGJ6-2011 高層建筑筏形與箱形基礎(chǔ)技術(shù)規(guī)范
評論
0/150
提交評論