版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
大數(shù)據(jù)和小米金融方流,小米金融技術(shù)總監(jiān)概述小米公司簡介小米金融DW建設(shè)用戶金融畫像大數(shù)據(jù)反欺詐小米公司-產(chǎn)品手機空氣凈化器凈水器…電視移動電源插線板…生態(tài)鏈平衡車手環(huán)…智能家居攝像頭血壓計體重秤…小米公司-成績小米金融信貸保險理財證券小米金融-信貸便捷只需要一部小米手機隨時/隨地靈活第二天即可還款根據(jù)信用不同,先息后本/等額本金等多種還款方式極速1分鐘身份驗證1分鐘到賬進化隨著小米產(chǎn)品的使用/提交資料/使用貸款等方法可以提升信用信用和新品公測/分期等結(jié)合小米金融-保險基于智能設(shè)備的企業(yè)團體健康險健康險車險意外險數(shù)據(jù)平臺基于智能設(shè)備與小米大數(shù)據(jù)的保險業(yè)務(wù)風(fēng)險建模保險公司贏利點2:風(fēng)控與精算定價數(shù)據(jù)輸出TOCTOB業(yè)務(wù)平臺極致性價比的保險產(chǎn)品支持保險業(yè)務(wù)快速成交、快速服務(wù)快速理賠的IT平臺贏利點1:產(chǎn)品分銷深度定制產(chǎn)品小米保險DW建設(shè)架構(gòu)工具-scribe
-hadoop/hdfs
-hbase
-hive
-impala
-sqoop
-sparkDW建設(shè)-業(yè)務(wù)架構(gòu)智能家居小米手環(huán)小米血壓計小米金融/支付外部數(shù)據(jù)(爬蟲/合作數(shù)據(jù))小米生活等等小米push小米電視/盒子/視頻應(yīng)用/主題商店多看閱讀小米商城業(yè)務(wù)層設(shè)備層數(shù)據(jù)倉庫模型KUDUhbaseHadoop/hdfs反欺詐模型信用模型機器學(xué)習(xí)/數(shù)據(jù)挖掘sparkimpalaHiveRscribe政策/運營sqoopSaikuDW建設(shè)-log利器之scribeApplication/ScribeclientApplication/ScribeclientApplication/ScribeclientApplication/ScribeclientlocalScribe
AgentAnother
Scribe
AgentHDFSFILEsOther
storageLocal
Storage來自于facebook高性能較好的容錯性DW建設(shè)-ETL利器之Hadoop/Hdfs每天上T數(shù)據(jù)ETL批處理DW建設(shè)-DW利器之HBaseColumnfamily數(shù)量不能太多線上服務(wù)(99%讀請求10ms左右,寫請求5ms左右)容易用map/reduce進行批處理小米賬號11月安裝<-t110月安裝<-t29月安裝<-t3columnfamily:app數(shù)據(jù)columnfamily:商城數(shù)據(jù)columnfamily:視頻數(shù)據(jù)timestampRowKeyDW建設(shè)-數(shù)據(jù)分析利器之Hive/Sentry類SQL查詢語言/易上手無縫對接hadoop/hdfs/hbase使用Sentry進行權(quán)限控制缺點:速度較慢DW建設(shè)-OLAP利器之Impala對應(yīng)于google的dremel近實時(分布式查詢引擎/中間結(jié)果在內(nèi)存/LLVM/C++等)類SQL查詢非常適合OLAPDW建設(shè)-數(shù)據(jù)遷移利器之sqoop業(yè)務(wù)數(shù)據(jù)往往都在mysql從mysql到hbaseDW建設(shè)-機器學(xué)習(xí)利器之spark比hadoop更通用(豐富的API)高性能良好的機器學(xué)習(xí)支持用戶金融畫像目標(biāo)屬性分析數(shù)據(jù)稀疏性問題用戶金融畫像-目標(biāo)金融屬性
-收入/支出/資產(chǎn)/購物/理財/…行為屬性(人被行為所定義)
-app/視頻/圖書/音樂/電話時間和次數(shù)/運動/…社交屬性(物以類聚,人以群分)
-居住區(qū)域/工作單位
-米聊/小米社區(qū)
-網(wǎng)絡(luò)社交(微博/linkedin)人口屬性
性別/年齡/學(xué)歷/…金融用戶畫像-屬性分析基于Spark引入GBDT+LR,GBDT+FM等方法自動發(fā)現(xiàn)、組合特征采樣:均衡性問題去噪:部分業(yè)務(wù)數(shù)據(jù)可能有作弊數(shù)據(jù)用戶金融畫像-數(shù)據(jù)稀疏性-應(yīng)用數(shù)據(jù)應(yīng)用元信息用戶評論評分用戶行為數(shù)據(jù)分類:SVM+人工用戶金融焦屬性-數(shù)據(jù)稀陽疏性-職業(yè)數(shù)據(jù)定向定向抓取人工修正,需要一些領(lǐng)域知識搜索引擎通過搜索引擎獲得語義機器學(xué)習(xí)分類知識圖譜垂直搜索引擎建立公司、職業(yè)的知識圖譜大數(shù)據(jù)涼反欺詐-欺詐類眠型盜號-異常環(huán)大境監(jiān)測/手機驗證身份偽造-實名認(rèn)證虛假資料-交叉驗證大數(shù)據(jù)且反欺詐-架構(gòu)業(yè)務(wù)接國口反欺詐中壯心DW/Cach坐e外部數(shù)據(jù)鍵接入異常特征善發(fā)現(xiàn)資料交籃叉驗證反欺詐模仇型決策引擎人工審批大數(shù)據(jù)裳反欺詐-反欺詐聯(lián)盟反欺詐任徒重而道今遠(yuǎn)—需要大家企攜手如何衡量全各自的價距值?Tha擋nks謝謝觀看/歡迎下載BYF苦AITH豎IM湖EAN貧AVI短SION慈OF袖GOOD煤ONE欄CHE滑RISH主ESA世NDT奔HEE霸NTHU煙SIAS江MTH典ATP點
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度養(yǎng)殖場節(jié)能減排與綠色低碳合作協(xié)議書3篇
- 二零二五年度航空航天器加工合作協(xié)議2篇
- 2025陶瓷現(xiàn)匯外貿(mào)合同書
- 二零二五年度籃球運動員長期保障合同3篇
- 2025年度農(nóng)村私人魚塘承包合同附漁業(yè)環(huán)保責(zé)任承諾書
- 二零二五年度汽車維修行業(yè)員工薪酬福利合同范本3篇
- 2025年度養(yǎng)殖土地租賃及農(nóng)業(yè)品牌建設(shè)合作協(xié)議3篇
- 2025年度農(nóng)機租賃與農(nóng)業(yè)廢棄物資源回收利用合作協(xié)議3篇
- 2025年度新能源充電樁建設(shè)公司成立協(xié)議書范本3篇
- 2025年度年度農(nóng)機租賃與農(nóng)業(yè)科技創(chuàng)新合作協(xié)議3篇
- 2024年完整離婚協(xié)議書下載-(含多款)
- 廣西欽州市浦北縣2023-2024學(xué)年七年級上學(xué)期期末語文試題
- 住院醫(yī)師述職報告
- 2024年度醫(yī)院燒傷科接診統(tǒng)計報告課件
- 社區(qū)普通話培訓(xùn)課件
- 動態(tài)負(fù)載均衡服務(wù)器集群
- 江蘇省無錫市錫山區(qū)2023-2024學(xué)年二年級上學(xué)期期末數(shù)學(xué)試卷
- 衛(wèi)生化學(xué)期末考試習(xí)題2
- 瓣周漏護理查房
- 歷代反腐完整
- 《現(xiàn)代控制理論》(劉豹-唐萬生)
評論
0/150
提交評論