![數(shù)據(jù)湖對(duì)初創(chuàng)公司分析工作至關(guān)重要的五個(gè)原因_第1頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-1/27/83768a28-be2a-4ff9-9067-aa5b9975e303/83768a28-be2a-4ff9-9067-aa5b9975e3031.gif)
![數(shù)據(jù)湖對(duì)初創(chuàng)公司分析工作至關(guān)重要的五個(gè)原因_第2頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-1/27/83768a28-be2a-4ff9-9067-aa5b9975e303/83768a28-be2a-4ff9-9067-aa5b9975e3032.gif)
![數(shù)據(jù)湖對(duì)初創(chuàng)公司分析工作至關(guān)重要的五個(gè)原因_第3頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-1/27/83768a28-be2a-4ff9-9067-aa5b9975e303/83768a28-be2a-4ff9-9067-aa5b9975e3033.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)湖對(duì)初創(chuàng)公司分析工作至關(guān)重要的五個(gè)原因你可能對(duì)數(shù)據(jù)湖這個(gè)術(shù)語(yǔ)并不熟悉,但如果你在早期階段的初創(chuàng)公 司 中,你可能很快就會(huì)熟悉。雖然數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市往往迫使企業(yè)進(jìn)入狹隘的數(shù)據(jù)范式和 孤 島,但數(shù)據(jù)湖那么側(cè)重了更全面和更廣泛的分析視角。 數(shù)據(jù)湖為分析 數(shù)據(jù) 提供了更具適應(yīng)性的方法,并強(qiáng)調(diào)所有信息的價(jià)值,而不是被預(yù) 先篩選 的零散信息。在大數(shù)據(jù)行業(yè)圍繞數(shù)據(jù)湖的爭(zhēng)議往往集中在他們認(rèn)為的缺點(diǎn)上。 數(shù) 據(jù)湖非常沒有結(jié)構(gòu)化、太寬泛和太難管理。無論如何,數(shù)據(jù)湖具備 了使 其有獨(dú)特價(jià)值的關(guān)鍵特征,盡管這些特征相對(duì)較新,但對(duì)初創(chuàng)公 司尤其 有用。這是因?yàn)閷?duì)于初創(chuàng)公司而言,丟棄他們所擁有的大量數(shù)據(jù)可能會(huì) 導(dǎo)
2、致對(duì)市場(chǎng)的了解更少,并可能忽略一些關(guān)鍵趨勢(shì)。這五個(gè)原因凸顯 了為 什么數(shù)據(jù)湖是初創(chuàng)公司分析范式的重要組成局部, 而不是將自己 鎖定在 嚴(yán)格的數(shù)據(jù)管理實(shí)踐中。數(shù)據(jù)湖將與規(guī)模相關(guān)的本錢保持在較低水平初創(chuàng)公司開始可能會(huì)有較少的數(shù)據(jù)流和較小的需求,但是當(dāng)它們 開 始開展時(shí),這種情況會(huì)迅速改變。數(shù)據(jù)倉(cāng)庫(kù)是高度結(jié)構(gòu)的,需要由 專業(yè) 的數(shù)據(jù)工程師和架構(gòu)師進(jìn)行高程度的維護(hù)和持續(xù)監(jiān)控。 其中包括 構(gòu)建適當(dāng)?shù)哪J揭赃M(jìn)行分析,更改分析模型,甚至構(gòu)建正確的結(jié)構(gòu)來 存 儲(chǔ)清理數(shù)據(jù)。例如, Meta Networks 等公司為企業(yè)提供網(wǎng)絡(luò)即效勞 (Network-as-a-Service) 工具,每秒可收集數(shù)百萬個(gè)數(shù)據(jù)點(diǎn)
3、,隨著新客 戶 的參加,數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng)。通過使用 Upsolver 平臺(tái) (它可以依 賴于更容易擴(kuò)展的系統(tǒng),例如 AWS 的 S3 云效勞器 )來構(gòu)建數(shù)據(jù)湖, 該 公司已經(jīng)能夠收集所需的所有數(shù)據(jù),而無需預(yù)先構(gòu)建模式和倉(cāng)庫(kù)結(jié) 構(gòu)。數(shù)據(jù)湖消除了數(shù)據(jù)孤島在一家新成立的公司,快速共享數(shù)據(jù)和執(zhí)行各種橫向分析可以提 供 洞察力以及新的、意想不到的前進(jìn)道路。然而,許多早期初創(chuàng)公司 為了 方便而錯(cuò)誤地創(chuàng)立了數(shù)據(jù)孤島。 信息嚴(yán)重地被分割開,通信和傳 輸數(shù)據(jù) 變得更加困難。在企業(yè)層面,普華永道公司在加州大學(xué)歐文分校醫(yī)療中心 (UC Irvine Medical Center) 實(shí)施了一個(gè)數(shù)據(jù)湖系統(tǒng),這極大改善
4、了運(yùn)營(yíng)工 作。與初創(chuàng)公司相比,醫(yī)療機(jī)構(gòu)甚至可能更容易出現(xiàn)數(shù)據(jù)孤島,但普 華 永道公司表示,數(shù)據(jù)湖可以提供更敏捷的方法。由于數(shù)據(jù)沒有被強(qiáng) 制劃 分為不同模式,該醫(yī)院已經(jīng)能夠提供更好的分析、 更廣泛的研究 和更快 的溝通。數(shù)據(jù)湖減少了排序和查詢的時(shí)間無論初創(chuàng)公司選擇何種數(shù)據(jù)結(jié)構(gòu),他們都必須投入一些資源來管 理 和優(yōu)化。通常,這意味著花費(fèi)數(shù)小時(shí)來設(shè)置儀表板、分析算法和數(shù) 據(jù)模 式,并要始終對(duì)所有這些工作進(jìn)行管理。 這意味著要配備一名全 職工作人員,如果他不是專職于這項(xiàng)工作,那么他就會(huì)放棄其他工作任 務(wù) 來花時(shí)間處理數(shù)據(jù)倉(cāng)庫(kù)工作。由于數(shù)據(jù)湖具有非結(jié)構(gòu)化特性和原始數(shù)據(jù)流,因此需要維護(hù)的工量要少得多。與需
5、要配備一名全職人員不同 這是大多數(shù)初創(chuàng)公司 根本無法負(fù)擔(dān)的 ,數(shù)據(jù)湖可以讓任何團(tuán)隊(duì)成員自己執(zhí)行臨時(shí)性的分析,而無需預(yù)先進(jìn)行復(fù)雜的清理和結(jié)構(gòu)化過程。最重要的是,它還可 以顯著 縮短查詢時(shí)間。數(shù)據(jù)湖包含所有數(shù)據(jù)大數(shù)據(jù)的關(guān)鍵是盡可能多地提供信息來解析和處理,但大多數(shù)數(shù) 據(jù) 倉(cāng)庫(kù)都與這種范式背道而馳。數(shù)據(jù)倉(cāng)庫(kù)通常會(huì)過濾掉不符合預(yù)定結(jié) 構(gòu)的 重要數(shù)據(jù)塊,通常會(huì)刪除掉一些數(shù)據(jù)點(diǎn),而這些數(shù)據(jù)點(diǎn)在不同視 角下觀 察時(shí)可能包含關(guān)鍵見解。數(shù)據(jù)湖提供的最大價(jià)值的源泉之一 是,它龐大 的數(shù)據(jù)存儲(chǔ)庫(kù)有不同來源,并提供了獨(dú)特的方法來進(jìn)行組 合。這種上下 文無關(guān)的模型在執(zhí)行預(yù)測(cè)分析或只是尋找一些所關(guān)注的 趨勢(shì)時(shí)非常有價(jià) 值
6、。EMC 是最受歡送的數(shù)據(jù)湖解決方案之一,已成功應(yīng)用于醫(yī)療服 務(wù) 領(lǐng)域,以改善預(yù)測(cè)性護(hù)理和趨勢(shì)發(fā)現(xiàn)。然而,其如此成功,是因?yàn)?它可 以在不同的配置下研究更廣泛的橫向數(shù)據(jù)。與數(shù)據(jù)倉(cāng)庫(kù) 將預(yù) 定 分析算法強(qiáng)加于數(shù)據(jù) 不同,數(shù)據(jù)湖擁有全套原始數(shù)據(jù),這使初創(chuàng)公司能夠根據(jù)需求而非技術(shù)來執(zhí)行自己的分析。數(shù)據(jù)湖讓初創(chuàng)公司通過分析獲得創(chuàng)意最重要的是,數(shù)據(jù)湖可能并不會(huì)將企業(yè)鎖定在分析和見解的特定 范 式中。數(shù)據(jù)倉(cāng)庫(kù)通常具有重要的用途,但由于其固定性結(jié)構(gòu),使其 應(yīng)用 范圍較窄。因?yàn)閿?shù)據(jù)倉(cāng)庫(kù)需要仔細(xì)規(guī)劃數(shù)據(jù)流和結(jié)構(gòu), 所以初創(chuàng) 公司必 須在看到數(shù)據(jù)之前就決定它的使用方式對(duì)于一家了解其數(shù)據(jù)和渠道的公司而言,建立限制性習(xí)慣最終可能會(huì)對(duì)分析大局產(chǎn)生不利影響。另一方面,數(shù)據(jù)湖能夠忽略有關(guān)數(shù)據(jù)的先入之見,同時(shí)能夠以獨(dú)特方式探索信息。數(shù)據(jù)湖有利于工作取得成功對(duì)于通常以顛覆和創(chuàng)新而自豪的初創(chuàng)公司而言,擁有一個(gè)數(shù)據(jù)的整體觀以及擁有基于需求而非限制來執(zhí)行臨時(shí)分析的能力,這是一個(gè)至關(guān)重要
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023八年級(jí)數(shù)學(xué)上冊(cè) 第2章 三角形2.5 全等三角形第5課時(shí) SSS說課稿 (新版)湘教版
- 2024年九年級(jí)語(yǔ)文上冊(cè) 第五單元 第17課《草房子》說課稿 鄂教版
- 25《慢性子裁縫和急性子顧客》(說課稿)-2023-2024學(xué)年統(tǒng)編版語(yǔ)文三年級(jí)下冊(cè)
- 2024-2025學(xué)年高中物理 第一章 電磁感應(yīng) 4 楞次定律說課稿 教科版選修3-2
- 2025深圳市途安汽車租賃有限公司租賃合同
- 2025地區(qū)代理合同樣式詳細(xì)版
- 2024年四年級(jí)英語(yǔ)下冊(cè) Unit 5 What will you do this weekend Lesson 27說課稿 人教精通版(三起)
- 2023八年級(jí)生物下冊(cè) 第七單元 生物圈中生命的延續(xù)和發(fā)展第一章 生物的生殖和發(fā)育第2節(jié) 昆蟲的生殖和發(fā)育說課稿 (新版)新人教版
- 個(gè)人消防安裝合同范例
- 俄羅斯電梯采購(gòu)合同范例
- 部編版語(yǔ)文五年級(jí)下冊(cè) 全冊(cè)教材分析
- 胎兒性別鑒定報(bào)告模板
- 大學(xué)生就業(yè)指導(dǎo)PPT(第2版)全套完整教學(xué)課件
- 家具安裝工培訓(xùn)教案優(yōu)質(zhì)資料
- 湖南大一型抽水蓄能電站施工及質(zhì)量創(chuàng)優(yōu)匯報(bào)
- 耳穴療法治療失眠
- 少兒財(cái)商教育少兒篇
- GB 1886.114-2015食品安全國(guó)家標(biāo)準(zhǔn)食品添加劑紫膠(又名蟲膠)
- 初二上冊(cè)期末數(shù)學(xué)試卷含答案
- envi二次開發(fā)素材包-idl培訓(xùn)
- 2022年上海市初中語(yǔ)文課程終結(jié)性評(píng)價(jià)指南
評(píng)論
0/150
提交評(píng)論