下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)分析大數(shù)據(jù)分析傳統(tǒng)分析對(duì)已知的數(shù)據(jù)范圍中好理解的數(shù)據(jù) 進(jìn)行分析。大多數(shù)數(shù)據(jù)倉(cāng)庫(kù)都有一個(gè)精致的 提取、轉(zhuǎn)換和加載(ETL)的流程和數(shù)據(jù)庫(kù)限 制,這意味著加載進(jìn)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是容易 理解的,洗清過(guò)的,并符合業(yè)務(wù)的元數(shù)據(jù)。大數(shù)據(jù)最大的優(yōu)點(diǎn)是針對(duì)傳統(tǒng)手段捕捉到 的數(shù)據(jù)之外的非結(jié)構(gòu)化數(shù)據(jù)。這意味著不 能保證輸入的數(shù)據(jù)是完整的,清洗過(guò)的和 沒(méi)有任何的錯(cuò)誤。這使它更有挑戰(zhàn)性,但 同時(shí)它提供了在數(shù)據(jù)中獲得更多的洞察力 的范圍。傳統(tǒng)分析是建立在關(guān)系數(shù)據(jù)模型之上的,主 題之間的關(guān)系在系統(tǒng)內(nèi)就已經(jīng)被創(chuàng)立,而分 析也在此基礎(chǔ)上進(jìn)行。在典型的世界里,很難在所有的信息間以 一種正式的方式建立關(guān)系,因此非結(jié)構(gòu)化
2、 以圖片、視頻、移動(dòng)產(chǎn)生的信息、無(wú)線(xiàn)射 頻識(shí)別(RFID)等的形式存在,被考慮進(jìn) 大數(shù)據(jù)分析。絕大多數(shù)的大數(shù)據(jù)分析數(shù)據(jù) 庫(kù)基于縱列數(shù)據(jù)庫(kù)之外。傳統(tǒng)分析是定向的批處理,而且我們?cè)讷@得 所需的洞察力之前需要每晚等待提取、轉(zhuǎn)換大數(shù)據(jù)分析是利用對(duì)數(shù)據(jù)有意義的軟件的 支持針對(duì)于數(shù)據(jù)的頭時(shí)分析。和加載(ETL)以及轉(zhuǎn)換工作的完成。在一個(gè)傳統(tǒng)的分析系統(tǒng)中,平行是通過(guò)昂貴 的硬件,如大規(guī)模并行處理(MPP系統(tǒng)和/ 或?qū)ΨQ(chēng)多處理(SMP系統(tǒng)來(lái)實(shí)現(xiàn)的。當(dāng)在市場(chǎng)上有大數(shù)據(jù)分析的應(yīng)用系統(tǒng)時(shí), 它同樣可以通過(guò)通用的硬件和新一代的分 析軟件,像Hadoop或其他分析數(shù)據(jù)庫(kù)來(lái)實(shí) 現(xiàn)。主要的IT公司對(duì)分析軟件和應(yīng)用系統(tǒng)供應(yīng)商
3、的購(gòu)買(mǎi)已經(jīng)成為一種日常現(xiàn)象。我 們已經(jīng)看到“大數(shù)據(jù)分析”這個(gè)詞匯被使用在許多企業(yè)的解決方案中?!按髷?shù)據(jù)”是用來(lái)表示大量的沒(méi)有按照傳統(tǒng)的相關(guān)格式存儲(chǔ)在企業(yè)數(shù)據(jù)庫(kù)中的 非結(jié)構(gòu)化數(shù)據(jù)的總術(shù)語(yǔ)。以下是大數(shù)據(jù)的一般特點(diǎn)。數(shù)據(jù)存儲(chǔ)量相對(duì)于當(dāng)前企業(yè) TB(TERABYTES字節(jié)的存儲(chǔ)限制,定義在PB(PETA BYTES字節(jié),EXA字節(jié)以及更高的容量順序。通常它被認(rèn)為是非結(jié)構(gòu)化數(shù)據(jù),并不適合企業(yè)已經(jīng)習(xí)慣使用的關(guān)系型數(shù)據(jù)庫(kù)之下數(shù)據(jù)的生成使用的是數(shù)據(jù)輸入非傳統(tǒng)的手段,像無(wú)線(xiàn)射頻識(shí)別(RFID),傳感器網(wǎng)絡(luò)等。數(shù)據(jù)對(duì)時(shí)間敏感,且由數(shù)據(jù)的收集與相關(guān)的時(shí)區(qū)組成。在過(guò)去,專(zhuān)業(yè)術(shù)語(yǔ)“分析”應(yīng)用于商業(yè)智能(BI)世界來(lái)提供
4、工具和智能,通過(guò) 對(duì)各種各樣可能的信息視角的快速的、一致的、交互式訪(fǎng)問(wèn)獲得洞察力。與分析的概念非常接近,數(shù)據(jù)挖掘已經(jīng)應(yīng)用于企業(yè)以保持關(guān)鍵監(jiān)測(cè)和海量信息的 分析。最大的挑戰(zhàn)就是如何通過(guò)大量的數(shù)據(jù)挖掘出所有的隱藏信息。傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)(DW分析相對(duì)于大數(shù)據(jù)分析企業(yè)數(shù)據(jù)的分析朝著在一段時(shí)間內(nèi)在那種內(nèi)容中的信息的有意義的洞察,是大數(shù)據(jù)分析區(qū)別于傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)分析的原因所在。下表總結(jié)了一些它們之間的差別。大數(shù)據(jù)分析用例基于用例,企業(yè)可以理解大數(shù)據(jù)分析的價(jià)值和在大數(shù)據(jù)分析的幫助下如何解決傳 統(tǒng)的問(wèn)題。以下是一些用法??蛻?hù)滿(mǎn)意度和保證分析:也許這是基于產(chǎn)品的企業(yè)所擔(dān)心的最大的一個(gè)領(lǐng)域。在當(dāng)今時(shí)代,沒(méi)有一個(gè)清晰的方
5、式來(lái)衡量產(chǎn)品的問(wèn)題和與客戶(hù)滿(mǎn)意度相關(guān)的問(wèn)題, 除非他們以一個(gè)正式的方式出現(xiàn)在一個(gè)電子表格中。信息質(zhì)量方面,它是通過(guò)各種外部渠道收集的,而且大多數(shù)時(shí)候的數(shù)據(jù)沒(méi)有清洗因?yàn)閿?shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù),無(wú)法關(guān)聯(lián)相關(guān)的問(wèn)題,所以長(zhǎng)期的解決方案提供給客 戶(hù)分類(lèi)和分組的問(wèn)題陳述都缺失了,導(dǎo)致企業(yè)不能對(duì)問(wèn)題進(jìn)行分組從上面的討論中,對(duì)客戶(hù)滿(mǎn)意度和保證分析使用大數(shù)據(jù)分析將幫助企業(yè)在急需的 客戶(hù)注意力設(shè)置中獲得洞察力,并有效地解決他們的問(wèn)題以及在他們的新產(chǎn)品線(xiàn) 上避免這些問(wèn)題。競(jìng)爭(zhēng)對(duì)手的市場(chǎng)滲透率分析:在今天高度競(jìng)爭(zhēng)的經(jīng)濟(jì)環(huán)境下,我們需要通過(guò)一種 實(shí)時(shí)分析對(duì)競(jìng)爭(zhēng)者強(qiáng)大的區(qū)域和他們的痛點(diǎn)進(jìn)行衡量。 這種信息是可適用于各種 各
6、樣的網(wǎng)站、社交媒體網(wǎng)站和其他公共領(lǐng)域。對(duì)這種數(shù)據(jù)的大數(shù)據(jù)分析可以向企 業(yè)提供關(guān)于他們產(chǎn)品線(xiàn)的優(yōu)勢(shì)、劣勢(shì)、機(jī)遇、威脅等非常需要的信息。醫(yī)療保健/流行病的研究和控制:流行病和像流感這樣的季節(jié)性疾病在人群中以 一定的模式開(kāi)始,如果沒(méi)有及早發(fā)現(xiàn)和控制,它們就會(huì)傳播到更大的區(qū)域。這對(duì) 發(fā)展中以及發(fā)達(dá)的國(guó)家都是一個(gè)最大的挑戰(zhàn)。 當(dāng)前絕大部分時(shí)間的問(wèn)題是人們之 間的癥狀各異,而且不同的醫(yī)護(hù)人員治療他們的方法也不同。 人群中也沒(méi)有一種 常見(jiàn)的癥狀分類(lèi)。在這種典型的非結(jié)構(gòu)化數(shù)據(jù)上采用大數(shù)據(jù)分析將有助于地方 ZF有效地應(yīng)對(duì)疫情的情況。產(chǎn)品功能和用法分析:大多數(shù)產(chǎn)品企業(yè),尤其是消費(fèi)品,不斷在他們的產(chǎn)品線(xiàn)上 增加許多功能,但有可能一些功能不會(huì)真正地被顧客所使用,而有些功能則更多 地被使用,對(duì)這種通過(guò)各種移動(dòng)設(shè)備和其它基于無(wú)線(xiàn)射頻識(shí)別 (RFID)輸入捕捉 到的數(shù)據(jù)的有效分析,可以為產(chǎn)品企業(yè)提供有價(jià)值的洞察力。未來(lái)方向的分析:研究小組分析在各種業(yè)務(wù)中的趨勢(shì),而這種信息通過(guò)行業(yè)特定 門(mén)戶(hù)網(wǎng)站甚至常見(jiàn)的博客可以獲得。對(duì)這種未來(lái)數(shù)據(jù)的不斷分析將有助于企業(yè)期 待未來(lái),并將這些期待帶入他們的生產(chǎn)線(xiàn)??偨Y(jié)大數(shù)據(jù)分析為企業(yè)和ZF分析非結(jié)構(gòu)化的數(shù)據(jù)提供了新的途徑,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 虛擬現(xiàn)實(shí)游戲健康影響研究-洞察分析
- 水產(chǎn)養(yǎng)殖自動(dòng)化探索-洞察分析
- 無(wú)線(xiàn)輸入輸出設(shè)備技術(shù)-洞察分析
- 現(xiàn)代炸藥研究進(jìn)展-洞察分析
- 印刷行業(yè)市場(chǎng)細(xì)分策略-洞察分析
- 一體化進(jìn)程中的產(chǎn)業(yè)轉(zhuǎn)移效應(yīng)-洞察分析
- 體育場(chǎng)館的綠色可持續(xù)發(fā)展-洞察分析
- 先進(jìn)制造工藝仿真-洞察分析
- 《人力資源管理綜述》課件
- 2024年05月江蘇中國(guó)建設(shè)銀行江蘇省分行春季校園招考和證件環(huán)節(jié)筆試歷年參考題庫(kù)附帶答案詳解
- 重大隱患判定標(biāo)準(zhǔn)培訓(xùn)課件
- 畫(huà)法幾何及機(jī)械制圖課件
- 棋牌游戲自審自查報(bào)告
- 地質(zhì)災(zāi)害風(fēng)險(xiǎn)調(diào)查評(píng)價(jià)項(xiàng)目招標(biāo)文件
- JJF 2088-2023大型蒸汽滅菌器溫度、壓力、時(shí)間參數(shù)校準(zhǔn)規(guī)范
- 幼兒園食堂食品安全主體責(zé)任風(fēng)險(xiǎn)管控清單(日管控)
- 九年級(jí)上冊(cè)第二單元民主與法治 單元作業(yè)設(shè)計(jì)
- 陜西華縣皮影戲調(diào)研報(bào)告
- 2016年食堂期末庫(kù)存
- 運(yùn)籌學(xué)課程設(shè)計(jì)報(bào)告
- (完整)雙溪課程評(píng)量表
評(píng)論
0/150
提交評(píng)論