大數(shù)據(jù)與NOSql概述_第1頁
大數(shù)據(jù)與NOSql概述_第2頁
大數(shù)據(jù)與NOSql概述_第3頁
大數(shù)據(jù)與NOSql概述_第4頁
大數(shù)據(jù)與NOSql概述_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

信息技術(shù)部,大數(shù)據(jù)與NOSql概述(2016年12月18日),主要內(nèi)容,大數(shù)據(jù)概述大數(shù)據(jù)的定義大數(shù)據(jù)的4V特征大數(shù)據(jù)的系統(tǒng)要求大數(shù)據(jù)的典型架構(gòu)大數(shù)據(jù)的應(yīng)用大數(shù)據(jù)的發(fā)展,主要內(nèi)容,Nosql概述什么是NoSQLNoSQL的優(yōu)勢和不足NoSQL的CAP理論實(shí)現(xiàn)NoSQL數(shù)據(jù)模型及分類,大數(shù)據(jù)的定義,大數(shù)據(jù)(bigdata),指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。在維克托邁爾-舍恩伯格及肯尼斯庫克耶編寫的大數(shù)據(jù)時(shí)代2中大數(shù)據(jù)指不用隨機(jī)分析法(抽樣調(diào)查)這樣捷徑,而采用所有數(shù)據(jù)進(jìn)行分析處理。,大數(shù)據(jù)的4V特征,Volume(海量)、Variety(多樣)、Velocity(實(shí)時(shí))、Value(價(jià)值)海量數(shù)據(jù)量巨大,對(duì)TB、PB數(shù)據(jù)級(jí)的處理,已經(jīng)成為基本配置。多樣處理多樣性的數(shù)據(jù)類型,結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),能處理Web數(shù)據(jù),能處理語音數(shù)據(jù)甚至是圖像、視頻數(shù)據(jù)。實(shí)時(shí)在客戶每次瀏覽頁面,每次下訂單的過程中都存在,都會(huì)需要對(duì)用戶進(jìn)行實(shí)時(shí)的推薦,決策已經(jīng)變得實(shí)時(shí)價(jià)值價(jià)值密度低,商業(yè)價(jià)值高。一條數(shù)小時(shí)的監(jiān)控視頻,可能有用的數(shù)據(jù)僅有一兩秒。能從海量數(shù)據(jù)中發(fā)掘出這些數(shù)據(jù),將成為企業(yè)競爭力的重要來源。,大數(shù)據(jù)的系統(tǒng)需求,高新能(Highperformance)高并發(fā)讀寫實(shí)時(shí)動(dòng)態(tài)獲取和更新數(shù)據(jù)海量存儲(chǔ)(HugeStorage)海量數(shù)據(jù)的高效率存儲(chǔ)和訪問類似SNS網(wǎng)站高可擴(kuò)展性和高可用性(HighScalability&HighAvailability)需要擁有快速橫向擴(kuò)展能力能提供7*24小時(shí)不間斷服務(wù),大數(shù)據(jù)典型架構(gòu),大數(shù)據(jù)典型架構(gòu),大數(shù)據(jù)典型架構(gòu),數(shù)據(jù)計(jì)算用時(shí)對(duì)比離線計(jì)算流式計(jì)算實(shí)時(shí)計(jì)算,大數(shù)據(jù)的應(yīng)用,大數(shù)據(jù)與互聯(lián)網(wǎng)大交易數(shù)據(jù):來自電商的數(shù)據(jù),包括B2B、B2C、C2C、團(tuán)購等大交互數(shù)據(jù):來自社交網(wǎng)絡(luò)的數(shù)據(jù),SNS、微博等兩類數(shù)據(jù)有效融合將是大勢所趨,更能增強(qiáng)企業(yè)的商業(yè)洞察力,大數(shù)據(jù)的應(yīng)用,大數(shù)據(jù)與金融銀行,大數(shù)據(jù)的應(yīng)用,大數(shù)據(jù)與金融保險(xiǎn),大數(shù)據(jù)的應(yīng)用,大數(shù)據(jù)與金融證券股價(jià)預(yù)測客戶關(guān)系管理投資景氣指數(shù)分析,大數(shù)據(jù)的發(fā)展,NOSql的概念,什么是NoSQL?NoSQL是NotOnlySQL的縮寫,而不是NotSQL;它不一定遵循傳統(tǒng)數(shù)據(jù)庫的一些基本要求,比如SQL標(biāo)準(zhǔn)、ACID屬性、表結(jié)構(gòu)等等。相比傳統(tǒng)數(shù)據(jù)庫,叫它分布式數(shù)據(jù)管理系統(tǒng)更貼切,數(shù)據(jù)存儲(chǔ)被簡化更靈活,重點(diǎn)被放在了分布式數(shù)據(jù)管理上。NoSQL數(shù)據(jù)庫主要應(yīng)用于web2.0的大規(guī)模系統(tǒng),具有模式靈活、最終一致性、面向海量數(shù)據(jù)、分布式、開源、水平可擴(kuò)展、配置簡單、非關(guān)系型等特點(diǎn)。,NOSql的優(yōu)勢,易擴(kuò)展NoSQL數(shù)據(jù)庫種類繁多;共同的特點(diǎn)都是去掉系型特性;數(shù)據(jù)之間無關(guān)系,容易橫向擴(kuò)展;甚至可以NoSQL之間的整合。數(shù)據(jù)模型靈活無需事先為要存儲(chǔ)的數(shù)據(jù)建立字段隨時(shí)可以存儲(chǔ)自定義的數(shù)據(jù)格式高可用NoSQL在不太影響性能的情況,就可以方便的實(shí)現(xiàn)高可用的架構(gòu)。比如Cassandra,HBase模型,通過復(fù)制模型也能實(shí)現(xiàn)高可用。大數(shù)據(jù)量,高性能NoSQL數(shù)據(jù)庫都具有非常高的讀寫性能,尤其在大數(shù)據(jù)量下,同樣表現(xiàn)優(yōu)秀。這得益于它的無關(guān)系性,數(shù)據(jù)結(jié)構(gòu)簡單。,NOSql的CAP原理實(shí)現(xiàn),分布式數(shù)據(jù)系統(tǒng)的CAP原理的三要素:一致性(Consistency)可用性(Availability)分區(qū)容忍性(Partitiontolerance)NOSql的CAP原理實(shí)現(xiàn):在分布式系統(tǒng)中,三個(gè)要素最多只能同時(shí)實(shí)現(xiàn)兩點(diǎn)考慮CP,主要是一些Key-Value數(shù)據(jù)庫,典型代表為Google的BigTable,將各列數(shù)據(jù)進(jìn)行排序存儲(chǔ)。數(shù)據(jù)值按范圍分布在多臺(tái)機(jī)器,數(shù)據(jù)更新操作有嚴(yán)格的一致性保證。考慮AP,主要是一些面向文檔的適用于分布式系統(tǒng)的數(shù)據(jù)庫,如Amazon的Dynamo,Dynamo將數(shù)據(jù)按key進(jìn)行Hash存儲(chǔ)。其數(shù)據(jù)分片模型有比較強(qiáng)的容災(zāi)性,因此它實(shí)現(xiàn)的是相對(duì)松散的弱一致性最終一致性,NOSql數(shù)據(jù)模型及分類,NoSQL的兩個(gè)核心理論基礎(chǔ):Google的BigTableBigTable將各列數(shù)據(jù)進(jìn)行排序存儲(chǔ);數(shù)據(jù)值按范圍分布在多臺(tái)機(jī)器;數(shù)據(jù)更新操作有嚴(yán)格的一致性保證。Amazon的DynamoDynamo使用的是另外一種分布式模型;模型更簡單,將數(shù)據(jù)按key進(jìn)行hash存儲(chǔ);其數(shù)據(jù)分片模型有比較強(qiáng)的容災(zāi)性;實(shí)現(xiàn)的是相對(duì)松散的弱一致性(最終一致性)。,NOSql數(shù)據(jù)模型及分類,NOSql數(shù)據(jù)模型及分類,NOSql使用情況,NOSql數(shù)據(jù)模型及分類,DB-Engines發(fā)布了2016年12月份的數(shù)據(jù)庫排名,NOSql數(shù)據(jù)模型及分類,綜合來看,NoSQL數(shù)據(jù)庫正在逐漸地成為數(shù)據(jù)庫領(lǐng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論