信息技術(基礎模塊上下冊)4.4初識大數(shù)據_第1頁
信息技術(基礎模塊上下冊)4.4初識大數(shù)據_第2頁
信息技術(基礎模塊上下冊)4.4初識大數(shù)據_第3頁
信息技術(基礎模塊上下冊)4.4初識大數(shù)據_第4頁
信息技術(基礎模塊上下冊)4.4初識大數(shù)據_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

4.4初識大數(shù)據第4單元數(shù)據處理問1什么是大數(shù)據?它有哪些特點?2技術角度:指傳統(tǒng)數(shù)據處理應用軟件不足以處理的大或復雜的數(shù)據集。資源角度:指海量、高速增長和多樣化的信息資產。特點體量大:存儲的數(shù)據能達TB、PB、EB、ZB級;數(shù)據類型多:存儲的數(shù)據欽多種結構化數(shù)據、半結構化數(shù)據和非結構化數(shù)據等形式;數(shù)據產生速度快:大數(shù)據通過多維度的自動采集和記錄,積累速度快,并具有一定的流動性;數(shù)據價值密度低:大數(shù)據蘊含著大價值,但需要通過專業(yè)的技術手段加以處理才能發(fā)現(xiàn)。問2大數(shù)據的處理流程是什么?LOREM數(shù)據采集數(shù)據預處理數(shù)據存儲數(shù)據挖掘數(shù)據呈現(xiàn)從傳感器或其他采集設備獲取信息,包括實時數(shù)據和非實時數(shù)據,如道路監(jiān)控、網頁瀏覽、在線支付、外賣訂購等數(shù)據清洗,即消除在數(shù)據采集的過程中由于人為疏忽、設備異?;虺闃臃椒ú缓侠淼纫蛩卦斐傻臄?shù)據誤差、數(shù)據遺失、重復等,以提高數(shù)據質量和完整性。大數(shù)據存儲需要分布式文件系統(tǒng)和分布式數(shù)據庫的支持,NOSQL(非關系型數(shù)據庫)是大數(shù)據存儲常使用的數(shù)據庫??砂l(fā)掘先前未知具潛在有用的信息模型或規(guī)則,以產生有價值的信息和知識,幫助決策者做出適當?shù)臎Q策,數(shù)據挖掘所處理的問題類型分為分類、預測、有序關聯(lián)規(guī)則四種。大數(shù)據的可視化技術,能夠幫助人們有效理解數(shù)據,以真正利用好大數(shù)據,分結構可視化、功能可視化、關聯(lián)關系可視化和發(fā)展趨勢可視化。問3大數(shù)據主要應用在哪些場景?風險分析和管理(股市)交易監(jiān)管(貸款)網絡監(jiān)管(流量提醒)健康保險(體驗)預測銷售(購物APP)天氣質量檢測(天氣預報)任務了解大數(shù)據實踐體驗超市商品位置擺放的優(yōu)化分析原始數(shù)據提取關聯(lián)信息統(tǒng)計關聯(lián)數(shù)據決策應用7什么是大數(shù)據?它有哪些特點?大數(shù)據的處理流程是什么?大數(shù)據主要應用在哪些場景?課堂總結

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論