2017公需科目大數(shù)據(jù)時代課件_第1頁
2017公需科目大數(shù)據(jù)時代課件_第2頁
2017公需科目大數(shù)據(jù)時代課件_第3頁
2017公需科目大數(shù)據(jù)時代課件_第4頁
2017公需科目大數(shù)據(jù)時代課件_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

《大數(shù)據(jù)時代的互聯(lián)網(wǎng)信息安全》講義第一章認識大數(shù)據(jù)的基本常識大數(shù)據(jù)時代悄然而至我們每天坐在電腦前在網(wǎng)上搜索、購物、發(fā)信息、發(fā)圖片,用手機打電話、發(fā)彩信……很多人都在不經(jīng)意中制造和使用著數(shù)據(jù)。因此,產(chǎn)生的數(shù)據(jù)量正在以驚人的速度增長——數(shù)據(jù)已經(jīng)滲透到生活和工作的方方面面,成為時代的特征。大數(shù)據(jù)時代已經(jīng)悄然來臨。在這樣的背景下,人們逐漸認識到大數(shù)據(jù)給自己帶來的作用。這就讓人們需要一個巨大容量的存儲設備。所以,大數(shù)據(jù)產(chǎn)生的一個顯著標志就是:為了滿足市場的要求,數(shù)據(jù)存儲設備的容量越來越多,處理數(shù)據(jù)的速度越來越快。數(shù)據(jù)暴漲的不僅是人數(shù),更有因人數(shù)劇增而產(chǎn)生的一些技術性數(shù)據(jù)。事實上,今天的全球互聯(lián)網(wǎng)巨頭都已經(jīng)意識到大數(shù)據(jù)時代數(shù)據(jù)的重要意義。包括易安信、惠普、IBM、微軟在內(nèi)的全球IT巨頭紛紛通過收購大數(shù)據(jù)相關廠商來實現(xiàn)技術整合,這足以看出它們對大數(shù)據(jù)的重視。大數(shù)據(jù)產(chǎn)生的背景大數(shù)據(jù)之所以會進入主流大眾的視野,我們分析得知,緣于三種趨勢的合力。第一,隨著互聯(lián)網(wǎng)的發(fā)展,許多高端消費公司為了提供更先進的、更完美的服務,加大了對大數(shù)據(jù)的應用??梢钥闯?,大家都在利用大數(shù)據(jù)產(chǎn)生利益,反過來,利用大數(shù)據(jù)的人就變成了催生大數(shù)據(jù)時代到來的力量之一。第二,人們在無形中紛紛為大數(shù)據(jù)投資。第三,商業(yè)用戶和其他以數(shù)據(jù)為核心的消費產(chǎn)品,也開始期待以一種同樣便捷的方式來獲得大數(shù)據(jù)的使用體驗。所以,商業(yè)用戶也成為了推動大數(shù)據(jù)發(fā)展的動力之一。一切都可以數(shù)據(jù)化凡事皆可量化。只要我們能夠找到觀察問題的方式,并從一個新的角度去衡量它,不管從這個新的角度衡量它到底精準度如何,只要它能我們知道得比以前更多,那么它就是一種可行的量化方法。實際上,對那些看似不可量化的東西,人們總能找到相對簡單的量化方法。在大數(shù)據(jù)時代,數(shù)據(jù)在以我們無法想象的速度增長著,有些問題是無法實現(xiàn)非常精確的計算的,而費米分解就為我們提供了很好的思路。我們要避免陷入不確定性及“無法”分析的泥潭,為了避免被顯而易見的不確定性壓倒,應該從知道的事情開始提問。評測我們已了解的事物的數(shù)量,是量化那些似乎根本不可量化的事物的重要步驟。在未來的世界里,一切都可以數(shù)據(jù)化。一切都保存在互聯(lián)網(wǎng)的數(shù)據(jù)庫中,當你有一天需要的時候,數(shù)據(jù)庫服務商能夠將這些數(shù)據(jù)調(diào)出來給你,對其進行數(shù)字化。統(tǒng)計學:解析大數(shù)據(jù)的工具統(tǒng)計學的概念最早出現(xiàn)在古希臘的亞里士多德時期,最初的用途是計算各個城邦王國的經(jīng)濟和居民狀況等社會經(jīng)濟問題。現(xiàn)在,統(tǒng)計學被廣泛應用于國家管理、企業(yè)運營、科學研究各個不同領域。以統(tǒng)計學在社會中的作用來看,其發(fā)展經(jīng)歷了三個階段。1.城邦政情古希臘亞里士多德撰寫的“城邦政情”是最早應用統(tǒng)計學方法的記錄。2.政治算術政治算術的特點是,統(tǒng)計方法與數(shù)學計算、推理方法開始結合,分析社會經(jīng)濟問題的方式,更加注重運用定量分析方法。3.大數(shù)據(jù)時代隨著計算機和現(xiàn)代檢測技術的發(fā)展,提取數(shù)據(jù)越來越容易。大數(shù)據(jù)用于形容那些數(shù)量龐大到無法用人工,甚至用簡單的計算機軟件進行處理的海量數(shù)據(jù)。檢測技術還可以越來越成為方便地統(tǒng)計溫度、壓力、溫度、亮度、粉塵顆粒等信息,從而積累大量的數(shù)據(jù),用于分析人們在不同條件下的行為變化。大數(shù)據(jù)現(xiàn)在也成為另一種概念,也就是用大量的數(shù)據(jù)信息進行統(tǒng)計,從看似沒有關聯(lián)的事物中獲取有價值的規(guī)律。大數(shù)據(jù)時代,我們離不開統(tǒng)計學,否則,大數(shù)據(jù)時代的建立和數(shù)據(jù)的實際運用就是一場空談。數(shù)據(jù)大小怎么算人們發(fā)現(xiàn),大數(shù)據(jù)的主要特點為數(shù)據(jù)量大(Volume)、數(shù)據(jù)類別復雜(Variety)、數(shù)據(jù)處理速度快(Velocity)以及數(shù)據(jù)真實性高(Veracity),合起來被稱為4V。大數(shù)據(jù)中的數(shù)據(jù)量非常大,而且這龐大的數(shù)據(jù)中,不僅僅包括結構化數(shù)據(jù),如數(shù)字、符號等數(shù)據(jù),還包括非結構化數(shù)據(jù),如文本、圖像、聲音、視頻等數(shù)據(jù)。第二章數(shù)據(jù)的收集管理和使用收據(jù)數(shù)據(jù)不是最要緊的大數(shù)據(jù)時代,不管你用與不用,數(shù)據(jù)就零零碎碎地散放在那里。但是,要想使用大數(shù)據(jù),首先要做的是收集大量數(shù)據(jù),但收集數(shù)據(jù)并非僅是把收集過來的數(shù)據(jù)放到硬盤里那么簡單,更重要的是對數(shù)據(jù)進行分類、存放及管理。數(shù)據(jù)的價值在于使用,不是存儲。人們發(fā)現(xiàn),大數(shù)據(jù)的真正價值是將數(shù)據(jù)用于形成主動收集數(shù)據(jù)的良性循環(huán)中,以帶動更多的數(shù)據(jù)進入自循環(huán)中,并應用于各個行業(yè)?!盎睢弊鰯?shù)據(jù)收集所謂“活”做數(shù)據(jù)收集,就是指用戶不要局限于只收集自己用戶產(chǎn)生的數(shù)據(jù),還要把“別人”的數(shù)據(jù)收集過來進行綜合分析。前面提到過,數(shù)據(jù)收集,一方面是“自己用”——用其他外面的數(shù)據(jù)來增加自己手上數(shù)據(jù)的精準度,為我所用;而另一方面是“給別人用”——把我的數(shù)據(jù)貢獻給很需要我的數(shù)據(jù)的人,從而提高他的數(shù)據(jù)的精準度。做大數(shù)據(jù)收集,有時候需要更多的靈活變通?!盎睢弊鰯?shù)據(jù)收集,就是要跳出既定思維的框架,從相關聯(lián)的行業(yè)和業(yè)務中去收集能夠為現(xiàn)在所用的數(shù)據(jù),找到能夠更好地佐證企業(yè)現(xiàn)有業(yè)務決策和發(fā)展的數(shù)據(jù)。而“活”做數(shù)據(jù)收集的一大好處,就是能夠規(guī)避現(xiàn)有數(shù)據(jù)框架的弊端,更好地反映用戶的實際需求和市場的實際情況。“活”看數(shù)據(jù)指標“活”看數(shù)據(jù)指標就是指企業(yè)不要局限于已有的數(shù)據(jù)框架,而應該結合用戶需求的不同場景來靈活應用收集到的“活”數(shù)據(jù)。我們不僅要靈活第收集數(shù)據(jù),而且還要注意到,數(shù)據(jù)收集只是第一步,如果不讓數(shù)據(jù)“活”起來,僅僅是把收集的數(shù)據(jù)簡單地堆砌在一起,是沒有意義的。“活”用數(shù)據(jù),就是你是否看出這個數(shù)據(jù)本身的局限是什么。一方面,是數(shù)據(jù)為用戶體驗改善了什么;另一方面,企業(yè)在使用數(shù)據(jù)時,對活數(shù)據(jù)的運用解決了什么問題,或者創(chuàng)造了什么機會,要牢牢記住,活用數(shù)據(jù)很重要?!盎睢钡臄?shù)據(jù)是活用數(shù)據(jù)的精髓所在。企業(yè)能夠基于場景和相關的“活”數(shù)據(jù)將數(shù)據(jù)應用發(fā)揮出最大的價值,那么新的商業(yè)模式的開創(chuàng)也就會在不遠的將來成為可能。數(shù)據(jù)的存放與管理就數(shù)據(jù)的收集而言,最重要的不是看我們收集了什么數(shù)據(jù),而是要思考這些數(shù)據(jù)如何使用以及搜集這些數(shù)據(jù)到底能夠起到社么樣的作用。用一句話來說,就是收集數(shù)據(jù)不是目的,收集起來的數(shù)據(jù)如何產(chǎn)生價值才是最終的目標。不貴哦,如何收集在未來具有價值的數(shù)據(jù)的確是一個難題,當中就需要一些經(jīng)驗的判斷了。數(shù)據(jù)存儲下來以后,數(shù)量和廣度都很大,就需要對之進行完善的管理。數(shù)據(jù)管理的內(nèi)容包括很多方面,比如,數(shù)據(jù)的來源、如何讓數(shù)據(jù)不丟失、如何保護數(shù)據(jù)的安全、如何讓數(shù)據(jù)準確和穩(wěn)定以及如何更好地運用數(shù)據(jù),這些都是數(shù)據(jù)運營中的管。但是“管”并沒有一個標準可循。大數(shù)據(jù)管理到底是怎么做?目前還沒有準確答案。數(shù)據(jù)管理,是大數(shù)據(jù)行業(yè)的臟活、苦活和累活,是最悲催和最難解決的事情。如果沒這些背景做鋪墊,人們對很多公司在做的所謂的大數(shù)據(jù)的運營就持有懷疑態(tài)度了。注意數(shù)據(jù)分類的維度在觀察與分析數(shù)據(jù)中,我們要從中抽象出來,更好地將數(shù)據(jù)進行歸類和整理,從而更加清晰地識別出數(shù)據(jù)的價值。權威的數(shù)據(jù)公司從數(shù)據(jù)分類的角度講數(shù)據(jù)分為以下四種。1.按照是夠可可以再生的標準來看,可以分為不可再生數(shù)據(jù)和可再生數(shù)據(jù)。不可再生數(shù)據(jù)通常就是最原始的數(shù)據(jù)。可再生數(shù)據(jù)就是通過其他數(shù)據(jù)可以生成的數(shù)據(jù),原則上,指標類數(shù)據(jù)的衍生數(shù)據(jù)都是可再生的——只要原始的不可再生數(shù)據(jù)還在,就可以通過重新運算來獲得。對于不可再生的數(shù)據(jù)而言,已有的數(shù)據(jù)要嚴格保護,想要但是是還沒有的數(shù)據(jù)就要及早收集。對于可再生數(shù)據(jù)而言,要及早做好業(yè)務的預判和數(shù)據(jù)處理的規(guī)劃,這樣一來,數(shù)據(jù)在需要的時候就能夠快速地獲得應用,人們把這一數(shù)據(jù)稱為數(shù)據(jù)中間層。2.按照數(shù)據(jù)所處的存儲層次來看,可以分為基礎層、中間層和應用層?;A層通常與原始數(shù)據(jù)基本一致,也就是僅僅存儲最基本的數(shù)據(jù),不做匯總,以盡量避免失真,從而用作其他數(shù)據(jù)研究的基礎;中間層是基于基礎層加工的數(shù)據(jù),通常被認為是數(shù)據(jù)倉庫層,這些數(shù)據(jù)會根據(jù)不同的業(yè)務需求,按照不同的主體來進行存放;應用層則是針對具體數(shù)據(jù)的應用,比如作為解決具體問題的數(shù)據(jù)分析和數(shù)據(jù)挖掘的應用層的數(shù)據(jù)。在存儲層這個層面上,最大的問題就是數(shù)據(jù)的冗余和管理的混亂。尤其是對于一些擁有海量數(shù)據(jù)的大公司而言,數(shù)據(jù)的冗余問題尤為嚴重,由此造成了大量的浪費。3.按照數(shù)據(jù)業(yè)務歸屬來看,可以分為各個數(shù)據(jù)主體對于數(shù)據(jù)的分類則主要根據(jù)業(yè)務特點進行歸類,并沒有一個特別的硬性規(guī)定??傮w的原則就是讓數(shù)據(jù)的存儲空間更少,分析及挖掘的過程更簡單、快捷。4.按照是否隱私來區(qū)分,可以分為隱私數(shù)據(jù)和非隱私數(shù)據(jù)顧名思義,隱私數(shù)據(jù)就是需要有嚴格的保密措施來保護的數(shù)據(jù),否則會對用戶的隱私造成威脅。用戶的交易記錄屬于隱私類數(shù)據(jù),對于一家有著良好數(shù)據(jù)管理機制的公司而言,通常的管理方法是對數(shù)據(jù)的隱私級別進行分層,數(shù)據(jù)從安全的角度可以進行兩種類型、四個層次的數(shù)據(jù)分層。兩種類型就是企業(yè)級別和用戶級別。企業(yè)級別的數(shù)據(jù)包括交易額、利潤、某大型活動的成交額等;個人級別的素具就像是剛才提到的身份證號碼、密碼、用戶名、手機號碼等。四個層次是對數(shù)據(jù)進行分類,分別由公開數(shù)據(jù)、內(nèi)部數(shù)據(jù)、保密數(shù)據(jù)、機密數(shù)據(jù)。如何應用存儲的數(shù)據(jù)從使用數(shù)據(jù)的角度來說,電商行業(yè)就有很多值得其他行業(yè)借鑒的地方,可以讓數(shù)據(jù)能夠真正地使用起來,并且產(chǎn)生實際的商業(yè)價值。建立標簽,簡單地說就是通過數(shù)據(jù)的分析來對用戶的偏好進行描述,建立標簽通常有以下三種方法。第一是通過業(yè)務規(guī)則結合數(shù)據(jù)分析來建立標簽,這一類型的標簽和業(yè)務人員的經(jīng)驗緊密結合。第二是通過模型來建立標簽。第三是通過模型的組合來生成新的標簽。標簽的應用是指在電商網(wǎng)站的首頁或者具體的類目網(wǎng)頁,進行標簽的使用。標簽的使用,最核心的就是數(shù)據(jù)中間層和前臺業(yè)務層的對接,并且能夠讓運營人員非常方便地進行商品的設置。這里涉及兩個核心點:一是中間層和業(yè)務層的對接;二是中間層的易用性。對于數(shù)據(jù)從業(yè)者來說,讓數(shù)據(jù)變得超級簡單是一個非常重要的使命,所以界面的設計和后臺的管理等內(nèi)容都非常重要,否則可能會失去標簽系統(tǒng)的價值。第三章看看大數(shù)據(jù)的價值在哪里數(shù)據(jù)中蘊藏著寶藏在大數(shù)據(jù)時代,我們都認為信息是個好東西,但是在大數(shù)據(jù)時代,信息爆發(fā)式增長,給存儲、管理和分析信息的人帶來巨大的壓力。在大數(shù)據(jù)時代,無論是個人、企業(yè)還是政府,都面臨著如何管理和利用信息的難題。與此同時,隨著數(shù)據(jù)數(shù)量的匯集,數(shù)據(jù)的管理和分析工作變得格外很總要。數(shù)據(jù)的價值正在成為企業(yè)成長的重要動力,它不僅提供了更多的商業(yè)機會,也是企業(yè)運運營情況及財務狀況的中藥分析依據(jù)。數(shù)據(jù)的分類估值在大數(shù)據(jù)時代,每做一件事情我們都要知道確切的目的是什么。從自我的角度考慮,當我們給數(shù)據(jù)分類之后,就能更容易理解大數(shù)據(jù)存在的價值。從數(shù)據(jù)角度來說,估值就是通過不同的維度去思考數(shù)據(jù)的價值。只有基于對數(shù)據(jù)的分類和對數(shù)據(jù)價值的不同人事,才能去對數(shù)據(jù)做篩選。數(shù)據(jù)座位一種資產(chǎn),不同數(shù)據(jù)含金量必然不同,自然就會產(chǎn)生不同的價值。對于數(shù)據(jù)而言,不同的場景也會產(chǎn)生不同的價值,有些數(shù)據(jù)可能會變成一個運營指標,能夠讓我們更好地對業(yè)務進行決策。數(shù)據(jù)作為一種資產(chǎn),不同的數(shù)據(jù)含金量必然不同,自然會產(chǎn)生不同的價值。而且,就同一組數(shù)據(jù)而言,在不同的環(huán)境下甚至會呈現(xiàn)出不同的價值。認清數(shù)據(jù)的五大價值1.識別與串聯(lián)價值識別的價值,肯定是唯一能夠鎖定目標的數(shù)據(jù)。2.描述價值用來描述數(shù)據(jù)最好的一種方式就是分析數(shù)據(jù)的框架,在復雜的數(shù)據(jù)中抽象出核心的點,讓使用者能夠在極短的時間里看到經(jīng)營狀況,同樣,又能讓使用者看到更多他想看的細節(jié)數(shù)據(jù)。分析數(shù)據(jù)的框架是對一個數(shù)據(jù)分析師的基本要求——基于對數(shù)據(jù)的理解,對數(shù)據(jù)進行分類和有邏輯的展示。通常,優(yōu)秀的數(shù)據(jù)分析師都具備非常好的數(shù)據(jù)框架分析能力。3.時間價值數(shù)據(jù)的時間價值是大數(shù)據(jù)運用最直接的體現(xiàn),通過對時間的分析,能夠很好地歸納出一個用戶對于一種場景的偏好。4.預測價值數(shù)據(jù)的預測價值分成兩個部分。第一個部分是對于某一個單品進行預測。第二部分是數(shù)據(jù)對于經(jīng)營狀況的預測,即對公司的正題運營進行預測,并能夠用預測的結論指導公司的經(jīng)營策略。5.產(chǎn)出數(shù)據(jù)的價值從數(shù)據(jù)的價值來說,很多數(shù)據(jù)本身并沒有特別的含義,但是在幾個數(shù)據(jù)組合在一起活著對部分數(shù)據(jù)進行整合之后就產(chǎn)生了新的價值。第四章大數(shù)據(jù)時代的管理者頂尖企業(yè)的數(shù)據(jù)管理模式企業(yè)的規(guī)模越來越大,管理者頁越來越無法僅憑直覺和經(jīng)驗進行管理與決策。所以,我們需要用數(shù)據(jù),而非用感覺來管理,因為人的感覺很可能出現(xiàn)偏差,一定要運用數(shù)據(jù),運用數(shù)量比的方法觀察去也運營、進行市場預測,以及對人員進行有效的管理和評估。只有這樣,我們才能夠把握未來的發(fā)展機遇。管理者必備的刷數(shù)據(jù)運用能力1.用數(shù)據(jù)明確方向目標可以理解為“目的”的數(shù)量化標準。目標是員工的努力方向。2.用數(shù)量化復制成功3.用數(shù)量化思維打造執(zhí)行力第五章大數(shù)據(jù)的管理工具數(shù)據(jù)下的PDCA管理循環(huán)PDCA循環(huán)是管理學中著名的理論模型,由計劃(plan)、執(zhí)行(do)、檢查(check)和改進(action)四個步驟構成。1.計劃2.執(zhí)行執(zhí)行就是具體運作,實現(xiàn)計劃中的內(nèi)容。3.檢查對計劃執(zhí)行情況進行及時的檢查和總結,尤其是要用數(shù)據(jù)進行描述。4.改進對檢查的結果進行處理,認可或者否定。用數(shù)據(jù)預測未來并規(guī)避風險現(xiàn)代企業(yè)管理要求我們必須在東臺變化中作出決策。需要根據(jù)形勢變化進行及時的調(diào)整,因此,對未來即將發(fā)生的情況掌握越多,就越能夠提前做好防范。數(shù)據(jù)在其中往往發(fā)揮著不可忽視的作用。運用數(shù)據(jù)預測用于推動銷售人員了解自己的業(yè)務,判斷客戶對自己的接受程度,找出距離目標的差距,提前采取行動。數(shù)據(jù)預測對于企業(yè)的運營有著非常重要的意義。一方面,企業(yè)可以根據(jù)預測有計劃第安排運營;另一方面,也可以推動員工清晰地梳理自己的業(yè)務,樹立良好的工作意識,預測包括很多方面,比如,未來的生產(chǎn)能力與原料供應是都充分、人員狀況、銷售狀況等等。在績效管理中引入商務智能商務智能本質上是關于把組織的業(yè)務數(shù)據(jù)轉化成容易理解、價值較高的信息,并將正確的信息在正確的時間以正確的方式分配給正確的人。商務智能一般由數(shù)據(jù)倉庫、數(shù)據(jù)查詢和報表、數(shù)據(jù)挖掘、在線分析、預算和預測等部分組成。換言之,商務智能是站在今天的角度回顧過去、展望未來,將過去的信息轉變成今天的知識進而轉變成明天的財富。商務智能將給企業(yè)帶來以下好處。信息共享靈活性和適應性及時有效控制企業(yè)增長創(chuàng)造新的增長降低成本第六章大數(shù)據(jù)下的商業(yè)運行將信息變成一種企業(yè)競爭優(yōu)勢隨著計算機技術的發(fā)展,人民對所謂的“信息技術”的關注往往會偏重于其中的“技術”部分。我們看到,在信息技術剛剛興起的時候,那些較早應用信息技術的企業(yè)能更快地發(fā)展并超越他人,從事相關技術開發(fā)的企業(yè)更成為當下最強大的實體。有人斷言,過去的20年是信息技術的時代,接下來20年的主題仍會是信息技術。企業(yè)能夠更快地處理數(shù)據(jù),而公共數(shù)據(jù)資源和內(nèi)部數(shù)據(jù)資源一體化將帶來獨特的洞見,使他們能夠遠遠超越競爭對手。響應潮流,企業(yè)緱劍大數(shù)據(jù)戰(zhàn)略過去幾年,大數(shù)據(jù)一直致力于以較低的成本采集、存儲和分析數(shù)據(jù),而未來幾年,數(shù)據(jù)的訪問將會加快。成功運用大數(shù)據(jù)的企業(yè)在大數(shù)據(jù)世界中添加了一個更為重要的因素:大數(shù)據(jù)所有者。養(yǎng)企業(yè)一定要學會“養(yǎng)數(shù)據(jù)”“用數(shù)據(jù)”更多的是一種方法論,而“養(yǎng)數(shù)據(jù)”則是一種數(shù)據(jù)戰(zhàn)略,是基于深入業(yè)務理解的更高層次的商業(yè)決策?!梆B(yǎng)數(shù)據(jù)”還有一個重要的含義,就是要決定收集哪些數(shù)據(jù)。“養(yǎng)數(shù)據(jù)”通常有兩類:一類是網(wǎng)站自身免疫的數(shù)據(jù),要用戶主動提供的;另一類是公司擁有的,但沒有進行收集的數(shù)據(jù)。若要收集公司沒有的數(shù)據(jù),在“養(yǎng)數(shù)據(jù)”時通常需要花費更多的精力和技巧。用數(shù)據(jù)更多的是一種方法論,而“養(yǎng)數(shù)據(jù)”則是一種數(shù)據(jù)戰(zhàn)略,是基于深入業(yè)務理解的更高層次的商業(yè)決策,數(shù)據(jù)養(yǎng)的時間越早,積累的數(shù)據(jù)也就越多。養(yǎng)數(shù)據(jù)同樣也是一種管理和商業(yè)藝術,在養(yǎng)之前可能誰也不確定最終會出現(xiàn)什么后果,但一旦養(yǎng)成,數(shù)據(jù)就會產(chǎn)生非常大的商業(yè)價值。第七章商業(yè)典范的大數(shù)據(jù)應用數(shù)據(jù)改寫引擎巨頭商業(yè)模式運算資源為企業(yè)開展大數(shù)據(jù)行動鋪平了道路。當然,企業(yè)依然可以繼續(xù)投資監(jiān)理以私有云為形式的自有基礎設施,而且很多企業(yè)還會這樣做。但是如果企業(yè)想盡快利用額外的、可擴展的運算資源,他們還可以方便、快捷地在亞馬遜系統(tǒng)上使用多個服務器。通過數(shù)據(jù)建立創(chuàng)新體系創(chuàng)新是企業(yè)發(fā)展的核心競爭力。但是,如果沒有精確的數(shù)據(jù)作為指導,創(chuàng)新就無的放矢。運用科學的工具進行創(chuàng)新的代表是“科學管理之父”泰勒。泰勒摸索了一整套制定流程的方法:進行動作分析,詳細分析勞動過程中公認的動作狀況。對生產(chǎn)過程進行分析,主要對工藝路線和切削用量進行分析。對不同勞動條件、勞動環(huán)境和勞動過程的工作情況,也進行了初步的科學研究,發(fā)現(xiàn)好的勞動換可以提升勞動效率,并對此提出了一些合理的改進建議。以新的作業(yè)方法和作業(yè)標準培訓新工人,在他們從剛參加工作時就第八章了解數(shù)據(jù)庫營銷數(shù)據(jù)庫營銷的特點所謂數(shù)據(jù)庫營銷,就是通過手機和積累會員(用戶或者消費者)信息,經(jīng)過分析篩選后有針對性地使用電子郵件、短信、電話、信件等方式進行客戶審讀挖掘與關系維護的營銷方式?;蛘撸瑪?shù)據(jù)庫營銷就是以與顧客建立一對一的互動溝通關系為目標,并依賴龐大的骨科信息庫進行長期促銷活動的一種全新的銷售手段,是一套內(nèi)容涵蓋現(xiàn)有骨科和潛在骨科,可以隨時更新的動態(tài)數(shù)據(jù)庫管理系統(tǒng)。數(shù)據(jù)庫營銷的特點如下:精準通過數(shù)據(jù)庫營銷,我們可以快速、精確地找到最終目標用戶,同時還可以做到非常有針對性地與用戶進行一對一的溝通。2.性價比高通過數(shù)據(jù)庫營銷,耳鳴可以最大化地將新用戶轉化成老用戶,同時深入開發(fā)和挖掘老用戶的價值。而不管是前者還是后者,都將極大地壓縮我們的成本,提升效益。3.競爭隱蔽化其他的網(wǎng)絡營銷方法都是對外課件的,如網(wǎng)絡廣告、軟文營銷、新聞營銷等,競爭對手只要稍微花些心思,就能夠知道我們是如何實施的,甚至完全還原我們的營銷過程,但是數(shù)據(jù)庫營銷的操作過程完全是隱藏而不透明的,除了內(nèi)部相關人員外,誰也不可能知道我們具體是如何實施的。4.個性化世界上沒有任何兩個人的性格、喜好、想法等是完全相同的,所以在做營銷時,最理想的狀態(tài)是針對每一個人的不同情況與特點,進行有針對性的營銷。5.反饋率用戶反饋是企業(yè)掌握用戶心理及需求的一個重要手段,所以在營銷過程中,提升用戶反饋率、搜集用戶反饋信息也是一項非常重要的工作。而數(shù)據(jù)庫營銷的用戶反饋率是極高的,通過數(shù)據(jù)庫營銷,能夠讓企業(yè)很容易把握到用戶的心理及需求。數(shù)據(jù)庫營銷的作用數(shù)據(jù)庫營銷的作用主要有以下幾點:1.維護客戶關系做過銷售的朋友都知道,想讓用戶持續(xù)消費,首先要維護好客戶關系,但是面對龐大對的客戶群,該如何有效維護呢?通過數(shù)據(jù)庫可以輕松解決這個問題,且會大大降低維護成本,特別是對于大型企業(yè),效果尤為明顯。2.開發(fā)老客戶3.實施精準營銷數(shù)據(jù)庫是精準營銷中最重要的一個環(huán)節(jié)。沒有數(shù)據(jù)庫做支持,很難做到真正的精準。4.提升數(shù)據(jù)的價值數(shù)據(jù)庫營銷的實施步驟1.建立數(shù)據(jù)庫2.采集數(shù)據(jù)(1)自有用戶(2)網(wǎng)絡調(diào)查(3)活動(4)網(wǎng)絡搜集(5)購買3.營銷數(shù)據(jù)管理與營銷數(shù)據(jù)挖掘數(shù)據(jù)管理主要是運用先進的統(tǒng)計技術,利用計算機的強大計算能力,把不同的數(shù)據(jù)綜合成為有條理的數(shù)據(jù)庫。特別是大型公司,需要用專門的軟件統(tǒng)一管理用戶的數(shù)據(jù)庫,要做到所有部門的數(shù)據(jù)都是統(tǒng)一和同步的。數(shù)據(jù)挖掘主要是挖掘以下三方面的內(nèi)容:挖掘用戶挖掘需求挖掘產(chǎn)品4.完善用戶數(shù)據(jù)庫主要有一下方法:引導反饋調(diào)查行為活動溝通營銷量化數(shù)據(jù)的四種類型在所有營銷活動中需要涉及的數(shù)據(jù)類型,我們依據(jù)來源,將其分為四大類:基礎數(shù)據(jù)、統(tǒng)計數(shù)據(jù)、深度數(shù)據(jù)和經(jīng)驗數(shù)據(jù)。基礎數(shù)據(jù):通常是根據(jù)特定目的,將分散的數(shù)據(jù)匯總形成的結果。統(tǒng)計數(shù)據(jù):就是我們說的機會成本的計算和本息合計損失的計算。經(jīng)驗數(shù)據(jù):就是我們看到的業(yè)務預估的30%的行業(yè)銷售毛利,甚至業(yè)務員用經(jīng)驗確認該產(chǎn)品如果半價銷售,一個月內(nèi)可以銷售完畢,這也是業(yè)務員的經(jīng)驗積累。第九章大數(shù)據(jù)改變營銷模式大數(shù)據(jù)是如何改變傳統(tǒng)營銷的隨著互聯(lián)網(wǎng)從搜索引擎時代向大數(shù)據(jù)時代跨進,傳統(tǒng)的網(wǎng)絡營銷方式已經(jīng)不再適合時代的發(fā)展。改變營銷的方法主要有:提高個性化2.數(shù)據(jù)驅動的營銷3.預測分析4.虛擬活動能力5.不只是針對大型企業(yè)可以說,在大數(shù)據(jù)的沖擊下,傳統(tǒng)的營銷觀念逐漸在改變。改變思維:從因果到關聯(lián)。改變戰(zhàn)線:從線上到線下。改變核心資產(chǎn):從品牌到數(shù)據(jù)。改變競爭壁壘:從低到高。改變調(diào)研:從定量到定性。改變統(tǒng)計:從樣本到總量。改變客戶:從群體到個體大數(shù)據(jù)下的自動化營銷就營銷而言,自動化系統(tǒng)主要涉及大規(guī)模廣告投放和銷售線索評分,即基于種種預定因素對潛在客戶線索進行評分,比如線索源。這些活動很適合數(shù)據(jù)挖掘和自動化,因為他們的過程都定義明確,而具體決策有待制定并且結果可以完全自動化。大數(shù)據(jù)可以全程輔助營銷第一步:在云端擁有這些數(shù)據(jù)。第二步:通過在谷歌、推特等在線平臺投放廣告,來開展一些列的營銷活動。第三步:使用開放源碼統(tǒng)計包括營銷團隊通過分析數(shù)據(jù),確定推動大部分收益的關鍵因素。營銷面對行的機遇和挑戰(zhàn)銷售人員擁有網(wǎng)站訪客的分析數(shù)據(jù),故障通知單系統(tǒng)的顧客數(shù)據(jù)以及實際產(chǎn)品的實用數(shù)據(jù),這些數(shù)據(jù)可以幫助他們理解營銷投入如何轉為顧客行為,并由此建立良性循環(huán)?,F(xiàn)在營銷人員面對的機遇和挑戰(zhàn)在于,將從所有活動中獲得的數(shù)據(jù)匯集起來,使之產(chǎn)生價值。第十章大數(shù)據(jù)精準的營銷推廣大數(shù)據(jù)讓廣告智能化來自社交網(wǎng)絡的大數(shù)據(jù)系統(tǒng)正在徹底改變?nèi)驈V告業(yè),進而改變制造、零售、科技等各個行業(yè)。在信息保障的時代,95%以上的信息都會被遺忘和過濾掉,只有很少的零散信息被人們脊柱。而在智能廣告時代,社交媒體不僅是讓人們記住來自圈子的推薦信息、新聞話題和情感故事,更重要的是催生人們潛在的銷售需求,從而讓人們的消費曲線變得可知。大數(shù)據(jù)下的品牌代言隨著互聯(lián)網(wǎng)尤其是移動互聯(lián)網(wǎng)的發(fā)展,消費者獲取信息的方式呈現(xiàn)碎片化、主動化的特征。而要獲得消費者的有效關注,就需要借助大數(shù)據(jù)。用戶體驗,即用戶在使用產(chǎn)品或者系統(tǒng)之前、實用期間和實用之后的全部反手,包括情感、信陽、喜好、認知印象、生理和心理反應、行為和成就等各個方面。一個成功的用戶體驗決定一個產(chǎn)品的成功營銷。大數(shù)據(jù)時代的到來為提升用戶體驗帶來更大的和能行。首先,以云計算為基礎的大數(shù)據(jù),能夠最大限度地獲取整體數(shù)據(jù),不會出現(xiàn)1萬名消費者買了,商家手里卻只有其中100個人的相關數(shù)據(jù)。這樣可以完全消除抽樣調(diào)查帶來的誤差。這些可信的整體數(shù)據(jù)降為判斷客戶的需求與喜好提供參考,進而有助于用戶體驗。大數(shù)據(jù)時代,用戶需求逐漸細分,市場越來越關注用戶的個性化。第十一章無處不在的大數(shù)據(jù)運用人們越來越意識到,大數(shù)據(jù)不僅有巨大的商業(yè)價值,對人體的健康而言,更有著不可估量的用途。數(shù)據(jù)規(guī)模大并不一定能成為大數(shù)據(jù)。真正體現(xiàn)大數(shù)據(jù)能量的是不僅要具備收集數(shù)據(jù)的能力,還要具備低成本分析數(shù)據(jù)的能力。電子健康檔案、DNA測試和新的成像技術在不斷產(chǎn)生大量數(shù)據(jù)。收集和存儲這些數(shù)據(jù)對于醫(yī)療工作者而言是一項挑戰(zhàn),也是一個機遇。不同于以往才用的封閉式的醫(yī)院IT系統(tǒng),更新、更開放的系統(tǒng)與數(shù)字化的病人信息相結合可以帶來醫(yī)療突破。越有效的標簽就越能讓人快速地調(diào)取數(shù)據(jù)。標簽的用途多樣,比如做知識分類的、識別來源的、情景和任務描述的一級標明時序的等。要注意知識范疇的培養(yǎng)。場景的標簽分為公司與任務,再加上時間。第十二章互聯(lián)網(wǎng)信息安全《網(wǎng)絡與信息安全Ⅰ》復習資料1、網(wǎng)絡信息系統(tǒng)脆弱性的主要原因:(1)網(wǎng)絡的開放性:業(yè)務基于公開的協(xié)議;所有信息和資源通過網(wǎng)絡共享;基于主機上的社團彼此信任的基礎是建立在網(wǎng)絡連接上的。組成網(wǎng)絡的通信系統(tǒng)和信息系統(tǒng)的自身缺陷。黑客(hacker)及病毒等惡意程序的攻擊。2、從協(xié)議層次看,常見主要威脅:(1)物理層:竊取、插入、刪除等,但需要一定的設備。(2)數(shù)據(jù)鏈路層:很容易實現(xiàn)數(shù)據(jù)監(jiān)聽。(3)網(wǎng)絡層:IP欺騙等針對網(wǎng)絡層協(xié)議的漏洞的攻擊。(4)傳輸層:TCP連接欺騙等針對傳輸層協(xié)議的漏洞的攻擊。(5)應用層:存在認證、訪問控制、完整性、保密性等所有安全問題。3、遠程服務一般具備兩個特征:遠程信息監(jiān)測和遠程軟件加載。4、攻擊的種類:(1)被動攻擊:搭線監(jiān)聽、無線截獲、其他截獲;(2)主動攻擊:假冒、重放、篡改消息、拒絕服務;(3)物理臨近攻擊;(4)內(nèi)部人員攻擊;(5)軟硬件配裝攻擊。5、網(wǎng)絡信息系統(tǒng)安全的基本需求:一般可從以下5個方面定義其基本需求:保密性(Confidentiality)完整性(Integrity)可用性(Availability)可控性(Controllability)不可否認性(抗否性non-repudiation)6、網(wǎng)絡信息系統(tǒng)安全的內(nèi)容:(1)網(wǎng)絡信息系統(tǒng)安全的內(nèi)容包括了系統(tǒng)安全和信息安全。系統(tǒng)安全主要指網(wǎng)絡設備的硬件、操作系統(tǒng)和應用軟件的安全。信息安全主要指各種信息的存儲、傳輸?shù)陌踩#?)安全通常依賴于兩種技術:一是存取控制和授權,如訪問控制表技術、口令驗證技術等。二是利用密碼技術實現(xiàn)對信息的加密、身份鑒別等。7、什么是安全服務?主要內(nèi)容是什么?包括哪些安全服務? (1)通常將加強網(wǎng)絡信息系統(tǒng)安全性及對抗安全攻擊而采取的一系列措施稱為安全服務。(2)安全服務的主要內(nèi)容包括安全機制、安全連接、安全協(xié)議和安全策略等,能在一定程度上彌補和完善現(xiàn)有OS和網(wǎng)絡信息系統(tǒng)的安全漏洞。(3)ISO7498-2中的定義了五大類可選的安全服務:鑒別(Authentication);訪問控制(AccessControl);數(shù)據(jù)保密(DataConfidentiality);數(shù)據(jù)完整性(DataIntegrity);不可否認(Non-Repudiation)。8、應用層提供安全服務的優(yōu)缺點:應用層的安全措施只能在通信兩端的主機系統(tǒng)上實施。優(yōu)點:安全策略和措施通常是基于用戶制定的;對用戶想要保護的數(shù)據(jù)具有完整的訪問權,因而能很方便地提供一些服務;不必依賴操作系統(tǒng)來提供這些服務;對數(shù)據(jù)的實際含義有著充分的理解。缺點:效率低;對現(xiàn)有系統(tǒng)的兼容性差;改動的程序太多,出現(xiàn)錯誤的概率大增,為系統(tǒng)帶來更多的安全漏洞。9、傳輸層提供安全服務的優(yōu)缺點:傳輸層上的安全只能在通信兩端的主機系統(tǒng)上實施。優(yōu)點:與應用層安全相比,在傳輸層提供安全服務的好處是能為其上的各種應用提供安全服務,提供了更加細化的基于進程對進程的安全服務,這樣現(xiàn)有的和未來的應用可以很方便地得到安全服務,而且在傳輸層的安全服務內(nèi)容有變化時,只要接口不變,應用程序就不必改動。缺點:由于傳輸層很難獲取關于每個用戶的背景數(shù)據(jù),實施時通常假定只有一個用戶使用系統(tǒng),所以很難滿足針對每個用戶的安全需求。10、網(wǎng)絡層提供安全服務的優(yōu)缺點:網(wǎng)絡層安全在端系統(tǒng)和路由器上都可以實現(xiàn)。優(yōu)點:主要優(yōu)點是透明性,能提供主機對主機的安全服務,不要求傳輸層和應用層做改動,也不必為每個應用設計自己的安全機制;其次是網(wǎng)絡層支持以子網(wǎng)為基礎的安全,子網(wǎng)可采用物理分段或邏輯分段,因而可很容易實現(xiàn)VPN和內(nèi)聯(lián)網(wǎng),防止對網(wǎng)絡資源的非法訪問;第三個方面是由于多種傳送協(xié)議和應用程序可共享由網(wǎng)絡層提供的密鑰管理架構,密鑰協(xié)商的開銷大大降低。缺點:無法實現(xiàn)針對用戶和用戶數(shù)據(jù)語義上的安全控制。11、數(shù)據(jù)鏈路層提供安全服務的優(yōu)缺點:優(yōu)點:整個分組(包括分組頭信息)都被加密,保密性強。缺點:使用范圍有限。只有在專用鏈路上才能很好地工作,中間不能有轉接點12、加密是提供數(shù)據(jù)保密的最常用方法。13、按密鑰類型劃分,加密算法可分為對稱密鑰加密算法和非對稱密鑰兩種;14、按密碼體制分,可分為序列密碼和分組密碼算法兩種。15、鏈到鏈加密方式的優(yōu)缺點:在物理層或數(shù)據(jù)鏈路層實施加密機制。注:EK為加密設備,DK為解密設備,K1,K2,K3代表不能的密鑰。(1)優(yōu)點:主機維護加密設施,易于實現(xiàn),對用戶透明;能提供流量保密性;密鑰管理簡單;可提供主機鑒別;加/解密是在線。(2)缺點:數(shù)據(jù)僅在傳輸線路上是加密;開銷大;每段鏈路需要使用不同的密鑰。16、端到端加密方式的優(yōu)缺點:優(yōu)點:在發(fā)送端和中間節(jié)點上數(shù)據(jù)都是加密的,安全性好;能提供用戶鑒別;提供了更靈活的保護手段。缺點:不能提供流量保密性;密鑰管理系統(tǒng)復雜;只有在需要時才進行加密,加密是離線的。17、什么是密碼學?包括哪幾個部分?(1)密碼學是研究密碼系統(tǒng)或通信安全的一門學科,分為密碼編碼學和密碼分析學。(2)密碼編碼學是使得消息保密的學科。(3)密碼分析學是要研究加密消息破譯的學科。18、密碼體制的分類:(1)按操作方式進行分類:替換密碼、換位密碼。操作方式:是明文變換成密文的方法。替換密碼:又稱代替密碼是明文中的每一個字符被替換成密文中的另一個字符。接收者對密文做反向替換就可以恢復出明文。換位密碼:又稱置換密碼,加密過程中明文的字母保持相同,但順序被打亂了。(2)按照對明文的處理方法進行分類:流密碼(將明文按字符逐位加密)。分組密碼(對明文進行分組后逐組加密)。(3)按照使用密鑰的數(shù)量進行分類:對稱密鑰(單密鑰)、公開密鑰(雙密鑰)。(4)從密鑰使用數(shù)量上看,密碼系統(tǒng)分為:單密鑰系統(tǒng)和雙密鑰系統(tǒng)。單密鑰系統(tǒng)又稱為對稱密碼系統(tǒng)或秘密密鑰系統(tǒng),其加密密鑰和解密密鑰或者相同或者實質上等同,即從一個密鑰得出另一個。19、密碼學的組成部分:X,明文(plain-text):作為加密輸入的原始信息。Y,密文(cipher-text):對明文變換的結果。E,加密(encrypt):對需要保密的消息進行編碼的過程,是一組含有參數(shù)的變換。D,解密(decrypt):將密文恢復出明文的過程,是加密的逆變換。Z(K),密鑰(key):是參與加密解密變換的參數(shù)。加密算法:對明文進行加密時采取的一組規(guī)則或變化解密算法:對密文進行解密時采用的一組規(guī)則或變化加密算法和解密算法通常在一對密鑰控制下進行,分別稱為加密密鑰和解密密鑰。一個密碼系統(tǒng)(或稱密碼體制或密碼)由加解密算法以及所有可能的明文、密文和密鑰(分別稱為明文空間、密文空間和密鑰空間)組成。20、密碼分析的方法:密碼分析:從密文推導出明文或密鑰。密碼分析常用的方法有以下4類:惟密文攻擊(cybertextonlyattack);已知明文攻擊(knownplaintextattack);選擇明文攻擊(chosenplaintextattack);選擇密文攻擊(chosenciphertextattack)。21、一個好的密碼系統(tǒng)應滿足的要求:系統(tǒng)理論上安全,或計算上安全(從截獲的密文或已知的明文-密文對,要確定密鑰或任意明文在計算上不可行);系統(tǒng)的保密性是依賴于密鑰的,而不是依賴于對加密體制或算法的保密;加密和解密算法適用于密鑰空間中的所有元素;系統(tǒng)既易于實現(xiàn)又便于使用。22、加密的功能:保密性:基本功能,使非授權者無法知道消息的內(nèi)容。鑒別:消息的接收者應該能夠確認消息的來源。完整性:消息的接收者應該能夠驗證消息在傳輸過程中沒有被改變。不可否認性:發(fā)送方不能否認已發(fā)送的消息。23、衡量一個保密系統(tǒng)的安全性有兩種基本方法:一種是計算安全性,又稱實際保密性,另一種是無條件安全性,又稱完善保密性。24、計算安全性和無條件安全性:(1)計算安全性(computationalsecurity):如果利用最好的算法(已知的或未知的)破譯一個密碼系統(tǒng)需要至少N(某一確定的、很大的數(shù))次運算,就稱該系統(tǒng)為計算上安全的系統(tǒng)。(2)無條件安全性(unconditionallysecure):不論提供的密文有多少,密文中所包含的信息都不足以惟一地確定其對應的明文;具有無限計算資源(諸如時間、空間、資金和設備等)的密碼分析者也無法破譯某個密碼系統(tǒng)。25、P和NP問題:(1)易處理的(tractable):確定性圖靈機上能夠在多項式時間內(nèi)得到處理的問題。稱易處理問題的全體為“多項式時間可解類”,記為P。(2)非確定性圖靈機上能夠在多項式時間內(nèi)得到處理的問題被稱為“非確定性多項式時間可解問題”,簡稱NP問題。NP問題的全體被稱為“非確定性多項式時間可解類”,記為NP。(3)NP完全問題:指NP中的任何一個問題都可以通過多項式時間轉化為該問題(SAT?)。NP完全問題的全體被記為NPC。26、流密碼的分類及其工作模式:(1)按照對明文的處理方法進行分類:流密碼(序列密碼)、分組密碼。流密碼是一種針對比特流的重要加密方法,這種密碼使用非常簡單的規(guī)則,每次只對二進制串的一個比特進行編碼。流密碼的原則是創(chuàng)建密鑰流的隨機比特串,并且將明文比特和密鑰流比特組合在一起,生成的比特串就是密文。在分組密碼中,明文消息是按一定長度分組(長度較大的),每組都使用完全相同的密鑰進加密,產(chǎn)生相應的密文,相同的明文分組不管處在明文序列的什么位置,總是對應相同的密文分組。(2)相對分組密碼而言,流密碼主要有以下優(yōu)點:在硬件實施上,流密碼的速度一般要比分組密碼快,而且不需要有很復雜的硬件電路;在某些情況下(例如對某些電信上的應用),當緩沖不足或必須對收到的字符進行逐一處理時,流密碼就顯得更加必要和恰當;流密碼能較好地隱藏明文的統(tǒng)計特征等。(3)流密碼的原理:(4)分組密碼的原理:(5)分組密碼的優(yōu)缺點:優(yōu)點:易于標準化;易于實現(xiàn)同步。缺點:不善于隱藏明文的數(shù)據(jù)模式、對于重放、插入、刪除等攻擊方式的抵御能力不強。(6)分組密碼的設計原則:安全性角度:“混亂原則”:為了避免密碼分析者利用明文與密文之間的依賴關系進行破譯,密碼的設計應該保證這種依賴關系足夠復雜?!皵U散原則”:為避免密碼分析者對密鑰逐段破譯,密碼的設計應該保證密鑰的每位數(shù)字能夠影響密文中的多位數(shù)字;同時,為了避免避免密碼分析者利用明文的統(tǒng)計特性,密碼的設計應該保證明文的每位數(shù)字能夠影響密文中的多位數(shù)字,從而隱藏明文的統(tǒng)計特性。可實現(xiàn)性角度:應該具有標準的組件結構(子模塊),以適應超大規(guī)模集成電路的實現(xiàn)。分組密碼的運算能在子模塊上通過簡單的運算進行。27、Feistel密碼結構:加密:Li=Ri-1Ri=Li-1?F(Ri-1,Ki)解密:Ri-1=LiLi-1=Ri?F(Ri-1,Ki)=Ri?F(Li,Ki)28、DES算法的特點:(1)DES算法是分組加密算法:以64位為分組。(2)DES算法是對稱算法:加密和解密用同一密鑰。(3)DES算法的有效密鑰長度為56位。(4)換位和置換。(5)易于實現(xiàn)。29、DES算法要點:算法設計中采用的基本變換和操作:置換(P):重新排列輸入的比特位置。交換(SW):將輸入的左右兩部分的比特進行互換。循環(huán)移位:將輸入中的比特進行循環(huán)移位,作為輸出。一個復雜變換(fK)通常是一個多階段的乘積變換;與密鑰Key相關;必須是非線性變換;實現(xiàn)對密碼分析的擾亂;是密碼設計安全性的關鍵。30、DES的加密過程:31、分組密碼的工作模式:已經(jīng)提出的分組密碼工作模式有:密碼分組鏈接(CBC)模式;密碼反饋(CFB)模式;輸出反饋(OFB)模式;級連(CM)模式(又稱多重加密模式);計數(shù)器模式;擴散密碼分組鏈連(PCBC)模式。32、密碼分組鏈接(CBC)模式基本原理、優(yōu)點、缺點:優(yōu)點:能夠隱蔽明文的數(shù)據(jù)模式;能夠在一定程度上防止分組的重放、插入和刪除等攻擊。缺點:易導致錯誤傳播。由于任何一個明文或密文分組出錯都會導致其后的密文分組出錯。33、密碼反饋(CFB)模式基本原理:34、輸出反饋(OFB)模式基本原理、優(yōu)點、缺點:優(yōu)點:能夠克服錯誤傳播。缺點:很難發(fā)現(xiàn)密文被篡改;不具備自同步能力。35、公鑰密碼的基本特征:(1)加密和解密使用兩個不同的密鑰公鑰PK:公開,用于加密;私鑰SK:保密,用作解密密鑰。(2)一個密鑰加密的數(shù)據(jù)只能用另一個密鑰解密36、RSA的缺點:產(chǎn)生密鑰很麻煩,受到素數(shù)產(chǎn)生技術的限制,因而難以做到一次一密。分解長度太大,為保證安全性,n至少也要600比特以上,使運算代價很高,尤其是速度較慢,較對稱密碼算法慢幾個數(shù)量級;且隨著大數(shù)分解技術的發(fā)展,這個長度還在增加,不利于數(shù)據(jù)格式的標準化。37、RSA算法實現(xiàn)步驟:38、三種可能攻擊RSA算法的方法:①強行攻擊:這包含對所有的私有密鑰都進行嘗試;②數(shù)學攻擊:因子分解;③計時攻擊:這依賴于解密算法的運行時間。39、密鑰安全的幾個關鍵步驟:(1)密鑰生成:密鑰算法,公式,實現(xiàn);(2)密鑰分配:分配方式,途徑,擁有者;(3)密鑰驗證:密鑰附著一些檢錯和糾錯位來傳輸,當密鑰在傳輸中發(fā)生錯誤,能很容易地被檢查出來;(4)更新密鑰:如需頻繁改變密鑰,可從舊密鑰中產(chǎn)生新密鑰,或利用單向函數(shù)更新密鑰;(5)密鑰保護:保密,權限,授權,存儲,加密,攜帶;(6)備份密鑰:密鑰托管、秘密分割、秘密共享;(7)密鑰有效期;(8)密鑰銷毀:更換,銷毀;(9)公開密鑰的密鑰管理。40、什么是密鑰管理?(1)在一種安全策略指導下密鑰的產(chǎn)生、存儲、分配、刪除、歸檔及應用;(2)處理密鑰自產(chǎn)生到最終銷毀的整個過程中的有關問題,包括系統(tǒng)的初始化、密鑰的產(chǎn)生、存儲、備份/恢復、裝入、分配、保護、更新、泄露、撤銷和銷毀等內(nèi)容。41、密鑰管理的目的?維持系統(tǒng)中各實體之間的密鑰關系,以抗擊各種可能的威脅:密鑰的泄露秘密密鑰或公開密鑰的身份的真實性喪失經(jīng)未授權使用42、典型的兩類自動密鑰分配途徑:(1)集中式分配方案:利用網(wǎng)絡中的密鑰分配中心(keydistributioncenter,KDC)來集中管理系統(tǒng)中的密鑰,密鑰分配中心接收系統(tǒng)中用戶的請求,為用戶提供安全地分配密鑰的服務。(2)分布式分配方案:網(wǎng)絡中各主機具有相同的地位,它們之間的密鑰分配取決于它們自己的協(xié)商,不受任何其他方面的限制。43、公鑰的分配方法:公開發(fā)布公用目錄表公鑰管理機構公鑰證書44、公鑰證書的內(nèi)容:用戶通過公鑰證書相互交換自己的公鑰而無需和公鑰管理機構聯(lián)系。公鑰證書由證書管理機構CA(CertificateAuthority)為用戶建立,其中的數(shù)據(jù)項包括與該用戶的秘密鑰相匹配的公開鑰及用戶的身份和時間戳等,所有的數(shù)據(jù)項經(jīng)CA用自己的秘密鑰簽字后就形成證書。證書的形式為,其中是用戶A的身份標識,是A的公鑰,是當前時間戳,是CA的秘密鑰。45、會話密鑰:會話密鑰更換得越頻繁,系統(tǒng)的安全性越高。但是會話密鑰更換得太頻繁,將使通信交互時延增大,同時還造成網(wǎng)絡負擔。所以在決定會話密鑰有效期時,要綜合考慮這兩個方面。為避免頻繁進行新密鑰的分發(fā),一種解決的辦法是從舊密鑰中產(chǎn)生新的密鑰,稱為密鑰更新。密鑰更新采用單向函數(shù),通信雙方共享同一個密鑰,并用同一個單向函數(shù)進行操作,雙方得到相同的結果,可以從結果中得到他們所需要的數(shù)據(jù)來產(chǎn)生新的密鑰。46、鑒別函數(shù)的分類:根據(jù)鑒別符的生成方式,鑒別函數(shù)可以分為以下幾類:基于報文加密方式的鑒別:以整個報文的密文作為鑒別符。報文鑒別碼(MAC)方式。散列函數(shù)方式:采用一個公共散列函數(shù),將任意長度的報文映射為一個定長的散列值,并以散列值作為鑒別符。47、散列函數(shù)(HashFunction)有:哈希函數(shù)、摘要函數(shù)。48、散列函數(shù)的特性:散列函數(shù)H()的輸入可以是任意大小的數(shù)據(jù)塊。散列函數(shù)H()的輸出是定長。計算需要相對簡單,易于用軟件或硬件實現(xiàn)。單向性:對任意散列碼值h,要尋找一個M,使H(M)=h在計算上是不可行的。弱抗沖突性(weakcollisionresistance):對任何給定的報文M,若要尋找不等于M的報文M1使H(M1)=H(M)在計算上是不可行的。該性質能夠防止偽造。強抗沖突性(strongecollisionresistance):要找到兩個報文M和N使H(M)=H(N)在計算上是不可行的。該性質指出了散列算法對“生日攻擊”的抵抗能力。49、MD5消息摘要算法:MD表示消息摘要(MessageDigest)單向散列函數(shù)輸入:給定一任意長度的消息輸出:長為m的散列值。壓縮函數(shù)的輸入:消息分組和前一分組的輸出(對第一個函數(shù)需初始化向量IV);輸出:到該點的所有分組的散列,即分組Mi的散列為hi=f(Mi,hi?1)循環(huán):該散列值和下一輪的消息分組一起作為壓縮函數(shù)下一輪的輸入,最后一分組的散列就是整個消息的散列。50、MD5算法五個步驟:1)附加填充位;2)附加長度;3)初始化MD緩沖區(qū);4)按512位的分組處理;5)輸出。51、安全散列函數(shù)-MD5:填充:填充后使報文長度加上64比特是512比特的整數(shù)倍,即填充后的報文長度K對512取模等于448(Kmod512=448)。填充的比特模式為第一位為1其余各位為0,即100…0。附加長度值:將原報文長度的64比特表示附加在填充后的報文最后。報文長度是填充前原始報文的長度。若報文長度大于264,則使用該長度的低64位。報文被劃分成L個成512比特的分組Y0,Y1,…,YL-1。擴展后報文長度等于512·L位。初始化消息摘要(MD)緩存器。MD5使用128比特的緩存來存放算法的中間結果和最終的散列值。這個緩存由4個32比特的寄存器A,B,C,D構成。MD5寄存器的初始值為:A=0x67452301B=0xefcdab89C=0x98badcfeD=0x10325476寄存器0123A01234567B89abcdefCfedcba98D76543210處理每一個512比特的報文分組。處理算法的核心MD5的壓縮函數(shù)HMD5。HMD5壓縮函數(shù)由4個結構相似循環(huán)組成。每次循環(huán)由一個不同的原始邏輯函數(shù)(分別以F,G,H和I表示)處理一個512比特的分組Yq。每個循環(huán)都以當前的正在處理的512比特分組Yq和128比特緩沖值ABCD為輸入,然后更新緩沖內(nèi)容。在循環(huán)時還需要使用一個64位元素的常數(shù)表T。輸出:最后第L個階段產(chǎn)生的輸出就是128比特的報文摘要,結果保存在緩沖器ABCD中。第L個分組的輸出即是128位的消息摘要。52、SHA-1算法允許的最大輸入報文的長度不超過264比特。53、SHA-1算法的處理步驟1)填充消息:將消息填充為512位的整數(shù)倍,填充方法和MD5完全相同。2)初始化緩沖區(qū):SHA要用到兩個緩沖區(qū),均有五個32位的寄存器。 第一個緩沖區(qū):A、B、C、D、E; 第二個緩沖區(qū):H0、H1、H2、H3、H4。運算過程中還用到一個標記為W0、W1、…、W79的80個32位字序列和一個單字的緩沖區(qū)TEMP。在運算之前,初始化{Hj}:3)按512位的分組處理輸入消息SHA運算主循環(huán)包括四輪,每輪20次操作。邏輯函數(shù)序列f0、f1、…、f79,每個邏輯函數(shù)的輸入為三個32位字,輸出為一個32位字: ft(B,C,D)=(B^C)ˇ(~B^D)(0≤t≤19) ft(B,C,D)=B+C+D(20≤t≤39) ft(B,C,D)=(B^C)ˇ(B^D)ˇ(C^D)(40≤t≤59) ft(B,C,D)=B+C+D(60≤t≤79)4)輸出:在處理完Mn后,160位的消息摘要為H0、H1、H2、H3、H4級聯(lián)的結果。54、SHA–1與MD5的比較:(SHA–1是在MD4的基礎上開發(fā)的。)

SHA-1MD5Hash值長度160bit128bit分組處理長512bit512bit步數(shù)80(4×20)64(4×16)最大消息長≤264bit不限非線性函數(shù)3(第2、4輪相同)4常數(shù)個數(shù)46455、對MD5的攻擊:直接攻擊窮舉可能的明文去產(chǎn)生一個和

H(m)

相同的散列結果,如果攻擊者有一臺每秒嘗試1,000,000,000條明文的機器需要算約10^22年,同時興許會同時發(fā)現(xiàn)m本身。生日攻擊只是用概率來指導散列沖突的發(fā)現(xiàn),對于MD5來說如果嘗試2^64條明文,那么它們之間至少有一對發(fā)生沖突的概率就是

50%。一臺上面談到的機器平均需要運行585年才能找到一對,而且并不能馬上變成實際的攻擊成果。其他攻擊

微分攻擊被證明對MD5的一次循環(huán)是有效的,但對全部4次循環(huán)無效。 (微分攻擊是通過比較分析有特定區(qū)別的明文在通過加密后的變化傳播情況來攻擊加密體系的)

還有一種成功的MD5攻擊,不過它是對MD5代碼本身做了手腳,是一種crack而不是hack更算不上cryptanalysis了。56、三種算法的安全性:強行攻擊: MD5:2128。SHA-1:2160。RIPEMD-160:2160。密碼分析:MD5:最弱。SHA-1:比MD5更能抗密碼分析。RIPEMD-160:比MD5更能抵抗對強抗沖突性的生日攻擊。57、數(shù)字簽名的滿足條件:數(shù)字簽名必須是與消息相關的二進制位串;簽名必須使用發(fā)送方某些獨有的信息,以防偽造和否認;產(chǎn)生數(shù)字簽名比較容易;識別和驗證數(shù)字簽名比較容易;偽造數(shù)字簽名在計算上是不可行的;保存數(shù)字簽名的拷貝是可行的。58、特殊數(shù)字簽名:代理簽名:指簽名人將其簽名權委托給代理人,由代理人代表他簽名的一種簽名。多重簽名:由多人分別對同一文件進行簽名的特殊數(shù)字簽名。群簽名:由個體代表群體執(zhí)行簽名,驗證者從簽名不能判定簽名者的真實身份,但能通過群管理員查出真實簽名者。環(huán)簽名:一種

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論