人工智能、大數(shù)據(jù)與深度學習之間的關系和差異_第1頁
人工智能、大數(shù)據(jù)與深度學習之間的關系和差異_第2頁
人工智能、大數(shù)據(jù)與深度學習之間的關系和差異_第3頁
人工智能、大數(shù)據(jù)與深度學習之間的關系和差異_第4頁
人工智能、大數(shù)據(jù)與深度學習之間的關系和差異_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、據(jù)與深度學習之間的關系和差異網(wǎng)絡上從不缺乏對數(shù)據(jù)科學術語進行比較和對比的文章。文筆各 異的人寫出了各式各樣的文章,以此將他們的觀點傳達給任何愿意傾 聽的人。這幾乎是勢不可擋的。所以我也記錄一下,對于那些疑惑此文是否也是雷同的帖子。對, 為什么再來一帖?我是這樣想的,盡管可能有很多分散觀點在定義 和比較這些關聯(lián)術語,但事實上是,這些術語中的大部分是流動變化 的,并不完全約定俗成,坦率地說,與他人觀點一同暴露是測試和優(yōu) 化自己的觀點的最好方法之一。所以,雖然大家可能不會完全(甚至是極低限度地)同意我對這些術 語的大部分看法,但仍然能從中獲得一些東西。數(shù)據(jù)科學中的一些核 心概念需要被解釋,或者至少在

2、我看來是重要的,我會盡力闡述他們 如何關聯(lián),以及答疑這些個體概念組合在一起時遇到的困惑。在獨立地思考概念之前,有個不同觀點的例子, KDnuggets 的 Gregory Piatetsky-Shapiro 的維恩圖,概述了我們將要討論的數(shù)據(jù)科 學術語之間的關系。建議讀者將此維恩圖與目前 Drew Conway 的著 名的數(shù)據(jù)科學維恩圖,以及我下面的討論和帖子底部的修改過程 /關系 圖進行比較。我認為,盡管存在差異,但這些概念具有一定的相似性。現(xiàn)在我們將對上述維恩圖中圈選的 6 個核心概念進行分析,并提 供一些關于如何將它們融入數(shù)據(jù)科學的洞察。我們很快就會摒棄過去 術語。大數(shù)據(jù)(Big Dat

3、a)有各種各樣的文章在定義大數(shù)據(jù),我不打算花太多時間在這個概 念上。簡單地來說,大數(shù)據(jù)通常被定義為“超出常用軟件工具捕獲, 糊 又準確,足以捕捉其主要特征。至于其他的概念,我們將通過調查,很好的獲得搜索字詞的流行 度和 N-gram 頻率模型的一些初步了解,以便將這個難點與熱點炒作 至 2008 年, N-gram 頻 率模型作為一個“舊”的概念被闡述。 以及最后一個逐漸下降但有明顯的下降。請注意,由于已經(jīng)對數(shù)據(jù)進行了定量分析,大數(shù)據(jù)未包含在上述圖形中。繼續(xù)閱讀,以便進 機器學習(Machine learning)據(jù) Tom Mitchell 在關于這個主題的創(chuàng)作書中闡述,機器學習“關 心的問

4、題是如何構建計算機程序使用經(jīng)驗自動改進”。機器學習本質 上是跨學科的,采用計算機科學,統(tǒng)計學和人工智能等方面的技術。 機器學習研究的主要工作是促進經(jīng)驗自動改進的算法,可以應用于各 我不認為有人會懷疑機器學習是數(shù)據(jù)科學的核心組成。我在下面 給出數(shù)據(jù)科學的詳細描述,如果你認為在一個非常高的水平上其目標 是從數(shù)據(jù)中獲取洞察力,其實機器學習是允許此過程自動化的。機器 學習與古典統(tǒng)計學有很多共同點,因為它使用樣本來推斷和概括。數(shù) 據(jù)統(tǒng)計更多地側重于描述性(盡管可以通過外推來預測) ,機器學習對描 述性分析的關注很少,并且僅將其用作中間步驟以便能夠進行更好預 測。機器學習通常被認為是模式識別的同義詞 ;真

5、的不會從我這里發(fā)生 太多的分歧,我相信,模式識別這個術語意味著實際上是一個比 機器學習更不復雜和更簡單化的過程,這就是為什么我傾向于回避它。機器學習與數(shù)據(jù)挖掘有著復雜的關系。數(shù)據(jù)挖掘(Data Mining) 中提取模式的特定算法的應用”。這表明,在數(shù)據(jù)挖掘中,重點在于 算法的應用,而不是算法本身。我們可以定義機器學習和數(shù)據(jù)挖掘之 間的關系如下:數(shù)據(jù)挖掘是一個過程,在此過程中機器學習算法被用 作提取數(shù)據(jù)集中的潛在有價值模式的工具。語,也是數(shù)據(jù)科學的關鍵。 在數(shù)據(jù)科學術語爆發(fā)泛濫之前,事實上,數(shù)據(jù)挖掘在 Google 搜索 術語中取得了更大的成功。看看 Google 趨勢比上圖顯示的還要早 5

6、年,數(shù)據(jù)挖掘曾經(jīng)更受歡迎。然而,今天,數(shù)據(jù)挖掘似乎被劃分 為機器學習和數(shù)據(jù)科學之間的概念。若有人同意上述解釋,數(shù)據(jù)挖掘 是一個過程,那么將數(shù)據(jù)科學視為數(shù)據(jù)挖掘的超集,那么后續(xù)的術語深度學習(Deep Learning)盡管在早期的在線搜索急劇爆發(fā)之前它已經(jīng)存在,深度學習 仍是一個相對較新的術語。由于學術研究和工業(yè)的蓬勃發(fā)展,其在不 同領域取得了巨大成就,深度學習是應用深層神經(jīng)網(wǎng)絡技術 (即具有多 個隱藏層的神經(jīng)網(wǎng)絡架構 )來解決問題。深度學習是一個類似數(shù)據(jù)挖掘 的過程,它采用深層神經(jīng)網(wǎng)絡架構,這是特定類型的機器學習算法。深度學習已經(jīng)取得了令人印象深刻的成就。有鑒于此,至少在我 看來,務必要注意

7、幾點:深度學習不是靈丹妙藥 對于每個問題來說,并不是一個簡單一 這不是傳說中的萬能算法 深度學習不會取代所有其他機器學習 算法和數(shù)據(jù)科學技術,至少還沒有被證明是這樣。適度的期望是必要的 盡管最近在各種類型的分類問題上,特別 是計算機視覺和自然語言處理以及強化學習等領域已經(jīng)取得了巨大的 進步,但當代深度學習并沒有擴大到非常復雜的問題,例如“解決世 深度學習和人工智能不是同義詞。深度學習可以幫助數(shù)據(jù)科學以附加過程和工具的形式解決問題, 而在這種觀察中,深入學習是數(shù)據(jù)科學領域的一個非常有價值的補充。人工智能大多數(shù)人發(fā)現(xiàn)人工智能很難用一個精確的,甚至是廣泛的定義講 出來。我不是一個人工智能研究者,所以

8、我的答案可能與其他領域的 人差別很大。多年來通過對 AI 的思想哲學研究,我得出的結論是,人 工智能,至少我們通常認為的想法的概念,實際上并不存在。在我看來, AI 是一個標尺,一個移動目標,一個渴望而不可及的 目標。每當我們邁向 AI 成就之路,不知何故,這些成就似乎又變成了 我曾經(jīng)讀過如下內容:如果你在上世紀60 年代問 AI 的研究人員, 他們對 AI 的想法是什么,他們可能會一致認為,可以幫助我們預測下一步行動和欲望,所有人類知識可以隨時獲取,一個適合我們口袋的 小型設備就是真實的 AI。但是今天我們都攜帶智能手機,很少有人會 AI 適合數(shù)據(jù)科學?嗯,正如我所說,我不認為 AI 真的是

9、有形的, 我想很難說它適合任何地方。但,一些數(shù)據(jù)科學和機器學習相關領域, 人工智能可以提供助力,有時與實體一樣有價值 ;計算機視覺肯定會引 起注意,現(xiàn)代深度學習研究也是如此,得益于人工智能的精神氣質, AI 可能是研究和開發(fā)設備,從來沒有在同名行業(yè)中產(chǎn)生任何東西。 我想說,從 AI 到數(shù)據(jù)科學的這條路徑可能不是查看兩者之間的關系的 最佳方式,但是兩個實體之間的許多中間步驟已經(jīng)被 AI 以某種形式開 數(shù)據(jù)科學(Data Science)那么,在討論這些相關概念和數(shù)據(jù)科學的地位之后,數(shù)據(jù)科學究 竟是什么呢?對我來說,這是試圖精確定義的一個最難的概念。數(shù)據(jù)科 學是一個多方面的學科,包括機器學習和其他

10、分析過程,統(tǒng)計學和相 關的數(shù)學分支,越來越多地從高性能科學計算中借鑒,以便最終從數(shù) 據(jù)中發(fā)現(xiàn)洞察,并使用這些新發(fā)現(xiàn)的信息來講述故事。這些故事通常 伴隨著圖片(我們稱之為可視化) ,并針對行業(yè),研究甚至是我們自己, 目的是從數(shù)據(jù)中獲取一些新的想法。數(shù)據(jù)科學采用相關領域的各種不同工具(請參閱上面所有內容)。數(shù) 據(jù)科學既是數(shù)據(jù)挖掘的同義詞,也是數(shù)據(jù)挖掘概念的超集。數(shù)據(jù)科學產(chǎn)生各種不同的結果,但它們都具有共同的洞察力。數(shù) 據(jù)科學是這一切,而且對你而言,它可能還有別的東西,而且甚至還 沒有涵蓋獲取,清理,判別和預處理數(shù)據(jù) !順便說一下,什么是數(shù)據(jù)呢 ? 它總是大嗎?我認為我的關于數(shù)據(jù)科學困惑的觀點,至少可以通過上圖的版本 來代表它,以及這篇文章的頂部的 Piatetsky-Shapiro 的維恩圖。我也 建議大多數(shù)與 Drew Conway 的數(shù)據(jù)科學維恩圖一致,盡管我會補充 一點:我認為他非常合理且實用的圖像實際上是指數(shù)據(jù)科學家,而不是數(shù)據(jù)科學。這可能是吹毛求疵,但我不認

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論