大數(shù)據(jù)與人工智能_第1頁
大數(shù)據(jù)與人工智能_第2頁
大數(shù)據(jù)與人工智能_第3頁
大數(shù)據(jù)與人工智能_第4頁
大數(shù)據(jù)與人工智能_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

大數(shù)據(jù)與人工智能數(shù)據(jù)科學(xué)已經(jīng)在決策科學(xué)、社會科學(xué)、經(jīng)濟學(xué)里面扮演越來越重要的角色,所以這種交叉融合,這種碰撞對我們每一個人來講都是學(xué)習(xí)的時機,也是一些施展才華的空間。最近在各個場合有一些分享,今天我尤其要把這個講座做好。今天是我兒子第一次坐在下面聽我的講座。過去我們做的這些工作是跟數(shù)據(jù)有關(guān)系的。一個大數(shù)據(jù)、一個人工智能,這兩個放在一起,今天很多的企業(yè)會這么重視,在這里給大家分享一下我們自己的故事。百度在過去兩年多的時間里面,在人工智能領(lǐng)域有很多技術(shù)方面的投入。今年李彥宏在兩會上提出中國大腦,很受關(guān)注;麻省理工學(xué)院科技評論雜志去年專門發(fā)表了一篇評論性文章,介紹百度的人工智能之夢。在國外主流的科技雜志里面報道一個中國企業(yè)的科技研發(fā),還是比擬少的。我自己感到非常的振奮。百度的背景,和很多的互聯(lián)網(wǎng)公司都是一樣的,從技術(shù)的緯度來講,他本質(zhì)上是一個基于大數(shù)據(jù)的人工智能公司。我們是提供一個搜索引擎,這個搜索引擎下面有一個非常精致的結(jié)構(gòu),它可以搜索到各種信息、知識,而且效勞是完全免費的、給用戶帶來價值的。但是我們獲得了了大量的搜索行為數(shù)據(jù),并實現(xiàn)它的商業(yè)價值,就得通過廣告、推送效勞。從數(shù)據(jù)到價值,這中間就需要大量的技術(shù),尤其是基于大數(shù)據(jù)的人工智能技術(shù),包括機器學(xué)習(xí),自然語言處理,語音識別,圖像識別。最近在全社會,無論是在中國還是美國,還是科技媒體,還是研究機構(gòu),還是商業(yè)公司,都在談自動駕駛、機器人、物聯(lián)網(wǎng)、個性化、VR、AR。其實這些都是AI的各個領(lǐng)域,現(xiàn)在AI已經(jīng)成為科技創(chuàng)新的主戰(zhàn)場,它不光是未來時,而且是現(xiàn)在進行時。我們看電影《超能陸戰(zhàn)隊》,看似是未來的東西,但是今天很多領(lǐng)域正在發(fā)生,也在產(chǎn)生價值。到底什么是人工智能?嚴肅的科學(xué)定義到今天為止,沒有一個廣泛接受的定義。比方說,有一種說法叫強人工智能,有一種說法叫弱人工智能,還有基于符號邏輯的、也有基于統(tǒng)計模型的,有不同的觀點。拋開這些不同的觀點,通常一個人工智能系統(tǒng)有這樣幾個方面:第一,我們希望這個系統(tǒng)具有感知的能力,就像人一樣,有五官,可以感知周圍的環(huán)境是什么樣的。第二,獲取這個感知以后,對面臨的環(huán)境有一個理解。比方說對于一個機器人來講,他在感知到這個環(huán)境以后,如果想到后面去跟一個同學(xué)聊天,他需要尋找最正確路徑。他必須要理解,那條路是走不通的,那條是可以走的。第三,在理解的根底上做出決策,從而達成目的或完成任務(wù)一個機器要感知,然后理解,然后決策,這是一個過程。今天在市場上面無處不在充滿著智能產(chǎn)品:智能湯勺、智能水杯等等。我們把一個老式的收音機和智能設(shè)備放在一起比擬,他們有什么不同?區(qū)別一個系統(tǒng)、一個產(chǎn)品是不是真的具有智能的能力,有一個很重要的緯度,就是這個系統(tǒng)能不能隨著用戶用它的次數(shù)越來越多,它變得越來越聰明,它是不是真的隨著經(jīng)驗積累在不斷的演化。如果它是這樣的,它就是一個能夠自我學(xué)習(xí)、自我進化、自我演化的、智能的系統(tǒng)。所以,學(xué)習(xí)能力是智能的本質(zhì)屬性之一。在座有的年紀跟我相仿,在小學(xué)的時候有過一篇課文,講的是一個科學(xué)巨匠做小板凳的故事,他做的那個板凳非常的丑陋,但是我們能不能說這個小朋友不聰明?如果你看他過去幾天做的每一個小板凳,他一個比一個做的好,他具有不斷的從經(jīng)驗里面去學(xué)習(xí)的能力,使我們發(fā)現(xiàn)這個小朋友是非常具有智慧的。你看一個系統(tǒng)今天的能力不是最重要的,最重要的是它的增長曲線,隨著大數(shù)據(jù)不斷增加,不斷去使用這個系統(tǒng),它能變得越來越聰明。這里面我提到了經(jīng)驗。經(jīng)驗就是數(shù)據(jù),數(shù)據(jù)就是經(jīng)驗。我們在機器學(xué)習(xí)里面有一個詞叫經(jīng)驗數(shù)據(jù)。隨著經(jīng)驗演化,就是隨著數(shù)據(jù)的不斷增長,增長你的能力。為什么我們迎來一個大數(shù)據(jù)的時代?因為從PC互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng),帶來了一個數(shù)據(jù)的爆增,在我們?nèi)粘I罾锩?,每一個人都在奉獻著大量的數(shù)據(jù)。這樣一個場景,是在圣彼得教堂門口的廣場上面,很多人來等待教皇選舉結(jié)果。在八年以后,在同樣一個地方,可能是同樣一群人,同樣的故事仍在上演。但從一個緯度來看,移動互聯(lián)網(wǎng)在改變每個人的生活,每個人的手持設(shè)備在跟著你,它無時不刻的在產(chǎn)生數(shù)據(jù)。今天,每個人身上連著兩到三個移動設(shè)備,比方說、iPad,這樣一個趨勢往前演進,人機交互是指在這個環(huán)境里面有無數(shù)個設(shè)備跟你感知、交互?,F(xiàn)在手表也已經(jīng)是一個智能終端了??偟膩砜?,具體的趨勢是我們將進入一個萬物互聯(lián)的時代。隨之帶來的是每個你的設(shè)備都會記錄你的數(shù)據(jù),人跟設(shè)備的連接,人跟人的連接,物與物的連接,設(shè)備與設(shè)備的連接都在產(chǎn)生數(shù)據(jù)。所以,這是一個時機,萬物互聯(lián)將形成大量數(shù)據(jù)無處不在的生態(tài),給我們帶來的時機就是智能化時代的來臨。2023年,我們突然看到那么多科幻的電影,那么多人在討論這樣那樣的,包括習(xí)總書記也在院士大會上談到機器人。所以這不是偶然,這有一個時代的背景。在大數(shù)據(jù)的時代,智能變得越來越重要。有一個技術(shù),最近很多研究機構(gòu),包括公司都有很大的投入,這個技術(shù)就叫深度學(xué)習(xí)。深度學(xué)習(xí)為什么會在這個時代這么受大家的關(guān)注?谷歌、微軟、Facebook都有專門的研究團隊,F(xiàn)acebook2023年9月份第一次成立了研究院。今天很多中國的互聯(lián)網(wǎng)公司都成立了這樣的研究院。百度在這方面做了很多的工作,其中一個表現(xiàn)就是百度大腦工程,這個工程是一個有著上千臺效勞器,包括PC效勞器和GPU效勞器的大規(guī)模數(shù)據(jù)處理系統(tǒng)。去年我講的是百億級的產(chǎn)品,世界上最大級的深度神經(jīng)網(wǎng)絡(luò),最近我們把它升級到千億級的系統(tǒng)?;谶@樣一個工程的能力,我們能夠去開發(fā)各種各樣深度學(xué)習(xí)的算法,用在語音、圖象、自然語音理解、廣告的用戶匹配、用戶的建模等等。百度大腦目前最成功、最重要的四個利用的領(lǐng)域:第一,搜索。我們用深度學(xué)習(xí)作用在自然語音、文本、網(wǎng)絡(luò)的語意上面,去衡量他們語意的相關(guān)性。第二,廣告。因為廣告是要智能的匹配,因為如果這個廣告不被用戶點擊,我們掙不到錢。第三,圖象。包括今天李彥宏講到了自動駕駛,自動駕駛里面圖像技術(shù)是非常重要的。第四,語音識別和理解。最近這幾年業(yè)界取得的進展,包括百度做的工作。語音識別在三十年的時間里面是一個進展非常緩慢的領(lǐng)域。但是最近三四年時間里有一個突飛猛進的進展,原因的核心就是基于大數(shù)據(jù)的深度學(xué)習(xí)技術(shù)。這些應(yīng)用領(lǐng)域在業(yè)務(wù)結(jié)構(gòu)里面扮演什么樣的角色?它怎么把這些事情串起來為公司的核心業(yè)務(wù)產(chǎn)生影響。第一,理解意圖。比方說我們的用戶來到百度這個平臺,傳統(tǒng)上來講,他用關(guān)鍵詞表達他的搜索需求,但是我們看到最近這兩年有一個趨勢:第一,用戶需求表達越來越復(fù)雜,以前很多是搜索信息,現(xiàn)在很多是效勞的需求,這里面有很多復(fù)雜的語意來描述需求。第二,更多自然的方式表達你的需求。比方說自然的語音、句子去問問題,比方說在移動終端上面用語音表達?,F(xiàn)在有的APP就是拍個照,小朋友幫助你做題。這種自然的表達方式是第二個趨勢。你用深度學(xué)習(xí)理解自然語言、語音識別、理解圖象變成是理解用戶的意圖。第二,你在理解了意圖以后,你需要連接用戶跟他需要的信息。你在信息、文章那一端需要有更好的理解,這個理解需要有更好的匹配。匹配用戶的需求,就是優(yōu)化搜索結(jié)果的智能排序。第三,精準推送廣告和效勞。深度學(xué)習(xí)在每一個領(lǐng)域都發(fā)揮著重要的作用為什么深度學(xué)習(xí)在今天受到重視?第一點,我覺得是一個很浪漫主義的原因,因為我們總是在想我們的機器能不能復(fù)制人的智能,復(fù)制生物的智能。所以有一個觀點是,深度學(xué)習(xí)可能跟人腦的機理是有關(guān)系的。確實也是,最早期的去啟發(fā)做深度學(xué)習(xí)的研究,確實是受到人腦的啟發(fā)。第二點,特別適合大數(shù)據(jù)。其實到今天,深度學(xué)習(xí)為什么重要的第一個原因是最不重要的,因為你去研究鳥類怎么飛行,跟我要造一個飛機是不一樣的事情。但對于我們來講,尤其對我們工業(yè)界來講,我們希望能夠造出智能的機器,他不是去再現(xiàn)人的智能,而是要利用大數(shù)據(jù)去延伸或者互補人的能力。第三,端到端的學(xué)習(xí)。過去做模式識別或者機器學(xué)習(xí)通常會分為兩步,第一,根據(jù)你對問題的理解,人工的、人為的去做一些數(shù)據(jù)的預(yù)處理,這里面對人的要求是很高的,你需要非常精準的對問題進行理解。但是你一旦換一個問題,你需要重新去理解。深度學(xué)習(xí)把學(xué)習(xí)跟判定是連在一起的,前面不是人工的,它也是學(xué)習(xí),但是一個一氣呵成的從端到端的學(xué)習(xí),這個非常重要。因為它讓你這個學(xué)習(xí)更加智能,它可以讓你從一個領(lǐng)域遷移到另外一個領(lǐng)域,它可以減少人工帶來的不必要的麻煩。第四,提供一套建模語音。深度學(xué)習(xí),你不需要對問題有很好的理解,這是一個錯誤的觀點。因為深度學(xué)習(xí)跟我們在機器學(xué)習(xí)里面的圖模型一樣,也是一套語言系統(tǒng),他讓你表達你對這個問題的理解,如果你對這個問題不理解,深度學(xué)習(xí)對你來講沒有用。在不同的問題里面,我們需要開發(fā)不同的深度學(xué)習(xí)的模型。回到第一個浪漫主義的觀點,深度學(xué)習(xí)跟人腦的關(guān)系。計算機視覺里面一個很著名的深度學(xué)習(xí)的模型是卷積神經(jīng)網(wǎng)絡(luò)。他們做這個的時候受到一個模型的啟發(fā),這個模型80年代獲得諾貝爾醫(yī)學(xué)生理學(xué)獎。他講的是視覺神經(jīng)系統(tǒng)早期在視覺皮層里面怎么樣處理視覺信息。用很多的圖像數(shù)據(jù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),這個網(wǎng)絡(luò)能夠非常接近的表達視覺神經(jīng)系統(tǒng)的行為。每一層的神經(jīng)元是一個特征提取器,一個具體的神經(jīng)元對什么特征敏感,這里面講的是他對不同朝向的邊界敏感。更高一層,把下面這一層提取的結(jié)果,去組成更復(fù)雜的模式匹配。如果是兩條邊你結(jié)合在一起會形成一個物體的各個部位,比方說鼻子的提取,再往下走,就更具有語意,他可以把下面的東西組成更加豐富的物體結(jié)構(gòu)。這里面他是一個從信號逐層抽象、逐層變換的過程。跟我們今天所了解的生物視覺系統(tǒng)是非常相關(guān)的。但根本上我們只是知道這個聯(lián)系,今天為止,我們做的很多的工作跟這個聯(lián)系并沒有太多的關(guān)系,也未受這個聯(lián)系的束縛。從另外一個觀點來講,從統(tǒng)計和計算方面來分享。在機器學(xué)習(xí)里面,我們關(guān)心的是推廣誤差,他不是看在現(xiàn)有數(shù)據(jù)集上面效果怎么樣,而是在未知的數(shù)據(jù)上,這個系統(tǒng)在訓(xùn)練的時候沒有看到的地方,叫推廣誤差。去年夏天,因為我們家小孩是在美國長大,剛剛回來,剛剛從一年級開始學(xué)習(xí),中文不太好,他有一次考完試以后跟我講,考的不好,70幾分;第二天他特別快樂的跟我講,爸爸,我考了98分,我說這太好了,一天之內(nèi)進步這么快。他說因為今天的考題跟昨天是一樣的。這不能真實反響學(xué)習(xí)者的能力。推廣誤差要在你沒有見過的數(shù)據(jù)集上面衡量他的效果怎么樣。一個經(jīng)典的分析方法是把推廣誤差分析成兩局部,我們來看錯誤源在什么地方。第一個叫Approximationerror,也就是假設(shè),沒有假設(shè)就沒有學(xué)習(xí),你在學(xué)習(xí)做推廣的時候就一定有假設(shè),你從推向未知,中間一定有一個結(jié)構(gòu)在里面。古代我們講近朱者赤,近墨者黑,這有一個相似性-如果是相似的物體具有相似的屬性。這里面隱含著函數(shù)平滑假設(shè),我們做一個假設(shè),通常反映在你的模型中間,所有的假設(shè)可能是錯的。在統(tǒng)計學(xué)里面有一個,假設(shè)不完美,你在假設(shè)空間里面一定能夠找到最完美的那個。第二個推廣來源是Estimationerror,這是來源于數(shù)據(jù)的不完美。你的訓(xùn)練數(shù)據(jù)和測試的數(shù)據(jù)來源分布不一樣。更多的時候是說你的數(shù)據(jù)是有限樣本,如果你在有限樣本上面得到的估計量是不準確的。因為我們的估計量是在無限樣本里面去估計他。光分析這兩個東西是不夠的。通常來講,在統(tǒng)計學(xué)的范疇里去分析這兩個東西,統(tǒng)計學(xué)家關(guān)心的點,跟計算機科學(xué)不太一樣。計算機科學(xué)關(guān)心的是,我今天跟老板申請五百臺機器,老板說不行就五臺。你說老板,給我五個機器,我要算兩個月搞定,老板說,你今天不搞定不能回家。所以是有限的資源下面去分析這個問題,在資源的有限性上面,你要去分析這個問題。這里面一般是求解的不完美,考慮計算的不完美。這里面給我們最近的機器學(xué)習(xí)提供了最近的誤差,我一開始在機器學(xué)習(xí)上面右層的集成,最好的一層是20層。第二,大量的數(shù)據(jù),讓你在這上面經(jīng)驗性的判斷接近你的期望值。第三,我要設(shè)計一個非常精巧的算法,求得一個非常完美的解,這個完美的解算法非常復(fù)雜。一個能用的算法,它得有比擬好的性質(zhì),讓你可以消化大的數(shù)據(jù)。把這三點都放在一起,大家可以理解,為什么在大數(shù)據(jù)的時代深度學(xué)習(xí)變得這么重要。我們看這兩個緯度,隨著數(shù)據(jù)規(guī)模的增長,效果是怎么樣的。傳統(tǒng)的人工智能算法可能由于這個模型的空間是有限的,復(fù)雜度不夠高,數(shù)據(jù)多了沒有用。或者你的算法本身不能處理大數(shù)據(jù),比方說他的算法復(fù)雜度是數(shù)據(jù)量的三次方。一萬個數(shù)據(jù)點你可以看懂,但是如果是十萬個你就搞不定。但是深度學(xué)習(xí)算法,由于它的模型足夠的好,又能夠掌握主大數(shù)據(jù),所以他能夠不斷吸收數(shù)據(jù)紅利,去年百度首席科學(xué)家AndrewNg帶著團隊在語音識別問題上取得了重大進展,把數(shù)據(jù)加到了幾萬小時,效果不斷的加強。如果你的商業(yè)模式能夠擁有這樣一個曲線,我要恭喜你,因為大數(shù)據(jù)真正成為商業(yè)壁壘。。第二,深度學(xué)習(xí)是一個靈活的建模語音。我們用不同的語音模型表達你的點,比方說圖象,因為他是兩維的,用卷積神經(jīng)網(wǎng)絡(luò)更加適合。我們?nèi)ニ阉髡Z意相關(guān)性,傳統(tǒng)的做法是人工抽取很多特征,變成一個學(xué)習(xí)問題,這里面完全是端到端的。我關(guān)心的是對于一個搜索的Query,我關(guān)心的是這兩個相關(guān)性,但是它絕對的相關(guān)程度我不關(guān)心。深度神經(jīng)網(wǎng)絡(luò)給你的是一個語言,讓你去表達你對問題的理解。這是最近非常成功的一個神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它叫Long—shorttermmemory,它最近取得很好的進展:即在任何一個地方,時間跟歷史的相關(guān)性是變化的。比方說自然語言處理,你如果碰到一個右符號,你只要溯源到左符號那個地方,把中間所有的東西拿出來分析。根據(jù)你當(dāng)前所處的狀態(tài),你是應(yīng)該去找一個更長的。你遇到一個句號,你做語意理解的時候,你把過去歷史所有的都要清零。在時間面前,時間和歷史是不一樣的。這個模型比以前的模型更加的rich。我們在過去做字符識別的時候,一般先把字符分成一個一個單的圖片,再識別它是什么東西,但是我們發(fā)現(xiàn)對于這樣的問題是不可行的。在這種情況下,你可以做的是把整個字符序列放進去,并希望輸出的是一個完整的字符序列?,F(xiàn)在在這些領(lǐng)域應(yīng)用都是最好的效果。用另外一個更加不同的神經(jīng)網(wǎng)絡(luò)表達我的問題。我不是識別這個圖象里面有什么東西,而是述說圖片的故事:下午的陽光照在房間,有藍色的地毯和白色的沙發(fā)…今天我們用理解圖象的神經(jīng)網(wǎng)絡(luò),經(jīng)過很多非線性的變換,生成很多表達。他從這個詞生成一個圖象,再生成下一個詞,我希望這個句子跟圖象是有關(guān)的,使整個的語言也跟這個圖象有關(guān)。根據(jù)你對這個問題的理解,神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)給你提供了一個非常豐富的符號語言系統(tǒng)讓你去表達你這個問題應(yīng)該怎么搜索。還有很多其他的例子,用深度學(xué)習(xí)提高搜索的先進性,用了深度學(xué)習(xí)以后,比沒有用深度學(xué)習(xí)有翻倍的提升,包括語音的系統(tǒng)。最近我們用的語音系統(tǒng),是一個真正的中文語音識別系統(tǒng),我們用幾萬小時的聲音來訓(xùn)練它,在識別率上面有很大提升。大家看新聞可能看到了,我們在英文的識別也是優(yōu)于我們的競爭對手。這是另外一個很有意思的例子,很小的一個產(chǎn)品,但是它是人工智能很多技術(shù)在一起的綜合體系。這個是我的一個朋友,紐約大學(xué)的教授研發(fā)的,他到上海來,去餐館看到這樣一個菜單,他拍照識別,有一個OCR,翻譯成英文,通過TTS就可以翻譯出來。在紐約你想找川菜館,他識別成中文,翻譯成英文,通過這個英文隨便給一個老外你問他。這個東西正在成為現(xiàn)實,中間的時延做的越來越好。這是百度作業(yè)幫,小朋友夏天玩的沒有時間做作業(yè)了,但快要開學(xué)了怎么辦?如果我小時候有這個玩意兒,我會很開心,因為我有更多的時間玩。當(dāng)然這個技術(shù)要善加利用,你可以去找到關(guān)鍵的識別點。這一度讓很多朋友玩的很high,每個小人物都有一個成明星的夢想,我們就能滿足這樣的需求。我訪問谷歌的時候,有個是做深度學(xué)習(xí)最有名的多倫多大學(xué)的教授,現(xiàn)在在谷歌工作。當(dāng)時他問我,深度學(xué)習(xí)還能活五年嗎?我說不能,他聽了很沉悶。但是其中的思想是有價值的,比方說分層次的思想,在非神經(jīng)網(wǎng)絡(luò)的系統(tǒng)和其他的系統(tǒng)都有作用。我們用深度學(xué)習(xí)做了這么好玩的東西,我們可以玩一玩,他說好,來玩玩。他得到了這個結(jié)果非常開心,立刻分享給他的老婆。最近我們團隊有一個挺好的結(jié)果,去年Facebook在測試上面,得到世界上最好的結(jié)果97.35%,前幾天百度深度學(xué)習(xí)研究院得到了99.85%的成績,終結(jié)了刷榜。常常我們會聽說到某一個團隊在一個數(shù)據(jù)上面做到怎么樣的效果,怎么必須要客觀的看,那只是證明他在這個數(shù)據(jù)集上做的最好,不代表他把這個問題給解決了,也不代表他的這個問題就可用了。人臉識別,今天誰要告訴你,說人臉識別可以用來代替指紋識別,我告訴你,那肯定是忽悠,沒有到那個程度,但是終究有一天會做到的。基于圖象的理解,你可以做圖片搜索,他不光做視覺相似形的匹配,還有語意的匹配。這里的結(jié)果看起來都不錯,有一些細致的區(qū)別。這邊下面是倒影,是水,這邊看似是水,但是大局部是草坪、陸地,這邊的結(jié)果全都是倒影、都是水。很細致的不同。去年全球最好的物體檢測模型,他告訴你有這個頭盔,他也告訴你這個頭盔在什么地方,用一個框給框出來?;诖髷?shù)據(jù)的人工智能在過去幾年已經(jīng)發(fā)生了變化,我們靜態(tài)來看、把這幾年的進展串在一起看,效果還是很驚人的。在這個分類中,2023年世界最好結(jié)果,錯誤率接近30%。每一年不同的團隊在這上面努力工作,每一年的錯誤率非常驚人的在降低,朝著零趨勢開展。2023年最好的結(jié)果是百度取得的--7%。斯坦福的學(xué)者人工做了一下比對,他們發(fā)現(xiàn)人的識別率是5%,今年我們聽到微軟和谷歌的朋友已經(jīng)做到大概3%、4%了。當(dāng)然也有一些誤導(dǎo),比方說他能認識六七種不同的青蛙,誰能認識那么多種不同的青蛙呢?人的能力還是有限的。過去的搜索引擎包括幾個環(huán)節(jié),數(shù)據(jù)信息的感知、處理、理解、學(xué)習(xí),到?jīng)Q策、行動、創(chuàng)造,這是三個不同階段。過去我們主要是從互聯(lián)網(wǎng)上獲取這些信息,今天因為是移動互聯(lián)網(wǎng),我們的效勞離人越來越近,所以你需要更多從人的數(shù)據(jù)里面獲取很多內(nèi)容。我們跟清華大學(xué)的朱勇武〔音〕老師有973的工程,從人,還有物理世界,物聯(lián)網(wǎng)〔上面有各種各樣的傳感器,里面有一種重要的傳感器是GPS,對物理世界的感知〕,這些緯度都變得越來越重要。相反,互聯(lián)網(wǎng)上的數(shù)據(jù)以前是唯一,現(xiàn)在只是其中的一個信息來源。把這些信息都獲取,我們也需要去向更加先進的人機交互的領(lǐng)域開展。比方說更加先進的傳感器,我們現(xiàn)在在做3D建模,它是自動駕駛很重要的一個方面。因為車在什么地方可以走,什么地方不能走,哪個地方是主道,哪個地方是輔道…要不然這個車不知道怎么走。以前傳統(tǒng)的互聯(lián)網(wǎng)的信息分析以后,我們通常去做預(yù)測、廣告、搜索.但是今天,我們不光是在數(shù)字世界里面去做一些事情,我們是不是也在物理世界做一些事情。有一位專家說的很好,清華大學(xué)張院士說,機器人是互聯(lián)網(wǎng)效勞的最后一公里。比方說今天你在網(wǎng)上預(yù)定一個比薩,那邊有人讀到了這個信息,他來給你做這個比薩;某個人辛辛苦苦把這個比薩送過來…這里面有很多環(huán)節(jié)可以去優(yōu)化。比方說這個比薩是不是真的做的非常的個性化,是不是非常符合你的口味?比方說今天我們在移動互聯(lián)網(wǎng)上對每個用戶的畫像,可以做幾十萬個來描述你的興趣。將來的這個比薩會做的非常的個性化。加多少胡椒粉都是針對你的口味,可以做到千人千面,可以讓每個人都感覺是VIP。到底誰能做這件事情?機器人。因為他把這些數(shù)據(jù)瞬間讀到他的數(shù)據(jù)庫里面。誰來最高效的把這個效勞最后完成,送到你家里來?機器人。張華院士說機器人是互聯(lián)網(wǎng)效勞的最后一公里,很有道理,很深刻。當(dāng)然人工智能還有一個很高的層次就是探索和發(fā)現(xiàn)。去探索過去沒有的東西,3D打印在這里面扮演一個東西,他把一個計算的結(jié)果變成一個物理的現(xiàn)實。計算是沒有邊界的,計算生成的結(jié)果根本上也是沒有任何的邊界,所以他可以生成任何的東西,3D打印就可以幫助他實現(xiàn)。將來的智能延伸到物理世界里面去創(chuàng)造以前從來沒有過的東西,這是一個可以預(yù)見的未來。今天對網(wǎng)絡(luò)模型的規(guī)模有不斷的追求,我經(jīng)??梢月牭侥衬硢挝豢梢詫崿F(xiàn)超大規(guī)模的神經(jīng)網(wǎng)絡(luò),這里面可以稍微做一些類比,我們可以看到不同物種的變化是很大的。但是如果你看他們的變化之間平均的連接,他們的區(qū)別其實沒有那么大。我們發(fā)現(xiàn)更高層次的智慧物種,他有更大規(guī)模的神經(jīng)網(wǎng)絡(luò),但是他的網(wǎng)絡(luò)連接是稀疏的。你的物種不斷增多,你的連接卻沒有變化,所以他一定是越來越稀疏的。這對我們是有一些啟發(fā)的。今天我們來比擬一下人類大腦跟Supercomputer。人的大腦一般是1.5KG,2%的位置,但是它要消耗我們2%的能量,所以腦子是很消耗能量的。為什么中午會犯困,因為你吃飯以后血液都到消化道里面去了。某某朋友一天非常集中的做一件事情,最后會累的虛脫,哪怕他沒有怎么動就是這個原因。我們的大腦有一千億個neurons,每個數(shù)理有5000個神經(jīng)原,每一個連接是200次/秒。我們大腦的計算能力是10的17次方。它是一個非常高效的計算,每瓦能量完成的計算量是5個Gliops。跟中國的天河二號比擬一下,它現(xiàn)在的計算能力還沒有到達人腦計算的一半,它現(xiàn)在是34個petaliops,它的計算效率是每瓦2.14Gliops。這是我們和清華大學(xué)做的一個工程,它是真正的自行車,以前我們見到的自行車都是假的自行車,因為它不是自行。我們在做這個工程的時候有一些思考,這個思考就是人跟車的關(guān)系,我們覺得它未來是人跟馬的關(guān)系,是朋友。如果你養(yǎng)一匹馬,很親以后,它跟你有一個交流,它也是懂你的,它也有自己的想法。這是我們在百度做的自動駕駛工程。我們不把它叫做無人駕駛,我們叫做“高度自動駕駛〞工程。首先這是一個非常典型的機器人工程,一個自動駕駛的車,裝了這么多的傳感器。這個車的后背箱堆滿了效勞器。感知、理解、決策控制,車的計算要直接控制、操控這個車物理的東西。這里面中國跟國外還有一些差距,首先要實現(xiàn)線控,中國絕大局部的車都不是線控。我們做自動駕駛,你要控制剎車,怎么控制?不是一個接口、一個計算機寫進去,他是一個大的鐵桿子、這邊裝了馬達,鐵桿子踩在剎車上。我們跟寶馬合作,是因為他提供線控的技術(shù)。這個車我們叫做小紅,小紅,大白,這是我們改裝的第一輛車,第二輛、第三輛。首先是對道路的感知,這里是三維高精度的感知。對車的定位要能夠做到厘米量級的定位。這里面需要一些相當(dāng)?shù)膫鞲衅骷夹g(shù)、機器人技術(shù)。這個是在G7上面采用的。大家看到劃的很高,因為我們是三維的東西,很容易劃的很高,都是計算出來的。我們對車整合動力學(xué)的系統(tǒng)建了這個模型做仿真,在路上走我們要做模擬的仿真,模擬仿真做的差不多以后,我們再實際的去調(diào)試。自動駕駛要飛入尋常百姓家,關(guān)鍵是你要用低本錢的傳感器實現(xiàn)很強的智能感知能力。谷歌自動駕駛有一個很嚴重的問題,他用的傳感器比車本身都貴。他的傳感器要70萬人民幣。但是我們要突破一個技術(shù),就是怎么讓低本錢的傳感器大規(guī)模的應(yīng)用。這是我們做的是基于圖象的實時道路場景理解。比方說識別道路上的汽車,在這件事情上我們真的做的比別人好。這個藍色的點是我們的標注人員做的。這些車是疊著排在路邊,人在標注的時候不容易精確的說這輛車、這輛車、這輛車,不容易看清。這個地方陰影的遮擋。有一輛車在這里,被一個交通標志遮擋起來了,人不容易看到,但是目前我們的算法能夠做到這樣的水平。最后看一下我們對自動駕駛開展路徑的看法。為什么我們不認為我們要做的是無人駕駛?真正的無人駕駛要實現(xiàn),還有一個相當(dāng)長的路徑,除了技術(shù)的能力以外,還有政府的政策法規(guī),還有根底建設(shè),還有保險公司怎么判定這個問題,出了問題到底是誰的錯,這些事情已經(jīng)遠超技術(shù)本身,還有倫理的問題。真正到無人駕駛,你要經(jīng)歷幾個階段:第一階段,輔助駕駛。第二,主動駕駛。第三,特定條件下的自動駕駛。第四,高度的自動化駕駛。比方說輔助駕駛,當(dāng)前這個階段是一個輔助駕駛的階段,因為這個車告訴你哪邊有車,哪邊有人,如果要出事故,他會提醒你。輔助駕駛告訴你檢測的結(jié)果,他不控制這個車。控制這個車變成了主動駕駛。特定環(huán)境下面,很多的車廠跟我們一樣都認為在特定的場景,像某些高速公路,在兩到三年的時間里面會實現(xiàn)智能的自適應(yīng)巡航?,F(xiàn)在車的巡航只是保持速度,如果前面的車并道過來了,你是不是會做一些改變,或者減低車速,現(xiàn)在的車做不到。如果這個車本身在巡航狀態(tài),他是不停在拐彎的,你會不會車道跟隨?這個會最先實現(xiàn)。在某些比擬先進的地方,你到了賓館,車就不用管了。將來這個車是自動駕駛的,他把你的車移到那個地方。或者在一個大型的物流中心,或者在一個礦山里面,他是一個自動駕駛。最后到高度的自動駕駛。人車一體,人不能放棄對車的控制,就像現(xiàn)在的飛機一樣,飛機在空中的很多時候它是自動駕駛的狀態(tài),你喝杯咖啡沒有問題,但是任何時候你要重新恢復(fù)你的控制,你可以做到。因為人對這個事情負責(zé)。關(guān)于人和機器的關(guān)系,從我自己親身經(jīng)歷的例子來說。我們過去的團隊在兩年前做過兩個事情,一個事情是讓你自己照的照片找一個長的最像的明星。還有一個是你拍一個照,理解了以后,生成一首詩。這里面涉及到計算機視覺,涉及到自然語言。但是從市場的反響來講,你們可以想象到,哪個更受歡送?因為這跟每個人都相關(guān),每個普通人都有一個想當(dāng)大明星的夢想,哪怕是一個虛幻,至少是這個產(chǎn)品跟每個用戶之間的關(guān)聯(lián)。拍照寫詩為什么不受歡送?因為他是showoff,他是秀百度的機器有多牛,不是秀我多牛。這里面有一個我們的思考,機器往前,我們回到人工智能的原點,這個原點叫圖靈測試,圖靈測試一直在指導(dǎo)人工智能研究的方向,他的目的是研究這個智能的機器能夠取代人。圖靈測試就是如果拿一個布檔著,這邊是機器還是人我就不知道了。我們下國際象棋,目前他是PASS了圖靈測試的。這種導(dǎo)致了你的做法,你不斷研究跟人可以PK的機器,這是不是我們真正想做的,是不是真正的方向。站在今天可以去思考。我剛剛講到了象棋,IBM的深藍有一個劃時代的成果,它做的比最好的象棋冠軍能力還好,看似這樣一個偉大的科技進展,它其實沒有給IBM帶來任何的價值,沒有給這個社會產(chǎn)生任何的影響,也沒有使這個社會變得更加美好。為什么?因為它無非是造一個跟人能力差不多可以PK的機器。我們看另外一個東西,搜索引擎,無論是谷歌還是百度,它這個技術(shù)不完美,因為我們理想的技術(shù)是能夠給他扔一個問題,他能夠自動尋找問題的答案。他做的不完美,他是扔一堆排序的結(jié)果,你自己搞清楚。但是他對這個社會產(chǎn)生了巨大的影響。他能讓北京清華附小一個家庭環(huán)境非常優(yōu)越的小孩子跟一個鄉(xiāng)村里面的小孩子,只要有網(wǎng)絡(luò)的情況下,獲取知識、獲取信息的能力是一樣的。他是因為成就了每個人,讓每一個普通的人更有知識,他獲得信息,能夠做更加明智的判斷,這個事情跟這個社會的大需求發(fā)生了共振,產(chǎn)生了巨大的影響。我們思考自動駕駛也是這樣,我們是要去思考、去做真正的替代人去駕駛的,還是去做車成就人的,還是你可以獲取更大的自由。谷歌的這個車一開始是沒有方向盤的。這個車真的是你想要的嗎?最近他們把方向盤加上去了。我們希望車跟人的關(guān)系,就像人跟馬的關(guān)系一樣。你在萬馬奔騰的環(huán)境里面,你騎著這個馬,你不需要特別細微的控制這個馬,它自己知道怎么走,避障,跟周圍的馬協(xié)調(diào)距離,你要把握大方向。你甚至在馬上面如果打瞌睡,馬也可以帶著你走,你什么時候想要控制它,你是可以控制的。自動駕駛是要構(gòu)建人車一體、以人為主的駕駛環(huán)境。最后,我覺得什么是一個偉大的技術(shù)?它不在于讓機器更偉大,它的偉大之處,是讓每個平凡的人更有創(chuàng)造力、更加自我、更偉大。這是人工智能和技術(shù)開展的方向。世界是我們的,也是機器人的,但是歸根到底是屬于會控制機器人的人的。謝謝大家!提問環(huán)節(jié)提問1:借用張院士說的最后一公里,前面在你的思路中,什么是最先一公里?最先一公里和最后一公里是什么關(guān)系?余凱:信息的搜集、整理是目前來講先要去做的。提問2:假設(shè)我們可以確定機器智能的開展一定會威脅人的生存,機器超過人的時候,一個很嚴重的問題就是人沒有用了。余凱:首先,我們現(xiàn)在太早去思考這個問題了,因為我們現(xiàn)在離那個階段還非常遠。第二,我不認為將來機器會超過人或者駕馭人。他應(yīng)該還是人的工具。我覺得它在很多能力方面是超過我們,但是最后它還是受人的駕馭。有一點是:機器人沒有好奇心。我現(xiàn)在想不到讓一個計算模型具有對未知世界探索的好奇心。因為人去探索未知世界好奇,不斷的拓展知識的邊界,機器人是去執(zhí)行我們的想法。提問3:我正在寫一篇文章,這一篇文章的一個觀點是,當(dāng)機器要保證自己不斷電的情況下,沒有人的參與,它會不會有好奇心?余凱:會不會有好奇心我就不知道了。這種哲學(xué)討論我們可以永遠討論。因為那一天沒有到來之前,我們可以不斷的去猜想。我的觀點,我們想做對社會有用的東西。提問4:剛剛余博士介紹很多沖動人心的人工智能方面的成果??墒俏覀儸F(xiàn)在去看應(yīng)用層面,包括剛剛介紹很多百度的應(yīng)用,好玩但是不實用,比方說魔圖、百度拍植物,都不實用,或者是一個輔助性。余博士的角度看,在應(yīng)用層面,出現(xiàn)一個endto-end的應(yīng)用可能會出現(xiàn)哪一個領(lǐng)域?余凱:這些人工智能的技術(shù)對于現(xiàn)實商業(yè)的影響其實是巨大的。因為今天的整個搜索、廣告系統(tǒng)、電子商務(wù)、大數(shù)據(jù)金融,這些技術(shù)在這里面,你有和沒有,是生和死的問題,不是錦上添花的事情。但是那些好玩的事情,他自己也在不斷的演進。我們講的圖象識別,大家有沒有聽說過MobilEye?這家公司就是做車輛和行人識別感知系統(tǒng),它現(xiàn)在做到很大。還有一個大數(shù)據(jù)公司叫Palentir,他就是人工智能大數(shù)據(jù)的方法用在國家平安領(lǐng)域,他現(xiàn)在是一百多億美金的估值。近期來講,你總會覺得技術(shù)開展比你想象的要慢。近期大家總是高估技術(shù)對人類的影響,但是在十年的時間里面,你一定是低估技術(shù)對你生活的影響。提問5:在您的演講里面有一個細節(jié),您跟Hinton教授談的時候,說這一波深度學(xué)習(xí)浪潮很快就過去了。在五年之后,在深度學(xué)習(xí)之后是什么樣的開展方向,什么樣的技術(shù)引領(lǐng)下一個開展方向?余凱:在某一個方面做的事情,特別是計算機科學(xué),常常是自己埋葬自己。很多年前,計算機體系結(jié)構(gòu),現(xiàn)在做的時候它不是一個你要探索的學(xué)科。深度學(xué)習(xí)一定會成為一個非常俗氣的東西,每個人都會用。至于未來的方向,我不能講太遠、太哲學(xué)的,我更愿意講現(xiàn)實的?,F(xiàn)實來講,自然語言理解是一個非常重要的方向,期待一個突破性的進展。提問6:我是電子系的學(xué)生,深度學(xué)習(xí)的算法用在硬件上面,您覺得這方面的潛力大嗎?余凱:這個會非常有潛力,因為把這些智能的算法用在硬件里面,可以放進各種智能設(shè)備中,這是我很期待的方向。提問7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論