版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
【計算機論文】分析:谷歌人工智能計劃AlphaGo只是開頭?
加了墊子的墻,昏黃的燈光,花樣墻紙的天花板。這里一點也不像能做出改變世界的尖端發(fā)現(xiàn)。但在這些讓人快要幽閉恐懼癥的模擬走廊里,DemisHassabis認為,他在為創(chuàng)造足以解決人性最大難題的軟件鋪設道路。“我們的目標很大,”Hassabis說,他冷靜穩(wěn)健的風格讓人無法想象他概念的大膽。他在谷歌DeepMind領導一只有200名計算機科學家和神經(jīng)學家的團隊,DeepMind就是在3月初打敗了人類圍棋大師的AlphaGo背后的位于倫敦的團隊,創(chuàng)造了計算機歷史上的里程碑。但是,Hassabis說這只是萬里長征的第一步,作為人工智能領域的阿波羅計劃,目標“解決智能問題,然后用它解決其他所有問題。”如今判斷智能軟件的標準具體到了一個特定的任務——面部識別。Hassabis希望創(chuàng)造他所稱的“綜合智能”——像人類一樣可以學會完成任何任務。他展望未來人工智能可以做各種事情,通過形成和測試科學假說推進醫(yī)學發(fā)展,或者用輕巧靈活的機器人身體跳來跳去。要實現(xiàn)這個目標,DeepMind的軟件必須超越黑白分明、秩序井然的圍棋世界。它需要掌握亂糟糟的真實世界——或者從一個昏暗的、像素化的模擬世界開始。DeepMind的模擬世界叫做Labyrinth,公司在用它讓軟件嘗試非常復雜的任務,例如在迷宮中導航。這會推動DeepMind研究員鉆研如何制造更智能的軟件,推動軟件學會面對更難的決策和問題。他們利用了之前AlphaGo以及DeepMind更早炫耀過的技能,DeepMind學會玩二十世紀八十年代的太空入侵者等復古Atari游戲,玩得比人類都好。但要成功,Hassabis必須想出辦法,解決人工智能領域中一些年代已久的問題。自我改善39歲的Hassabis此生很多時間都在研究如何創(chuàng)造智能。當年象棋神童提早從高中畢業(yè),開始了視頻游戲職業(yè)生涯。后來他獲得了神經(jīng)科學的博士學位,發(fā)布了關于記憶與想象的影響廣泛的論文。Hassabis在2011年聯(lián)合創(chuàng)建了DeepMind,將他所學的生物智能轉化到機器。公司在2013年12月發(fā)布了學會Atari游戲的軟件,在2014年初被谷歌收購,據(jù)報道金額達4億英鎊,當時超過六億美元。DeepMind快速擴張,新增雇傭幾十名研究人員,在頂尖機器學習和人工智能會議發(fā)表大量論文。今年一月,它宣布了AlphaGo的存在,以及AlphaGo在2015年12月打敗了歐洲最強圍棋玩家的消息。本月初,AlphaGo打敗了世界圍棋冠軍李世石。增強學習方法,是讓機器學習軟件學會更復雜任務的關鍵。Atari游戲和圍棋非常不同,但是DeepMind用同樣的方法解決了他們,從動物的訓練方式中獲得靈感:馴獸師可以用獎勵與懲罰教會動物新的招數(shù)。通過被稱為“加強學習”的方法,軟件被設計為可以探索新的環(huán)境,調整自己的行為,以獲得某種虛擬獎勵。舉個例子,DeepMind的Atari軟件被設計為只能控制和看見游戲屏幕,具有增加分數(shù)的動機。幾個小時的訓練就可以讓軟件提著鞋帶起身,打到人類專家。AlphaGo結合了增強學習和其他元素,例如一個分析幾千萬個專業(yè)圍棋玩家棋譜從而學會評估不同走法的系統(tǒng),還有一個搜索機制來選擇最佳走法。但是,讓AlphaGo能夠打敗世界冠軍的,是與自己練習幾百萬次的增強學習。Hassabis認為,增強學習方法是讓機器學習軟件學會更復雜任務的關鍵,比軟件現(xiàn)在能玩的要復雜得多,例如記錄我們的話語、理解圖片的內容?!拔覀儾徽J為僅僅觀察就足夠智能,你還必須行動?!彼f,“最終,這是唯一你可以理解世界的方法?!盌eepMind的三維環(huán)境Labyrinth,基于一個開源的第一人稱射擊游戲Quake,專門為驗證該想法而設計。公司已經(jīng)用它來讓機器參與游戲,60秒內探索隨機生成的迷宮,收集蘋果或找到出口(可通往另一個隨機生成的迷宮)可獲得分數(shù)。未來的挑戰(zhàn)可能要去更復雜的計劃性——例如,懂得要是可以打開門。公司還會以其他方式測試軟件,并在考慮挑戰(zhàn)星際爭霸和撲克牌。但是一段時期內,在Labyrinth里設置越來也難的挑戰(zhàn)將會是主要的研究方式,Hassabis說,“接下來幾年都夠用了。”增強學習在未來的二至三年,會像深度學習一樣影響巨大。其他研究人工智能的公司和研究員會緊密關注著。DeepMind增強學習的成功讓很多機器學習研究員吃了一驚。這項技術是二十世紀八十年代創(chuàng)建的,之前沒有其他訓練軟件的方法那么廣泛使用和效果強大,華盛頓大學研究機器學習的教授PedroDomingos說。DeepMind加強了這項技術,把它和深度學習方法結合起來。深度學習最近有了重大突破,能讓計算機解碼圖片等信息,引發(fā)了最近機器學習的熱潮?!癉eepMind所做的很了不起,”Domingos說。但是他還說,Hassabis想做的是一個超越現(xiàn)在所有研究的火箭,還是后院里放的煙火,現(xiàn)在要下定論還為時過早——近期讓人眼花繚亂的成功不一定能持續(xù)?!癉emis對增強學習的樂觀態(tài)度不只是處于成功經(jīng)驗,”Domigos說,“機器學習和人工智能領域中,進步不是線性的;我們有時候會突飛猛進,有時候會慢慢前行?!盚assabis承認,業(yè)界”很多“人都懷疑增強學習的潛能,但是他們不會買賬?!拔覀冊绞巧钊耄绞歉杏X我們的理論是正確的,我想我們正在改變整個領域,”他說。“我們認為增強學習在未來的二至三年會像深度學習一樣影響巨大。”安全第一DeepMind的成功目前支持Hassabis關于增強學習會有很多應用的說法。AlphaGo的成功讓很多專業(yè)圍棋手和計算機專家驚訝,因為圍棋實在非常復雜,很難讓基本依靠計算不同走法可能結果的軟件勝利,也就是1997年IBM的深藍用來打敗世界象棋冠軍GarryKasparov的方法。平均來說,象棋玩家每一步有35種可能的走法;在圍棋中,有250種。圍棋中位置可能性排列組合的數(shù)量,比宇宙中原子的數(shù)量都多?!跋笃迨且环N計算游戲,”Hassabis說,“圍棋太復雜,所有玩家靠的是直覺。在類別上完全不一樣。你可以把AlphaGo想象成一個超級人類的直覺,而非超級人類的計算?!眹迨澜绻谲娎钍朗仡櫵?-4敗于AlphaGo的比賽。圖片來源MITTechnologyReview。圍棋世界冠軍李世石回顧他1-4敗于AlphaGo的比賽。圖片來源MITTechnologyReview。不論你是否同意AlphaGo具有直覺,能讓軟件掌握更復雜的任務顯然很有用。DeepMind正在和英國國家健康服務的項目合作,訓練軟件幫助醫(yī)務工作人員發(fā)現(xiàn)腎臟問題的跡象,這些問題經(jīng)常被忽視,并造成大量可以避免的死亡。團隊還在和谷歌業(yè)務團隊合作,Hassabis說他的技術可以讓虛擬助理浮現(xiàn),改善推薦系統(tǒng),這對于YouTube等產(chǎn)品非常重要(類似的系統(tǒng)也是谷歌廣告產(chǎn)品的基礎)。能解決問題的一個非主流辦法是,學習真實的大腦。更遠的未來,DeepMind需要很多突破,才能往Hassabis解決智能的目標靠近,即使是未來幾年都在Labyrinth里面試驗。最關鍵的一個缺口是一種叫做分塊的技能,人類和動物的大腦用以處理世界的復雜性。Hassabis舉了個去機場的例子,你可以想好如何去機場并且完成計劃,而不用考慮走去門口的時候每一步走在哪兒,如何轉動門把手或控制每一個肌肉纖維。我們可以用高層次的概念來計劃和行動,而不用考慮每一個細節(jié),并且通過重新組合我們熟悉的“分塊”,或者概念,來適應新環(huán)境?!斑@大概是人工智能領域內未解決的最核心問題之一。”Hassabis說。這是許多研究團隊在鉆研的問題,包括其他谷歌團隊。但是,DeepMind希望能解決問題的一個非主流辦法是,學習真實的大腦。公司有一個由著名研究員MattewBotvinick領導的神經(jīng)科學家團隊,他直到最近一直是普林斯頓大學的教授。與大部分神經(jīng)科學研究不同的是,他們不僅要研究大腦如何運作,還要告訴DeepMind如何設計軟件。有一個近期試驗測試了Hassabis關于人腦如何組織概念的理論,利用一個偽造記憶的標準程序。它給測試對象呈現(xiàn)一系列相關詞,例如“冷”、“雪”和“冰”。人們經(jīng)常錯誤地記得聽到一些其他相關詞,例如”冬天“。3月,AlphaGo與李世石的比賽進行中的DeepMind員工。viaMITTechnologyReview。3月,AlphaGo與李世石的比賽進行中的DeepMind員工。viaMITTechnologyReview?!案鶕?jù)我的機器學習概念,我想這一定暗示了那種概念信息如何在大腦中組織,“Hassabis說。DeepMind團隊研究出一個大腦的顳葉前部如何組織概念的理論,通過觀察正在進行記憶任務的人的大腦,確認了理論的假說。這項結果可能會改變DeepMind設計人工神經(jīng)網(wǎng)絡來呈現(xiàn)信息的方式。DeepMind的”待發(fā)現(xiàn)“列表上還有,將它在軟件上做過的、抓取文本意義的實驗,與Labyrinth中漫游的軟件實驗結合起來——有一個可能性是在虛擬空間內開始擺上標識。Hassabis說,他還在計劃一種“野心勃勃”的方法,來測試是否準備好面對比Labyrinth更加真實的世界。他希望DeepMind未來可以控制機器人,他認為機器人受限于軟件對世界的理解能力?!坝幸恍┖芰瞬黄鸬臋C器人,不能充分發(fā)揮他們的能力因為還沒有算法。”他說。如果成功,那會引發(fā)一些關于人的本質定義、以及人工智能的合理使用范圍等嚴肅的哲學和倫理問題。Hassabis說,他鼓勵人們討論這項技術可能的風險。(雖然他滿意地表示,物理學家StephenHawking在于他見面后,已經(jīng)停止警告人工智能會毀滅人類;將人工智能研究比作”召喚魔鬼“的Tesla創(chuàng)始人ElonMusk也被潑了冷水。)D
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度板材行業(yè)環(huán)保認證與評估合同3篇
- 2025年度毛紗產(chǎn)品售后服務及維修合同4篇
- 2025年度個人房產(chǎn)買賣及裝修工程管理協(xié)議4篇
- 2025年度二零二五年度環(huán)保產(chǎn)業(yè)供應鏈融資保理合同4篇
- 2025年度個人教育貸款借條4篇
- 2025年度毛石擋土墻施工期施工安全管理與教育培訓合同4篇
- 2025年度海洋運輸船員勞動合同書3篇
- 2024綜合服務外包合同標準文本版B版
- 2025年度智能車間租賃安全協(xié)議書規(guī)范文本4篇
- 2024黎塘售樓部裝修合同
- 土地買賣合同參考模板
- 新能源行業(yè)市場分析報告
- 2022年7月2日江蘇事業(yè)單位統(tǒng)考《綜合知識和能力素質》(管理崗)
- 初一英語語法練習
- 房地產(chǎn)運營管理:提升項目品質
- 你劃我猜游戲【共159張課件】
- 專升本英語閱讀理解50篇
- 中餐烹飪技法大全
- 新型電力系統(tǒng)研究
- 滋補類用藥的培訓
- 北師大版高三數(shù)學選修4-6初等數(shù)論初步全冊課件【完整版】
評論
0/150
提交評論