打造互聯(lián)網(wǎng)+的當(dāng)代搜索引擎等待第三代搜索引擎_第1頁
打造互聯(lián)網(wǎng)+的當(dāng)代搜索引擎等待第三代搜索引擎_第2頁
打造互聯(lián)網(wǎng)+的當(dāng)代搜索引擎等待第三代搜索引擎_第3頁
打造互聯(lián)網(wǎng)+的當(dāng)代搜索引擎等待第三代搜索引擎_第4頁
打造互聯(lián)網(wǎng)+的當(dāng)代搜索引擎等待第三代搜索引擎_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

打造互聯(lián)網(wǎng)+的當(dāng)代搜索引擎等待第三代搜索引擎

馬克莫里斯只投資了兩家公司,但這兩家公司給他帶來了巨大的財富和聲譽,成為歷史上最具投資價值的投資者之一。這兩家公司是優(yōu)雅和互聯(lián)網(wǎng)上的兩座神話。以及兩位搜索引擎的代表。當(dāng)投資雅虎成功后,他曾說:“互聯(lián)網(wǎng)是一個年輕的產(chǎn)業(yè),這里面有無數(shù)的機會,我在等待下一個雅虎!”。一年前,當(dāng)他投資的Google上市后,他依然說:“互聯(lián)網(wǎng)還是一個年輕的產(chǎn)業(yè),這里面還有無數(shù)的機會,我在等待下一個Google!”麥克·莫里茲在等待,等待下一個將會給他帶來滾滾財源的搖錢樹;記者也在等待,等待見證下一個互聯(lián)網(wǎng)神話;無數(shù)的網(wǎng)民也在等待,他們等待的是一種能夠真正滿足他們需要的、新的搜索引擎,我們將它稱為第三代搜索引擎。7第二代搜索引擎,讓網(wǎng)站更便捷作為互聯(lián)網(wǎng)門戶的開山鼻祖,雅虎一直被許多人頂禮膜拜,它至今仍是全球最有影響力的互聯(lián)網(wǎng)公司之一。但10年前,當(dāng)楊致遠和他的同伴首次把雅虎帶到世人面前時,它還只是一個簡單、甚至有些笨拙的搜索引擎,但這沒有影響當(dāng)時的人們把它奉為至寶,并把它當(dāng)作第一代搜索引擎的象征。在中國,搜狐也是靠做目錄分類搜索起家,也同樣獲得了萬眾的睹目。當(dāng)1998年Google粉墨登場的時候,所有人都眼前一亮。如果說雅虎的出現(xiàn)在搜索的歷史上具有開創(chuàng)性意義的話,那么Google的出現(xiàn)則具有革命性的意義。它用機器人程序自動抓取資料取代了以往的人工分類方式,使查詢更加快捷;用戶獲得的不再是一個個網(wǎng)站地址,而是海量的網(wǎng)頁信息。2002年10月9日,雅虎放棄了自己的網(wǎng)站目錄搜索,改為默認(rèn)Google的搜索結(jié)果,這標(biāo)志著第二代搜索引擎正式取代了第一代搜索引擎(2004年,雅虎結(jié)束了同Google的合作,推出了自己新的第二代搜索引擎,重新進入搜索市場)。在中國市場上,橫空出世的百度同樣在搜索市場上取代了新浪、搜狐,成為中國第二代搜索引擎的代表。從1998年到現(xiàn)在,7年過去了。在這7年里,Google從小到大到上市到現(xiàn)在成為互聯(lián)網(wǎng)行業(yè)的領(lǐng)頭羊。7年里,全球互聯(lián)網(wǎng)用戶已經(jīng)從1億增加到了10億。7年里,互聯(lián)網(wǎng)企業(yè)經(jīng)歷了“燒錢”時代的“輝煌”、泡沫破滅時候的“落寞”以及現(xiàn)在的浴火重生。7年里,這個世界天翻地覆,但搜索引擎卻沒有根本性地進化,始終停留在第二代的窠臼里。當(dāng)然,這7年里,搜索引擎也有很多變化,比如不再是單一的網(wǎng)頁搜索,還出現(xiàn)了新聞搜索、圖片搜索、MP3搜索、本地搜索、地圖搜索等等,另外搜索的速度更快,抓取的網(wǎng)頁更多等等。但在技術(shù)上,目前的搜索引擎并沒有根本性的突破,用戶的搜索體驗并沒有根本性的改變。7年前,我們在一個搜索引擎的輸入框里輸入一個關(guān)鍵詞,點擊搜索,我們得到了成千上萬的搜索結(jié)果,我們欣喜雀舞;今天,我們同樣在一個搜索引擎的輸入框里輸入一個關(guān)鍵詞,點擊搜索,我們更快地得到了更多的搜索結(jié)果,但我們卻愁眉不展,因為我們終于認(rèn)識到:搜索結(jié)果的多少并不重要。不管我們搜索的結(jié)果有1千萬條還是1億條,很多時候我們所需要的只是其中一條。問題是,我們不知道這一條在哪里,我們無法在這千萬條中找到我們所需要的那一條。7年前如此,如今依然如此。對搜索引擎企業(yè)來說,7年的時間也許并不長,并不足以讓他們完成從第二代到第三代的蛻變,但對互聯(lián)網(wǎng)用戶來說,7年太漫長了,我們早就已經(jīng)迫不及待地等待著第三代搜索引擎的來臨了。第三代搜索引擎技術(shù)的特征第一代和第二代搜索引擎都有自己的核心技術(shù),第一代是人工分目錄檢索,第二代是機器程序抓取網(wǎng)頁和計算機算法,由此類推,第三代搜索引擎也必然會有自己的核心技術(shù)。“第三代搜索引擎技術(shù)是什么?”記者以為這對搜索領(lǐng)域里的專家而言是一個非常簡單的問題,事實證明記者錯得很厲害?!盎ヂ?lián)網(wǎng)的搜索技術(shù)正在演變之中?!眲倓偵先蔚囊凰芽偨?jīng)理李銳對記者說。在他看來,目前的搜索引擎正處在從第二代向第三代“漸變”的過程之中,是一個“量”的積累。在目前的這個階段,很多公司都在進行一些嘗試,很難分清哪些技術(shù)是第二代的,哪些是第三代的。新浪副總經(jīng)理程炳皓同意這一點,但他同時還指出:“我們是先承認(rèn)雅虎和Google的王者地位,然后才承認(rèn)它們所代表的第一代和第二代搜索引擎技術(shù)的。”言下之意:只要新的王者誕生,它所代表的互聯(lián)網(wǎng)搜索技術(shù)就會自然被奉為第三代搜索引擎技術(shù)。中國搜索總裁陳沛對此有不同的看法:“互聯(lián)網(wǎng)的搜索技術(shù)從根本上只有兩種,那就是分目錄搜索和關(guān)鍵詞網(wǎng)頁搜索,未來的第三代搜索引擎只能是這兩種的融合。”然而,陳沛的這一觀點受到了許多人的抨擊,被認(rèn)為過于草率?!叭绻f搜索技術(shù)只有這兩種,第三代就是這兩者的融合,那第四代呢?是不是說第三代就已經(jīng)是搜索技術(shù)的盡頭了?”一位專家這樣質(zhì)疑道。專家們在“第三代搜索引擎技術(shù)是什么?”上各執(zhí)一詞,也使得記者一頭霧水(也許現(xiàn)在談這個問題真的為時過早),但也并非一無所獲,至少在他們對第三代搜索引擎的一些描述中都有一些共性的特征。通過這些特征,我們也許能對未來的第三代搜索引擎了解一二,就像我們無法了解一位初識者的性格、為人,但我們起碼可以描述出他(她)看起來的模樣。我們認(rèn)為,第三代搜索引擎應(yīng)該具有以下三個“模樣”特征:智能化、個性化和社區(qū)化。智能化:目前的搜索引擎能夠給人們提供海量的搜索結(jié)果,一次搜索往往會有成百上千頁的結(jié)果,實踐表明,很少有人會看10頁以后的搜索結(jié)果。未來的搜索引擎必須要引入人工智能技術(shù),嘗試去理解用戶的查詢意圖,并優(yōu)先顯示用戶需要的結(jié)果。目前比較可行的智能化技術(shù)除了智能糾錯外,還有分類和聯(lián)想等。個性化:每個人的搜索習(xí)慣和需求都不一樣,但目前的搜索引擎卻無法考慮到這一點。對于同一個關(guān)鍵詞,一個搜索引擎給予所有用戶的搜索結(jié)果都是一模一樣的。未來的搜索引擎必須要考慮到用戶的個性化需求,不僅要給出符合不同用戶需求的不同結(jié)果,連搜索結(jié)果的界面都應(yīng)該有所區(qū)別。社區(qū)化:未來搜索引擎本身就是一個社交網(wǎng)絡(luò),通過用戶的互動交流,我們可以更快、更方便地獲取信息。另外,每個人的搜索結(jié)果都可以存儲并能和其他人分享?;ヂ?lián)網(wǎng)門戶的終結(jié)模式:“網(wǎng)絡(luò)豬”其實,“搜狗”的所謂“互動式搜索提示”是一種典型的搜索結(jié)果細分技術(shù),的確具有一些第三代搜索引擎的智能化特征。例如:用戶輸入“綠茶”一詞,搜索引擎會快速將綠茶可能出現(xiàn)的主題進行分類,給出例如茶文化、健康知識、電影介紹、化妝品等等主題提示,用戶點擊自己所需的類別就可以輕松找到答案。但僅僅根據(jù)這一點就得出“搜狗”是第三代搜索引擎的結(jié)論,恐怕有些牽強。另外,“搜狗”并不是第一個應(yīng)用互動式搜索技術(shù)的搜索引擎。早在2003年8月,當(dāng)時還是“慧聰搜索”的中國搜索就已經(jīng)具有了類似智能化分類搜索(智能導(dǎo)航)的功能。在接受記者采訪時,陳沛明確表示:中搜的“網(wǎng)絡(luò)豬”才是真正的“第三代搜索引擎”。事實上,在記者看來,“網(wǎng)絡(luò)豬”的確比“搜狗”具有更多的第三代搜索引擎特征,比如個性化的個人主頁和基于RSS技術(shù)的定制功能。但在競爭對手們看來,“網(wǎng)絡(luò)豬”是一大堆應(yīng)用的大雜燴,就搜索引擎而言,是一個邊緣化的產(chǎn)品??陀^而言,“網(wǎng)絡(luò)豬”的確同現(xiàn)有的主流搜索引擎格格不入。但從另外一種角度來說,也許正是因為它不同于第二代主流搜索引擎,所以它更具有成為第三代搜索引擎的潛質(zhì)。陳沛預(yù)計,與“網(wǎng)絡(luò)豬”類似的產(chǎn)品將會陸續(xù)出現(xiàn)并逐漸成為市場的主流。他還毫不客氣地表示,“網(wǎng)絡(luò)豬”們將會成為各搜索門戶乃至傳統(tǒng)互聯(lián)網(wǎng)門戶的終結(jié)殺手。與陳沛的“咄咄逼人”相比,程炳皓就顯得極為內(nèi)斂和謙虛。他說:“我們從來沒有說過自己是第三代搜索引擎?!笔堑?記者的確沒有從新浪方面聽到類似的話。但是,新浪在各種公開的資料中無數(shù)次地提到:新浪愛問突破了由Google、百度為代表的“關(guān)鍵字密度搜索算法”模式。而所謂的“關(guān)鍵字密度搜索算法”實際上就是機器抓取,算法排序的模式,這是第二代搜索引擎的關(guān)鍵技術(shù)。記者不知道突破了第二代搜索引擎技術(shù)的搜索引擎不是第三代是什么!實際上,新浪不必過于謙遜。新浪的知識搜索的確具有典型的第三代搜索引擎的“社區(qū)化”特征,幾乎所有人也都認(rèn)為新浪愛問正在做一個非常有意義的嘗試,也必將成為未來的趨勢,這一點從百度亦步亦趨地推出類似的“百度知道”就可看出。在中國市場上,百度靠打敗雅虎和Google這兩個“神話”而創(chuàng)造了自己的“神話”,但百度的成功一向都建立在模仿別人的基礎(chǔ)之上。百度是中國搜索市場當(dāng)之無愧的領(lǐng)導(dǎo)者,但在技術(shù)創(chuàng)新上,它甚至還不如中搜這樣的公司,真正的搜索技術(shù)領(lǐng)導(dǎo)者還是Google和雅虎。Google正在建立自己的用戶系統(tǒng),目的就是收集、了解用戶的使用習(xí)慣和需求,以為用戶推出個性化的搜索服務(wù)。雅虎實驗室也在研究第三代搜索引擎方面的技術(shù)。當(dāng)然,要把這些技術(shù)引入中國,還需要一個本地化的過程。小型試驗android”質(zhì)量很高,我看你演得了同學(xué)們,請安靜!現(xiàn)在開始上課。搜狗同學(xué),請不要東張西望!什么?你在找網(wǎng)絡(luò)豬?他今天不會來了,由他的哥哥中搜同學(xué)替他來上課。再說了,你一條狗老同一頭豬在一起算怎么回事?Google同學(xué),怎么剛上課你就開始打瞌睡了?不要看別人,說得就是你!什么?Icouldn’tcatchyou?你是說你聽不懂我的話吧?Google同學(xué)啊!一定要加強本土化呀!你看人家雅虎……對了,雅虎同學(xué),請幫忙做一下翻譯。什么?你是一搜?不好意思,又搞混了,你家兄弟也太多了!Bytheway!Google同學(xué),你能不能取一個中文名字?每次我叫你的時候都覺得怪怪的。好了,言歸正傳!今天我們要進行一場課堂測試。安靜,請安靜!今天的測試成績不會計入年終總成績,不會寫入個人檔案,不會通報家長。各位同學(xué)現(xiàn)在可以放心了吧!系統(tǒng)搜索結(jié)果規(guī)則:輸入關(guān)鍵詞“電子商務(wù)世界”,在搜索結(jié)果中,如第一項是和本雜志相關(guān),加2分,如排列最前的正確結(jié)果為第2~10項,加1.5分,為11~20項的加1分,為21~30項的加0.5分。結(jié)果:Google:第一條搜索結(jié)果即《電子商務(wù)世界》雜志網(wǎng)站,得2分。百度:同樣是第一條,得2分。一搜:同樣的結(jié)果排在了第二條,得1.5分。中搜:同樣的結(jié)果排在了第三條,不過還是得1.5分。搜狗:《電子商務(wù)世界》相關(guān)得結(jié)果出現(xiàn)在第7條,得1.5分。關(guān)鍵詞的加數(shù)。云規(guī)則:輸入關(guān)鍵詞“電子商務(wù)世界”,在給出的相關(guān)搜索關(guān)鍵詞中,和電子商務(wù)相關(guān)的詞匯有9條以上的加2分,6~8條加1.5分,3~5條加1分,1~2條加0.5分,沒有為0分。結(jié)果:Google:很遺憾,沒有給出相關(guān)的搜索關(guān)鍵詞,0分。百度:相關(guān)的關(guān)鍵詞有3條,加1分。一搜:令人興奮,電子商務(wù)相關(guān)的關(guān)鍵詞竟達9條之多,加2分。愛問:只有3條相關(guān)關(guān)鍵詞,加1分。搜狗:令人抓狂的結(jié)果,給出的10個相關(guān)關(guān)鍵詞中居然無一同電子商務(wù)相關(guān),更令人難以忍受的是,竟然還出現(xiàn)了“世界頂級色情”這樣的詞匯,0分。能不能查詢相關(guān)的信息,加2分規(guī)則:輸入關(guān)鍵詞“愛國者”,如果有相關(guān)分類導(dǎo)航加1分,反之0分;如果根據(jù)導(dǎo)航能迅速查到“愛國者”MP3的相關(guān)信息,再加1分。結(jié)果:Google:沒有分類導(dǎo)航,0分。百度:沒有分類導(dǎo)航,0分。中搜:有分類導(dǎo)航,能迅速找到相關(guān)信息,加2分。搜狗:有分類導(dǎo)航,可以得到相應(yīng)結(jié)果,2分。第二測試:標(biāo)記關(guān)鍵字規(guī)則:輸入關(guān)鍵詞“司法考釋”,如果能正確給出糾錯提示“司法考試”的加2分,反之0分。Google:沒有糾錯提示,0分。第三代搜索引擎,我還很長的一段路規(guī)則:輸入關(guān)鍵詞“怎樣養(yǎng)花”或者“養(yǎng)花”(如果只承認(rèn)“養(yǎng)花”而不承認(rèn)“怎樣養(yǎng)花”,則扣0.5分),點擊相關(guān)的搜索,在結(jié)果中有相關(guān)的信息則得1分,信息量很全得再0.5分,在第一頁顯示的還加0.5分。結(jié)果:Google:在“論壇”里有很多搜索結(jié)果,但無法在第一頁找到準(zhǔn)確的信息,只能加1分。百度:在“貼吧”里輸入“怎樣養(yǎng)花”沒有結(jié)果,但輸入“養(yǎng)花”能得到大量實用信息,加1.5分。一搜:在“部落”里輸入“怎樣養(yǎng)花”沒有結(jié)果,輸入“養(yǎng)花”也只得到一條相關(guān)信息,加0.5分。中搜:在“論壇”里輸入“怎樣養(yǎng)花”沒有結(jié)果,輸入“養(yǎng)花”后得到了眾多結(jié)果,但在10條以后才找到了一條相關(guān)的信息,加1分。愛問:點擊“知識”,輸入“怎樣養(yǎng)花”,立刻得到海量的相關(guān)信息,2分。搜狗:在“說吧”里沒有任何結(jié)果,0分。仔細數(shù)來,中國已經(jīng)有不少的搜索引擎具有了第三代的某些特征,第三代搜索引擎其實離我們并不遙遠。也許有一天,代表第三代搜索引擎的王者將會在中國誕生。和記者有同樣觀點的相信還有摩根士丹利董事總經(jīng)理瑪麗·米克爾。在于今年的3月底來華密訪了兩家國內(nèi)搜索公司后,她說:“我們正在尋找下一個Google,而我堅持認(rèn)為它會出現(xiàn)在中國?!敝皇?希望我們不要等待得太久!今天這個測試的目的是想看看在座的哪一位更接近第三代搜索引擎。各位同學(xué)都知道,第三代搜索引擎的主要特征是智能化、個性化和社區(qū)化。但由于各位的水平有限,在個性化上幾乎沒有任何建樹,所以這一項完全取消。智能化是我們測試的重點,有三項,分別是關(guān)鍵詞糾錯、關(guān)鍵詞聯(lián)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論