2012級(jí)搜索引擎原理與應(yīng)用15常見術(shù)語_第1頁
2012級(jí)搜索引擎原理與應(yīng)用15常見術(shù)語_第2頁
2012級(jí)搜索引擎原理與應(yīng)用15常見術(shù)語_第3頁
2012級(jí)搜索引擎原理與應(yīng)用15常見術(shù)語_第4頁
2012級(jí)搜索引擎原理與應(yīng)用15常見術(shù)語_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2023/3/81第十五課:常見術(shù)語2023/3/82第1節(jié):SEOerSEOer即搜索引擎優(yōu)化者,指從事搜索引擎優(yōu)化的專業(yè)人員。

2023/3/83第2節(jié):PR值

PR即PageRank,是Google評(píng)估頁面重要性的算法之一,共分為十二個(gè)級(jí)別,分別是“空”及“0–10”。

PageRank算法理論:如果“網(wǎng)頁A”上存在鏈接指向“網(wǎng)頁B”,則認(rèn)為“網(wǎng)頁A”投了“網(wǎng)頁B”一票;然后,根據(jù)頁面得到的投票數(shù)及投票頁面的質(zhì)量來評(píng)定頁面的重要性。

2023/3/84第3節(jié):WebRank

WebRank是Yahoo系搜索引擎用于評(píng)估網(wǎng)頁“重要性”的算法。2023/3/85第4節(jié):SogouRank類別于Google的PageRank,SougouRank是搜狗評(píng)估網(wǎng)頁“重要性”的算法。

2023/3/86第5節(jié):頁面收錄數(shù)頁面收錄數(shù)是指某網(wǎng)站被搜索引擎收錄頁面的數(shù)量,可以在搜索引擎中通過搜索“site:你的域名”進(jìn)行查詢。

2023/3/87第6節(jié):頁面包含數(shù)頁面包含數(shù),指網(wǎng)站的域名被其他頁面引用的情況,從一定程度上反映了網(wǎng)站的知名度。2023/3/88第7節(jié):鏈接廣泛度

鏈接廣泛度指某網(wǎng)站的導(dǎo)入鏈接情況,我們可以通過在搜索引擎中搜索“l(fā)ink:你的網(wǎng)址”查詢某網(wǎng)站導(dǎo)入鏈接的情況。2023/3/89第8節(jié):RobotRobot,中文翻譯為機(jī)器人,指搜索引擎中負(fù)責(zé)抓取信息的程序,又稱為Spider,即蜘蛛程序。2023/3/810第9節(jié):Robot.txt

Robots.txt是一個(gè)純文本文件,用于限制搜索引擎對(duì)網(wǎng)站頁面的訪問。如果“robots.txt”是一個(gè)空文件,則說明該網(wǎng)站對(duì)于所有搜索引擎都是開放的,而且允許其訪問網(wǎng)站中所有內(nèi)容。

2023/3/811第9-1節(jié):Robots.txt語法

“Robots.txt”文件中包含一條或多條記錄,每條記錄通過空行分隔(注釋標(biāo)記為“#”),以User-agent開始,后面加上Disallow。例如:User-agent:*Disallow:/Admin/2023/3/812第9-1-1節(jié):User-agent如果有多條User-agent記錄,則說明有多個(gè)robot會(huì)受到該協(xié)議的限制;至少有一條User-agent記錄如果該項(xiàng)的值設(shè)為“*”,則該協(xié)議對(duì)所有機(jī)器人均有效,但這樣的記錄只能出現(xiàn)一次。2023/3/813第9-1-2節(jié):Disallow用于描述不希望被搜索引擎訪問的目錄或URL,任何以Disallow開頭的URL或者目錄均不會(huì)被robot訪問。如果為空,說明該網(wǎng)站的所有內(nèi)容都是允許訪問;至少要有一條Disallow記錄;2023/3/814第9-1-3節(jié):例子(1)禁止所有搜索引擎訪問網(wǎng)站的任何部分

User-agent:*Disallow:/(2)允許所有的robot訪問

User-agent:*Disallow:(3)禁止所有搜索引擎訪問網(wǎng)站中的某些部分

User-agent:*Disallow:/cgi-bin/Disallow:/tmp/Disallow:/private/(4)禁止某個(gè)搜索引擎訪問本站

User-agent:搜索引擎蜘蛛程序名稱

Disallow:/(5)只允許某個(gè)搜索引擎的訪問本站

User-agent:搜索引擎蜘蛛程序名稱

Disallow:2023/3/815第9-2節(jié):Robotsmeta標(biāo)簽

Robotsmeta標(biāo)簽用于限制搜索引擎對(duì)當(dāng)前頁面的抓取,存放在網(wǎng)頁的頭部中。NOINDEX-不索引當(dāng)前頁面;NOFOLLOW-不跟蹤當(dāng)前頁面中所有的鏈接;NOARCHIVE-在搜索結(jié)果中不保存當(dāng)前頁面的快照;NOSNIPPET-在搜索結(jié)果中不采用當(dāng)前頁面的頭部描述信息,且不保存當(dāng)前頁面的快照。NOODP-搜索結(jié)果中不使用ODP信息。

2023/3/816第9-3節(jié):常見Robots名稱

Google:Googlebot,是Google的web抓取程序的名稱。百度:Baiduspider,是百度的web抓取程序的名稱。雅虎:Yahoo!

Slurp,是雅虎的web抓取程序的名稱。2023/3/817第10節(jié):SpamSpam即垃圾信息。在搜索引擎優(yōu)化領(lǐng)域,垃圾信息包括:垃圾網(wǎng)站、垃圾鏈接、垃圾頁面等。垃圾頁面:通常指存在違規(guī)行為的頁面,例如:堆砌關(guān)鍵字、隱藏關(guān)鍵字等;垃圾網(wǎng)站:由于采取違規(guī)手段而遭到搜索引擎封殺的網(wǎng)站;垃圾鏈接:指通過非正常手段獲取大量鏈接的行為。2023/3/818第11節(jié):垃圾鏈接制造廠垃圾鏈接制造廠(Linkspamer),指存放大量鏈接的低質(zhì)量頁面或者網(wǎng)站。2023/3/819第12節(jié):停用詞指一些使用頻繁但又沒有實(shí)際意義的詞語,例如:在中文里“的”、“地”、“得”等;英文里“the”,“of”,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論