




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、深入剖析搜索引擎蜘蛛工作對SEO的提升seo分析什么是搜索引擎蜘蛛搜索引擎蜘蛛是搜索引擎自身的一個(gè)程序,它的作用是對網(wǎng)站的網(wǎng)頁進(jìn)行訪問,抓取網(wǎng)頁的文字、圖片等信息,建立一個(gè)數(shù)據(jù)庫,反饋給搜索引擎,當(dāng)用戶搜索的時(shí)候,搜索引擎就會(huì)把收集到的信息過濾,通過復(fù)雜的排序算法將它認(rèn)為對用戶最有用的信息呈現(xiàn)出來。優(yōu)化網(wǎng)站可能會(huì)涉及到幾個(gè)蜘蛛抓取相關(guān)的概念:爬取率:既定時(shí)間內(nèi)網(wǎng)站被蜘蛛獲取的頁面數(shù)量。爬取頻率:搜索引擎多久對網(wǎng)站或單個(gè)網(wǎng)頁發(fā)起一次新的爬行。爬取深度:一個(gè)蜘蛛從開始位置可以點(diǎn)擊到多深。爬取飽和度:唯一頁面被獲取的數(shù)量。爬取優(yōu)先:那些頁面最常作為蜘蛛的入口。爬取冗余度:網(wǎng)站一般被多少蜘蛛同時(shí)爬取。
2、.爬取mapping:蜘蛛爬取路徑還原。如何進(jìn)行這些蜘蛛概念的分析,使其為我們網(wǎng)站服務(wù)分析爬取率驗(yàn)證模糊經(jīng)驗(yàn)理論提高爬取頻率提高提升收錄研究蜘蛛爬取習(xí)慣并優(yōu)化習(xí)慣分析爬取率驗(yàn)證模糊經(jīng)驗(yàn)理論一分析搜索引擎蜘蛛首先會(huì)考慮的一個(gè)參數(shù)就是爬取量,一般我們考慮蜘蛛爬取量的單位是以一天為一個(gè)時(shí)間段,那么我們很多時(shí)候考慮的就是一天時(shí)間內(nèi)的爬取率。當(dāng)然,你也可以根據(jù)自己的需要調(diào)整時(shí)間段的限定,如劃分到每個(gè)小時(shí),來充分了解各個(gè)時(shí)間段的蜘蛛的抓取情況,然后針對性的做一些調(diào)整。其中我覺得一類分析可以給我們帶來很多的成就感,即對于一些模糊經(jīng)驗(yàn)理論的驗(yàn)證。分析爬取率驗(yàn)證模糊經(jīng)驗(yàn)理論二例如我們經(jīng)常聽到這樣一句話:“做網(wǎng)站
3、內(nèi)容的時(shí)候要定時(shí)定量的更新,培養(yǎng)搜索引擎蜘蛛的抓取習(xí)慣,隨意的改變更新時(shí)間,可能影響蜘蛛對網(wǎng)站內(nèi)容的抓取”,這句話到底正確不正確呢?這里就可以運(yùn)用網(wǎng)站的日志進(jìn)行分析搜索引擎蜘蛛的抓取率來解釋。如果我們要分析一個(gè)站,比如貸貸網(wǎng),具體的操作方法就是對一個(gè)月內(nèi)每天每個(gè)小時(shí)段的蜘蛛抓取情況進(jìn)行拆分統(tǒng)計(jì)(注意數(shù)據(jù)樣本選取的合理性),然后對每個(gè)時(shí)間段進(jìn)行分析,對比就可以發(fā)現(xiàn)哪個(gè)時(shí)間段搜索引擎蜘蛛來的比較勤,再和自己做內(nèi)容更新的情況進(jìn)行一個(gè)對比就可以很快的得出結(jié)論。提高爬取頻率提高提升收錄一搜索引擎蜘蛛的爬取頻率很多時(shí)候是由網(wǎng)站內(nèi)容質(zhì)量決定的,因?yàn)橹挥芯W(wǎng)站有更新鮮更好的內(nèi)容,才能更吸引蜘蛛來反復(fù)抓取,例如很
4、多大型的內(nèi)容型網(wǎng)站,每天更新大量的內(nèi)容,這樣就把蜘蛛一直留在了站內(nèi),頁面抓取的頻率自然會(huì)提高。而提升了爬取頻率,對于頁面中內(nèi)容和鏈接的更新就會(huì)被搜索引擎蜘蛛更快的抓取到,能夠更充分的收錄網(wǎng)站的頁面內(nèi)容信息。提高爬取頻率提高提升收錄二很多朋友都說自己的網(wǎng)站快照不更新,或者滯后好幾天,個(gè)人覺得也是蜘蛛抓取的頻率不夠造成的。要想快照更新快,特別是新站,前期一定要多做內(nèi)容建設(shè),內(nèi)容頁面如果沒有內(nèi)容的更新,一般蜘蛛可能不會(huì)抓取收錄,或者抓取了但是不返回?cái)?shù)據(jù),當(dāng)下次用戶搜索時(shí)候可能就會(huì)調(diào)用搜索引擎數(shù)據(jù)庫中存儲(chǔ)的一些數(shù)據(jù)。研究蜘蛛爬取習(xí)慣并優(yōu)化習(xí)慣一至于后面談到搜索引擎蜘蛛的爬取深度,飽和度,優(yōu)先爬取,冗余
5、度以及爬取路徑都是對于蜘蛛爬取習(xí)慣和爬取策略的研究,因?yàn)樽约阂矝]有針對性的去實(shí)踐分析,所以只能在理論上談?wù)勛约旱囊恍┫敕āQ芯恐┲肱廊×?xí)慣并優(yōu)化習(xí)慣二搜索引擎蜘蛛的爬取深度如果不夠深,主要是因?yàn)榫W(wǎng)站在結(jié)構(gòu)布局的時(shí)候沒有考慮到這蜘蛛是否能夠充分抓取或者是否按照一層一層的抓取,這里就涉及到鏈接入口的布局,也就會(huì)考慮到蜘蛛爬取優(yōu)先的一些入口,很多時(shí)候?qū)σ恍┐蟮木W(wǎng)站做診斷,來提升其流量和收錄主要的策略布局就是優(yōu)化蜘蛛抓取優(yōu)先的入口,實(shí)現(xiàn)的方法就是采用nofollow標(biāo)簽屏蔽一些頁面。還需要分析的可能是爬取的飽和度,因?yàn)閷τ趩蝹€(gè)頁面的爬取太多是在浪費(fèi)蜘蛛資源,我們?nèi)绻軌蜻m當(dāng)?shù)目刂七@些資源的分配,那么對于頁面的抓取和收錄的提升肯定有很大的幫助。研究蜘蛛爬取習(xí)慣并優(yōu)化習(xí)慣至于冗余度和爬取路徑可能就需要大家再深入的分析,后面如果還有深入的文章會(huì)再和大家一起探討蜘蛛抓取的情況。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 驚喜發(fā)現(xiàn)衛(wèi)生管理考試中的試題及答案
- 獲取光電工程師證書考試知識(shí)試題及答案
- 育嬰師護(hù)理技巧解析試題及答案
- 血液循環(huán)試題講解及答案
- 激光技術(shù)發(fā)展趨勢探討試題及答案
- 育嬰師職業(yè)規(guī)則與考試內(nèi)容的關(guān)系試題及答案
- 算法英語面試題及答案
- 社會(huì)適應(yīng)性與個(gè)體心理之間的互動(dòng)試題及答案
- 國際專利申請流程探討試題及答案
- 網(wǎng)絡(luò)規(guī)劃設(shè)計(jì)師考試移動(dòng)網(wǎng)絡(luò)知識(shí)試題及答案
- 人力資源許可證制度(服務(wù)流程、服務(wù)協(xié)議、收費(fèi)標(biāo)準(zhǔn)、信息發(fā)布審查和投訴處理)
- JTG-T-F20-2015公路路面基層施工技術(shù)細(xì)則
- 江蘇省蘇州市2023-2024學(xué)年五年級(jí)下學(xué)期期中綜合測試數(shù)學(xué)試卷(蘇教版)
- 發(fā)成果轉(zhuǎn)化項(xiàng)目可行性研究報(bào)告(定稿)
- 《起重行車安全操作培訓(xùn)》ppt
- (完整版)譯林英語四年級(jí)下知識(shí)點(diǎn)及語法匯總
- 急性闌尾炎護(hù)理查房ppt
- 蘇教版五年級(jí)數(shù)學(xué)下冊第四單元易錯(cuò)題梳理和重難提升(含答案)
- 西安市綠化養(yǎng)護(hù)管理標(biāo)準(zhǔn)
- 一只貓的生命哲學(xué)The Zen of Cat(中英文)
- 中外酒店財(cái)務(wù)管理比較研究2
評論
0/150
提交評論