
18012010500
客服/技術(shù)服務(wù)電話(huà)15862182510
24小時(shí)服務(wù)/投訴電話(huà)15852229637
很遺憾,因您的瀏覽器版本過(guò)低導(dǎo)致無(wú)法獲得最佳瀏覽體驗(yàn),推薦下載安裝谷歌瀏覽器!
網(wǎng)站優(yōu)化我們接觸的是網(wǎng)站,接觸的是搜索引擎,既然如此,那么我們就必須對(duì)搜索引擎有一 定的了解,只有這樣才能做出效果。嚴(yán)格來(lái)說(shuō)搜索引擎是通過(guò)一種“爬蟲(chóng)(蜘蛛)”這樣的計(jì)算機(jī)程序來(lái)抓取我們網(wǎng)頁(yè)上面的信息的,總體來(lái)講,搜索引擎爬蟲(chóng)的工作原理一共分為抓取、過(guò)濾、收錄索引、排序四大環(huán)節(jié),下面江蘇遼闊信息科技和你一起來(lái)看一下。
抓取環(huán)節(jié)是第 一步,搜索引擎收錄你網(wǎng)頁(yè)的第 一步,它是指搜索引擎爬蟲(chóng)通過(guò)鏈接訪(fǎng)問(wèn)你的網(wǎng)站,進(jìn)而進(jìn)行深度和廣度的抓取,深度抓取是指從上至下抓取,廣度抓取則是指從左往右抓取,并且這兩種抓取方式都是同時(shí)進(jìn)行的。通常爬蟲(chóng)會(huì)抓取你網(wǎng)頁(yè)上的文字、鏈接、圖片等等信息,或者從嚴(yán)格意義上說(shuō),爬蟲(chóng)其實(shí)抓取的是你當(dāng)前網(wǎng)頁(yè)的代碼。
過(guò)濾環(huán)節(jié)是指當(dāng)前頁(yè)面信息被爬蟲(chóng)抓取之后,它會(huì)將抓取的信息放入搜索引擎的一個(gè)臨時(shí)數(shù)據(jù)庫(kù)中,這個(gè)臨時(shí)數(shù)據(jù)庫(kù)是用來(lái)暫時(shí)存放和篩選過(guò)濾信息的容器,爬蟲(chóng)將抓取到的信息放入臨時(shí)數(shù)據(jù)庫(kù)中之后,接著它就會(huì)繼續(xù)去別的網(wǎng)站執(zhí)行任務(wù)去了。而暫時(shí)存放在臨時(shí)數(shù)據(jù)庫(kù)中的網(wǎng)頁(yè)信息這個(gè)時(shí)候?qū)⒈桓鶕?jù)頁(yè)面的質(zhì)量接受篩選過(guò)濾處理,從而決定該頁(yè)面是否被收錄還是被過(guò)濾掉,這就是一個(gè)過(guò)濾的環(huán)節(jié)。
收錄環(huán)節(jié)在這里指的是那些存放在搜索引擎臨時(shí)數(shù)據(jù)中,通過(guò)篩選環(huán)節(jié)并且順利通過(guò)考核的頁(yè)面,則會(huì)進(jìn)入到收錄環(huán)節(jié)。但是該頁(yè)面被收錄并不意味著可以被搜索到,它還需要有更具實(shí)際意義的索引,這樣才能被用戶(hù)搜索查詢(xún)到,所以在這里收錄并不等于索引。
很多站長(zhǎng)都認(rèn)為網(wǎng)頁(yè)是需要先被搜索引擎收錄之后才被索引,其實(shí)這是一種不正確的認(rèn)識(shí)。一個(gè)被收錄的網(wǎng)頁(yè)我們可以通過(guò)搜索該頁(yè)面的鏈接地址查看到結(jié)果,但是當(dāng)我們?nèi)ニ阉鳟?dāng)前網(wǎng)頁(yè)全標(biāo)題的時(shí)候卻找不到,其實(shí)這就是網(wǎng)頁(yè)被收錄了,但是并沒(méi)有被索引的情況。正是因?yàn)樵擁?yè)面沒(méi)有進(jìn)入搜索引擎的索引庫(kù)當(dāng)中,所以用戶(hù)無(wú)法檢索到。
排序通常都是后一個(gè)環(huán)節(jié)了,一旦你的網(wǎng)頁(yè)通過(guò)了收錄索引這個(gè)環(huán)節(jié),那么這個(gè)時(shí)候其實(shí)就可以參與排序檢索了,但是通常網(wǎng)頁(yè)排序又會(huì)跟眾多因素有關(guān),所以我們是無(wú)法保證該頁(yè)面的排序位置的。不過(guò)在這其中直觀的影響應(yīng)該還是網(wǎng)頁(yè)內(nèi)容質(zhì)量和網(wǎng)站的權(quán)重,這兩者影響非常大,這也是為什么有的老網(wǎng)站發(fā)布一篇帖子就能排名在首頁(yè),而你發(fā)布一篇帖子排名都找不到的原因之一。