假設(shè)網(wǎng)站使用虛擬空間,就會有一定的流量限制。假設(shè)大部分流量都被蜘蛛占用,我們需要花一些錢來購買流量。因此,假設(shè)一個網(wǎng)站有大量的流量被蜘蛛浪費(fèi)掉了。什么技能和方法可以用來限制搜索引擎而不影響其優(yōu)化?數(shù)字商圈認(rèn)為,我們可以使用以下方法:
找出IP屏蔽的假蜘蛛
通過分析網(wǎng)站日志,我們可以知道許多所謂的百度蜘蛛或谷歌蜘蛛實(shí)際上是假的。我們可以屏蔽這些假冒蜘蛛的IP地址,這不僅可以節(jié)省流量,還可以降低網(wǎng)站收集的風(fēng)險。在詳細(xì)操作中,需要檢查IP是否是真正的爬行器。操作方法如下:單擊Start-run-CMD-輸入命令nslookupip,然后按enter鍵查看結(jié)果。假設(shè)真正的搜索蜘蛛有一個蜘蛛符號,而假的蜘蛛沒有符號
2。屏蔽無效蜘蛛或?qū)?a href="http://www.musclememorymassage.com/wangzhanseo/" >搜索引擎優(yōu)化影響不大的搜索蜘蛛
例如,我們知道谷歌蜘蛛有大量的爬行,但對于許多行業(yè)來說,谷歌的流量非常低,搜索引擎優(yōu)化不好,因此我們可以屏蔽谷歌蜘蛛的爬行,節(jié)省大量流量。例如,美麗說,該網(wǎng)站阻止了谷歌蜘蛛的爬行。除了谷歌,還有一些蜘蛛,比如盤古搜索和必應(yīng)蜘蛛,它們的流量非常低。也許效果甚微的蜘蛛實(shí)際上可以被屏蔽。使用robot限制捕獲無效頁面或重復(fù)頁面
一些頁面可能以前存在,但現(xiàn)在不存在。可能存在動態(tài)和靜態(tài)URL。由于數(shù)據(jù)庫中存在反向鏈接或此類鏈接,爬行器仍會不時爬行。我們可以找到404頁的URL并屏蔽它們。這不僅提高了爬行屏蔽,還減少了流量浪費(fèi)
上圖顯示:控制爬行器對網(wǎng)站進(jìn)行爬行以對頁面進(jìn)行爬行
seo優(yōu)化效果" />
4,限制頁面的爬行內(nèi)容以提高爬行能力和爬行速度,并減少爬行流量
對于任何頁面,都有許多無效噪音區(qū)域,如登錄、注冊部分、,下面是版權(quán)信息和一些有用的網(wǎng)站鏈接導(dǎo)航,或者有些模板上有一些Spider無法識別的演示模塊。我們可以使用nofflow標(biāo)記或Ajax、JS和其他方法來限制或屏蔽爬行,以減少爬行量
5。外部呼叫或CDN加速可以改善爬行器的爬行,減少服務(wù)器的響應(yīng)和流量浪費(fèi)
如今,大多數(shù)網(wǎng)站使用許多圖片、視頻和其他多媒體來顯示,而這些圖片缺乏更多的下載流量。如果我們使用外部調(diào)用圖片的方法,我們可以節(jié)省大量的蜘蛛流量。現(xiàn)在,更好的方法是將圖片放在其他服務(wù)器上,或?qū)⑵渖陷d到一些網(wǎng)絡(luò)磁盤
6。使用站長限制或改進(jìn)蜘蛛的爬行,或限制蜘蛛的爬行時間
現(xiàn)在百度站長頻道和谷歌站長頻道都有站長爬行,可以用來限制蜘蛛的爬行時間和數(shù)量。我們可以根據(jù)需要合理分配,達(dá)到效果
當(dāng)然,在實(shí)踐中,我們也可以根據(jù)自己的實(shí)際需要來處理。例如,我們可以在sitemap中為一些爬網(wǎng)量過大的列設(shè)置較低的爬網(wǎng)頻率,如果某些重要內(nèi)容輸入不正確,我們可以添加外部鏈或內(nèi)部鏈來改進(jìn)爬網(wǎng)。該方法已失效。我們可以根據(jù)詳細(xì)更新合理化設(shè)置,以實(shí)現(xiàn)更少的爬網(wǎng)和更高的爬網(wǎng)能力。