所謂的seo優(yōu)化就是讓你的網(wǎng)站被搜索引擎收錄,并能排名在一個好位置。要被搜索引擎收錄,你必須首先贏得搜索引擎蜘蛛的愛。只有當蜘蛛在你的網(wǎng)站上爬行時,它才能被包括在內(nèi)。讓我們來了解一下搜索引擎蜘蛛是什么,以及搜索引擎優(yōu)化應該做什么:
搜索引擎蜘蛛通常指的是:網(wǎng)絡爬蟲
網(wǎng)絡爬蟲(也稱為網(wǎng)絡蜘蛛,網(wǎng)絡機器人,在FOAF社區(qū)更常被稱為網(wǎng)絡追蹤器),是一個軟件程序,可以自動處理一系列網(wǎng)絡事務,無需人工干預。它是根據(jù)特定規(guī)則自動捕獲萬維網(wǎng)信息的程序或腳本。其他不常用的名稱包括螞蟻、自動索引、模擬器或蠕蟲
搜索引擎爬蟲如何工作
網(wǎng)絡&;lt;--&;gt;Crawler&;lt;--&;gt;&;網(wǎng)絡內(nèi)容庫;lt;--&;gt;索引器&;lt;--&;gt;索引庫&;lt;--&;gt;搜索引擎&;lt;--&;gt;用戶
爬行動物分類:
通用網(wǎng)絡爬蟲
又稱全網(wǎng)爬蟲,爬蟲對象從一些種子URL擴展到整個web,主要為門戶網(wǎng)站、搜索引擎和大型web服務提供商收集數(shù)據(jù)。由于商業(yè)原因,它們的技術細節(jié)很少公布。該結構大致可分為幾個部分:頁面爬行模塊、頁面分析模塊、鏈接過濾模塊、頁面數(shù)據(jù)庫、URL隊列和初始URL收集
關注網(wǎng)絡爬蟲
也稱為主題爬蟲,它指的是有選擇地抓取與預定義主題相關的頁面的網(wǎng)絡爬蟲[8]。與普通網(wǎng)絡爬蟲相比,焦點爬蟲只需抓取與主題相關的頁面,大大節(jié)省了硬件和網(wǎng)絡資源。由于數(shù)量較少,保存的頁面也會快速更新。它還可以很好地滿足某些特定人群對特定領域信息的需求
增量網(wǎng)絡爬蟲
它指的是以增量方式更新下載的網(wǎng)頁的爬蟲程序,只對新生成或更改的網(wǎng)頁進行爬蟲。它可以確保爬行頁面在一定程度上盡可能新。增量爬蟲僅在需要時對新生成或更新的頁面進行爬網(wǎng),不會再次下載未更改的頁面。它可以有效地減少數(shù)據(jù)下載量,但增加了爬行算法的復雜度和實現(xiàn)難度
DeepWebcrawler
根據(jù)存在方式,它可以分為表層網(wǎng)頁和深層網(wǎng)頁。表面網(wǎng)頁是指傳統(tǒng)搜索引擎可以索引的網(wǎng)頁,網(wǎng)頁主要由靜態(tài)網(wǎng)頁組成,這些網(wǎng)頁可以通過超鏈接訪問。DeepWeb是一個無法通過靜態(tài)鏈接獲得的網(wǎng)頁,隱藏在搜索表單后面,只能通過用戶提交一些關鍵字
獲得。蜘蛛陷阱
它是阻止蜘蛛程序在網(wǎng)站上爬行的障礙。它通常是顯示網(wǎng)頁的技術方法。目前,許多瀏覽器在設計時都考慮了這些因素,因此web界面可能看起來很正常,但這些蜘蛛陷阱會給蜘蛛程序帶來障礙。如果這些蜘蛛陷阱被消除,蜘蛛程序能包含更多的網(wǎng)頁嗎?在搜索引擎優(yōu)化工作中,網(wǎng)頁的收集是基礎工作,但對于搜索引擎來說,在極少數(shù)情況下,它們將100%包含您網(wǎng)站的所有網(wǎng)頁。無論爬蟲程序設計多么精致,都很難克服@thespidertrap
了解蜘蛛后,根據(jù)蜘蛛的特點,在SEO中應該做些什么來取悅搜索引擎蜘蛛
突出重要內(nèi)容
合理的標題、描述和關鍵詞
標題:只強調(diào)重點。重要的關鍵詞不應出現(xiàn)兩次以上,每頁的標題應不同。說明:此處高度概括網(wǎng)頁內(nèi)容,長度應合理。不要把關鍵詞堆得太多。每一頁的描述應該是不同的。關鍵詞:列出幾個重要的關鍵詞,不要堆積太多
2。在語義上編寫符合W3C標準的HTML代碼
對于搜索引擎來說,最直接的界面是網(wǎng)頁的HTML代碼。如果代碼是按語義編寫的,搜索引擎將很容易理解網(wǎng)頁
3的含義。使用布局將重要內(nèi)容HTML代碼放在頂部
搜索引擎從上到下抓取HTML內(nèi)容。使用此功能,可以先讀取主代碼,爬蟲可以先抓取它
不要使用js輸出重要內(nèi)容
爬蟲不會讀取js中的內(nèi)容,因此重要內(nèi)容必須放在HTML
5中。盡量減少使用iframe框架
搜索引擎不會捕獲iframe中的內(nèi)容,重要內(nèi)容不應放在框架中。但是現(xiàn)在他們都使用div+CSS,而且這個框架很少使用
將alt屬性添加到圖片
alt屬性的功能是在圖片無法顯示時用文本替換圖片。對于搜索引擎優(yōu)化,它可以讓搜索引擎有機會索引你網(wǎng)站的圖片
7。您可以在需要強調(diào)的地方添加title屬性
在SEO優(yōu)化中,將alt屬性設置為圖片的原始含義是合適的,而ttitle屬性則為設置屬性的元素提供提示信息
為圖片添加長度和寬度
圖片有特定的大小,沒有縮放,將位于前面
保留文本效果
如果我們需要考慮用戶體驗和SEO效果,其中必須使用圖片,例如個性化字體的標題,我們可以使用樣式控制使文本不出現(xiàn)在瀏覽器中,但網(wǎng)頁代碼中有標題
注:顯示:無可使用;因為搜索引擎會過濾掉顯示:無;蜘蛛不會搜索里面的內(nèi)容
0。提高網(wǎng)站速度
網(wǎng)站速度是搜索引擎排名的重要指標。網(wǎng)頁的圖片和代碼應盡可能簡化,網(wǎng)頁應靜態(tài)輸出。對于外部網(wǎng)站的鏈接,應使用rel="e;“不跟隨”;屬性告訴爬蟲程序不要爬網(wǎng)其他頁面。