搜索引擎是指使用特定的計(jì)算機(jī)程序,根據(jù)一定的策略從互聯(lián)網(wǎng)上收集信息。在組織和處理信息后,它為用戶(hù)提供檢索服務(wù),并將用戶(hù)檢索到的相關(guān)信息顯示給用戶(hù)。搜索引擎包括全文索引、目錄索引、元搜索引擎、垂直搜索引擎、集合搜索引擎、門(mén)戶(hù)搜索引擎和自由鏈接列表
搜索引擎的發(fā)展過(guò)程
第一代搜索引擎于1994年左右出現(xiàn),以alavista、Yahoo和ifoseek為代表。它注重反饋結(jié)果的數(shù)量,主要以“完美”為特征。它主要依靠人工對(duì)分類(lèi)目錄搜索進(jìn)行排序。通常,網(wǎng)頁(yè)制作人會(huì)創(chuàng)建自己的網(wǎng)站名稱(chēng)和網(wǎng)站內(nèi)容文本摘要,并將其添加到搜索引擎數(shù)據(jù)庫(kù)中。搜索引擎根據(jù)預(yù)設(shè)規(guī)則匹配、排序和顯示用戶(hù)輸入的信息。這種方法只能進(jìn)行簡(jiǎn)單的字符串匹配,不能進(jìn)行全文搜索
第二代搜索引擎使用基于超鏈接分析的機(jī)器捕獲技術(shù)。搜索引擎使用一個(gè)程序在網(wǎng)絡(luò)上檢索數(shù)據(jù),并將結(jié)果自動(dòng)存儲(chǔ)在索引數(shù)據(jù)庫(kù)中。搜索引擎匹配、排序并顯示用戶(hù)類(lèi)型的信息。1998年,以谷歌和directhit為代表的第二代搜索引擎出現(xiàn)在互聯(lián)網(wǎng)上。這些發(fā)動(dòng)機(jī)的主要特點(diǎn)是提高精度。他們可以用“精致”來(lái)描述它的優(yōu)勢(shì)。網(wǎng)站制作人不需要單獨(dú)輸入搜索信息。理論上,任何網(wǎng)站的所有頁(yè)面都可以添加到其數(shù)據(jù)庫(kù)中。第二代搜索引擎的大多數(shù)查詢(xún)將返回?cái)?shù)萬(wàn)條信息。查詢(xún)結(jié)果中存在過(guò)多的無(wú)關(guān)信息,查詢(xún)結(jié)果的顯示混亂。用戶(hù)仍然很難找到他們真正想要的數(shù)據(jù)
第三代搜索引擎是第二代搜索引擎的改進(jìn)。與前兩代相比,它更加注重用戶(hù)的智能化和個(gè)性化,從而為用戶(hù)使用搜索引擎獲取信息獲得更好的體驗(yàn)。