社么叫搜索引擎?
熱心網友
Internet是一個巨大的信息資源寶庫,幾乎所有的Internet用戶都希望寶庫中的資源越來越豐富,使之應有盡有。的確每天都有新的主機被連接到Internet上,每天都有新的信息資源被增加到Internet中,使Internet中的信息以驚人的速度增長。然而Internet中的信息資源分散在無數臺主機之中,如果用戶想將所有主機中的信息都做一番詳盡的考察,無異于大海撈針。那么用戶如何在數百萬個網站中快速有效地查找到想要得到的信息呢?這就要借助于Internet中的搜索引擎。 一、什么叫搜索引擎? 在Internet上有上百億可用的公共Web頁面,即使是最狂熱的沖浪者也不會訪問到所有的頁面,而只能看到其中的一小部分,更不會在這浩瀚的Web海洋中發現你那即使精彩卻渺小的一隅。當然你可以為你的存在做廣告,可以用大大的字把你的URL刻在你的身體上,然后裸體穿過白宮草坪,但你得保證媒體正好在那里,并注視到了這一切。與其這樣做,不如好好去理解搜索引擎是如何工作的?又怎樣選擇和使用"keywords"(關鍵詞)等等。 本文的目的就是讓眾多的頁面設計者在了解搜索引擎的基礎上,尋求如何使自己的頁面在搜索引擎索返回的列表中獲得好的排列層次的方法。 "搜索引擎"這個術語一般統指真正意義上的搜索引擎(也就是全文檢索搜索引擎)和目錄(即目錄式分類搜索引擎),其實他們是不一樣的,其區別主要在于返回的搜索結果列表是如何編排的。 二、搜索引擎是如何工作的? 搜索引擎有三個主要的基本部分。 1、搜索引擎蜘蛛 搜索引擎首先利用的是一種俗稱蜘蛛(Spider)或爬蟲(Crawler)的軟件。搜索引擎蜘蛛訪問到一個頁面,讀取它,然后跟隨這個頁面鏈接到這個站點的其他頁面,這就是人們所說的站點被套住了或者被爬過了。蜘蛛會按照固定的時間不斷的回來訪問這個站點,如每月或每兩個月,以便查看頁面的變化。 2、索引 蜘蛛所找到的每一個頁面放入搜索引擎的第二部分--索引。索引也可以說是目錄冊,就像一本巨大的書,書中包含了蜘蛛所找到的每個Web頁的拷貝。如果Web頁改變了,這本書當然也會更新。但有時蜘蛛發現了新的Web頁和Web頁的變化,并不是馬上加到索引中去,當中間隔一段時間,就是說一個Web頁被爬過了,但卻不能被索引,直到這個Web頁被加到了索引里才可用于搜索引擎的搜索。 3、分析軟件 搜索引擎分析軟件是一個搜索引擎的第三部分。這個程序詳細審查記錄在索引中的成百上億的Web頁,找出與搜索要求相匹配的那些,并按他認為最合適的相關性排列出列表,呈現在沖浪者的面前。 三、搜索引擎如何排列Web頁面 用你所喜歡的搜索引擎搜索任何東西,搜索引擎幾乎立刻就從他知道的幾百萬的頁面中挑選出與你的主題相匹配的那些,呈現在你的熒屏上。這些網頁按一定的順序排列起來,最相關的排在最前面。 但搜索引擎并不是圖書管理員,他沒有能力一再地詢問有關的問題來更好地定位搜索的目標,也不能依靠智力判斷和過去的經驗來排列網頁,而人可以做到。智能化是發展的方向,但還有一段很長的路要走。 那么搜索引擎是怎樣決定相關性的呢?他們依靠一套規則,主要的規則是頁面中關鍵詞出現的位置和頻率,我們把這稱做"位置/頻率法"。1、位置和頻率(1)、位置 如果你到圖書館去尋找有關旅游方面的書,管理員首先會去查找題目中有"旅游"的書籍。搜索引擎也一樣,關鍵詞(即"旅游")出現在題目(Title)中的頁面比那些Title中不出現關鍵詞的頁面更相關。 搜索引擎還會檢查關鍵詞是否出現在頁面的頂部,如文章標題中或前面的幾個段落。他們認為與搜索主題相關的頁面在開始都會提到那些詞語。(2)、頻率 頻率是相關性的另外一個主要因素。搜索引擎會分析頁面中關鍵詞相對其他詞語所出現的頻率,頻率越高,就越具相關性。2、搜索引擎在排列網頁時有一定的差異 所有的搜索引擎都有以上提到的三個基本部分,在一定程度上都符合"位置/頻率法",但在具體實施上又有區別,這就是為什么我們用不同的搜索引擎做同樣的搜索時會產生不同結果的原因。 首先,有些搜索引擎會比其他搜索引擎索引到更多的Web頁面,有些又會比其他引擎更新索引的頻率快,所以搜索引擎索引中不可能收集完全一樣的Web頁面。 其次,出于某種原因,有些搜索引擎也可能給某些Web頁面在排列層次上有優先權。如Excite用鏈接的流行度作為排列網頁的一個因素,他知道在索引中哪些頁面有許多指向他們的鏈接,他在排列時就給這些頁面小小的獎勵,將他們適當提前。這也是合理的,因為在Internet上有越多指向他們的鏈接,就說明這些頁面更被大家看重。 另外,一些混合結構(搜索引擎和目錄共存)的搜索引擎可能會把那些目錄中已存在的站點的網頁靠前,理由是一個站點足夠好才能放到目錄中,就應該有機會比那些不被列在目錄中的站點的網頁靠前。 最后要強調的是,許多Web頁面設計者錯誤地認為"Meta tags"是將Web頁提到列表前列的秘密,實際上有些搜索引擎會把那些"Meta tags"中有keywords的頁面靠前,有些搜索引擎根本就不讀"Meta tags"。"Meta tags"是解決問題的一個方面,但并不是什么必需的絕密武器。四、如何提高Web頁面的相關性 搜索引擎的一次搜索會返回成百上千的相關網頁,一般情況下首先呈現出來的是10個最相關的頁面。 任何站點都想被列在前10位,因為大多數的用戶都喜歡從前10位中找到他所要的結果,排在第11位以下就意味著許多人不會訪問到你的站點。 下面就來看看如何能使你的網頁排在列表前列。1、選擇合適的關鍵詞(Keywords) 大膽地設想別人在搜索引擎的搜索框內正好輸入的是你頁面的Title中選擇的關鍵詞,那該多好啊!例如,如果你有一個有關郵票收藏的網頁,如果你想別人任何時候在搜索框里輸入"郵票收藏"時你能排在前10位,那么就為這個頁面選擇"郵票收藏"這個關鍵詞吧! 網站的每一個頁面都應該有反映網頁內容的關鍵詞,并且關鍵詞至少由2個以上的字或詞組成。通常與單個的字或詞相關的網站太多太多,例如"郵票"就比"郵票收藏"所相關的網頁多得多,那么競爭就激烈,網頁排在前列的概率就相對低一些。所以不要怕花費時間,盡量選擇2個以上的字或詞組成的短語,成功的可能性會大得多。 最后,假設適當地擴展文章的涉及范圍,多選幾個關鍵詞又會怎么樣呢?例如,一個郵票收藏的網頁可能會提到"收藏家"和"收藏",那么擴展開來,用"郵票收藏家"和"郵票收藏"增加關鍵詞的數量也是合理的。可不是沒有問題,因為你的網頁實際上是關于郵票收藏的精典網頁,應該出現在郵票收藏一類網頁的前列,但你在關鍵詞上擴展了頁面的涉及范圍,可能就會無意識地降低頁面對于"郵票收藏"的相關性。如何決定更好,看你的想法了!2、關鍵詞(Keywords)出現的位置 選擇好關鍵詞后還要確保關鍵詞出現在至關重要的位置。首先頁面的題目(Title)是最重要的地方,忽略將關鍵詞放進頁面的題目中是許多本身具備良好相關性的網頁被排在底層的原因。 其次像前面提到的,搜索引擎也看中關鍵詞出現在頁面前面的網頁,所以有可能的話就把關鍵詞作為大標題,并使得關鍵詞出現在網頁的第一段。 特別注意的是使用表格會把網頁的正文推到網頁的更下面,就會造成相關性的降低。例如,畫一個有兩列的表格,第一列放的是對其他網頁的鏈接,第二列才是含有關鍵詞的正文。瀏覽看到的網頁是這樣的:--------------------------------------------------------------------------------主頁 郵票收藏郵票歷史 郵票收藏愛好者遍布世界各地。每天都有成郵票價格 千上萬的人在對郵票津津樂道,并且每天的郵票郵票展覽 交易額達數百萬元。點擊各個欄目,你就可以得郵票精品 到許多郵票的知識。-------------------------------------------------------------------------------- 而搜索引擎看這個頁面是這樣的:--------------------------------------------------------------------------------主頁郵票歷史郵票價格郵票精品郵票收藏 郵票收藏愛好者遍布世界各地。每天都有成千上萬的人在對郵票津津樂道,并且每天的郵票交易達數百萬元。點擊各個欄目,你就可以得到許多郵票的知識。-------------------------------------------------------------------------------- 顯然,關鍵詞"郵票收藏"移到了下面!在這種情況下,除了使用metatags外,沒有其他更好的辦法。使用metatags對那些讀metatags的搜索引擎有幫助,對其他不讀metatags的搜索引擎也不是什么大不了的問題。你認為表格對你的頁面很有影響,也沒有必要放棄他們,喜歡的話就繼續使用,不能因個別搜索引擎而破壞頁面的整體性。 大量的JavaScript也和表格有一樣的影響。搜索引擎首先讀JavaScript語句,引起正常的HTML正文排后一些。這樣,如有可能的話,把JavaScript語句放到頁面后面一點。也可以使用metatags來幫助解決問題。3、頁面有相關的內容 如果頁面沒有相關的內容,即使改變頁面的題目或使用metatags都不會對你在搜索引擎的位置有何幫助。就是說你使用的關鍵詞要反映頁面的內容。 有些頁面出現的是大量的圖形,看起來非常漂亮,但搜索引擎卻不能讀這些圖形,他們就得不到文字來決定頁面的相關性。有些搜索引擎也可能將ALT包含的文字和metatags結合起來索引。但為保險起見,建議盡可能用HTML文字,訪問者也喜歡這些實質性的東西。 另外,要保證HTML文字是可見的。有些頁面設計者想通過用微小的字體或把字體顏色設置成和背景顏色一致的方法在正文中重復關鍵詞。雖然瀏覽器是看不見了,但搜索引擎卻能識破這種類似的詭計。料想瀏覽器都看不見的東西,搜索引擎也不應該索引到它。這些頁面是搜索引擎的垃圾,應該擯棄它們。4、避免搜索引擎阻塞 有些搜索引擎看WEB頁面,就像一個人使用非常舊的版本的瀏覽器一樣。他們不能讀圖象映像(image maps),不能讀框架結構(frames)。你必須考慮到這些問題,否則搜索引擎也許根本就不可能索引到你的任何頁面。(1)、要有HTML文字鏈接。頁面設計者經常在主頁上只是用圖象映像來鏈接子頁面,那么不能跟隨這種鏈接的搜索引擎就不能到達站點的子頁面。最不幸的是,子頁面常常比主頁更有相關性。所以建議在主頁底部加一些在文字上所做的HTML超鏈接來鏈接各個子頁面,搜索引擎就會發現他們,并跟隨進去。 你也可以考慮制作一個帶有文字鏈接的本站導航頁來鏈接網站的所有頁面。然后遞交這個頁面,幫助搜索引擎查找站點的其他所有網頁。(2)、框架結構是致命的一擊。一些主要的搜索引擎都不能跟隨框架里的鏈接。你只好使用meta tags或另外的巧妙設計來解決它。(3)、動態頁面的阻塞。有些搜索引擎也不可能索引由CGI或數據庫所生成的動態頁面,所以盡量使用靜態頁面。寧愿用數據庫來修改頁面,也不要動態生成它們。還要避免在URL上使用符號,尤其是問號"?",如( 5、使用meta tags 正如前面所提到的,metatags能幫助你解決象表格、框架等其他麻煩所帶來的問題。metatags也幫助你能在支持metatags的搜索引擎中控制你的站點描述語言。但須記住的是:metatags并不一定就能保證站點排在前列,他們并不是改變站點排列低落狀態的魔術彈。6、杜絕搜索引擎垃圾 首先要知道,垃圾并不一定被搜索引擎接受,搜索引擎可能會發現你的這種想把垃圾網頁提到前列的行為,并在列表中取締你的網頁。 一般來說,搜索引擎垃圾是想通過加上最流行的關鍵詞來達到排在前列的目的,這是不道德的行為。網頁應該以真實的內容讓搜索引擎來決定其相關性,而不是毫無道理地憑借重復關鍵詞來擊敗其他網頁。是金子總會發光! 我們將搜索引擎的垃圾和垃圾郵件比較一下。沒人喜歡垃圾郵件,發送垃圾郵件的站點經常面臨的是來自那些接受方的反擊。制造搜索引擎垃圾的站點降低了搜索引擎返回列表的質量。隨著問題的越來越嚴重性,這些站點也會面臨和垃圾郵件所帶來的一樣的反擊。7、提交關鍵頁面 大多數的搜索引擎是從你提交過去的一個頁面開始索引站點的其他頁面的。所以最好提交最能概括站點的前面2到3個頁面。 也不要太信任自動提交服務程序的自動提交過程,有些是很優秀的。但那些舉足輕重的搜索引擎太重要了,還是人工提交比較好,以便你能看看提交有沒有何問題。 更不要怕麻煩提交2到3個頁面。當搜索引擎在一個頁面上遇到問題時,它還可以從另一個頁面開始爬你的站點。8、定期檢查和維護你的列表位置 一旦你的頁面被搜索引擎列表,最好是每到一至兩個星期監控一下列表,可能會有一些奇怪的事情發生:頁面消失了;鏈接不對了;。。。。。。那么重新提交你的站點吧。 當你對頁面做了重大改動的時候最好也要重新提交站點。搜索引擎本來是按固定的周期反復訪問站點的,然而一些搜索引擎很靈敏,它們知道有些站點一年只做一到兩次的改動,它們可能就不會經常去訪問這些站點,那就發現不了站點的變化。在重大改動后重新提交將確保你的站點內容是最新的。五、結束語 對于頁面設計者來說,花一些心思和精力與搜索引擎建立起良好的關系是值得的,往往稍做一些改動就可能得到很大的好處。即使沒有進入前10名,也在相關性上得到了一個改進。 同時,如自己的站點沒有運氣進入前10名,還應該考慮與排列前10名的站點進行互惠互利的鏈接。雖然他們是競爭對手,但你也會因此而得到許多意想不到的回報,你會發現網上指向自己站點的鏈接多了,這時你只要稍微注意一下關鍵詞的使用,你就可能跑到列表前列。何況鏈接也是人們找到你的站點的最好方式之一。 最后要說的是:搜索引擎是人們尋找Web站點的主要方式,但不是唯一的方式。人們也從以下的方式獲得站點,如口傳、傳統廣告、傳統媒體、新聞組、Web目錄和其他站點來的鏈接等。有時侯,這些形式比搜索引擎更有效。所以千萬不要被搜索引擎的排列位置所困擾,一個頁面設計者更多的時間應該放在制作更好的網頁上。。
熱心網友
最簡單的答案,找東西的^_^
熱心網友
搜索引擎其實也是一個網站,只不過該網站專門為你提供信息"檢索"服務,它使用特有的程序把因特網上的所有信息歸類以幫助人們在浩如煙海的信息海洋中搜尋到自己所需要的信息。搜索引擎按其工作的方式分為兩類:一類是分類目錄型的檢索,把因特網中的資源收集起來,由其提供的資源的類型不同而分成不同的目錄,再一層層地進行分類,人們要找自己想要的信息可按他們的分類一層層進入,就能最后到達目的地,找到自己想要的信息;另一類是基于關鍵詞的檢索,這種方式用戶可以用邏輯組合方式輸入各種關鍵詞(Keyword),搜索引擎計算機根據這些關鍵詞尋找用戶所需資源的地址,然后根據一定的規則反饋給用戶包含此關鍵字詞信息的所有網址和指向這些網址的鏈接。隨著因特網信息按幾何式增長,這些搜索引擎利用其內部的一個叫SPIDE(蜘蛛)的程序,自動搜索網站每一頁的開始,并把每一頁上代表超級鏈接的所有詞匯放入一個數據庫,供用戶來查詢。 據一個簡單例子,您如果需要購買鮮花,可又不知道在什么地方,這是您就可以打開雅虎 ,在它的主頁里有一個文字輸入框,您可以輸入"鮮花店",然后點擊搜索按鈕,這是雅虎就可以為您搜索出網上所有的鮮花店的網站,您只要點擊搜索結果的網站即可進入它的網站瀏覽。當然,您也可以輸入"德州鮮花店"來檢索德州的鮮花店。
熱心網友
一種在互聯網上,查找網站的軟件。
熱心網友
什么叫搜索引擎呢?Internet是一個巨大的信息資源寶庫,幾乎所有的Internet用戶都希望寶庫中的資源越來越豐富,使之應有盡有。的確每天都有新的主機被連接到Internet上,每天都有新的信息資源被增加到Internet中,使Internet中的信息以驚人的速度增長。然而Internet中的信息資源分散在無數臺主機之中,如果用戶想將所有主機中的信息都做一番詳盡的考察,無異于大海撈針。那么用戶如何在數百萬個網站中快速有效地查找到想要得到的信息呢?這就要借助于Internet中的搜索引擎。 搜索引擎是Internet上的一個網站,它的主要任務是在Internet中主動搜索其他Web站點中的信息并對其自動索引,其索引內容存儲在可供查詢的大型數據庫中。當用戶利用關鍵字查詢時,該網站會告訴用戶包含該關鍵字信息的所有網址,并提供通向該網站的鏈接。 目前國內用戶使用的搜索引擎主要有兩類:即英文引擎和中文引擎。常用的英文搜索引擎包括google、Yahoo!、MSN、Infoseek等,常用的中文搜索引擎主要有:中文google、一搜、3721、百度、中搜、搜狐搜狗、網易等。。