English version
German version
Spanish version
French version
Italian version
Portuguese / Brazilian version
Dutch version
Greek version
Russian version
Japanese version
Korean version
Simplified Chinese version
Traditional Chinese version
Hindi version
Czech version
Slovak version
Bulgarian version
 

搜索引擎機器人-他們怎麼运作,什麼他們(部分i)

徐 RSS Feed





自動化的搜索引擎機器人,有時称「蜘蛛」或「履帶牽引裝置」,是網頁的尋找者。 他們怎麼运作? 他們是什麼它真正地? 為什麼是他們重要的?

您會考虑與所有忙亂索引網頁补充说到搜索引擎數據庫,那機器人是偉大和強有力的生存。 錯誤。 搜索引擎機器人有仅基本的功能象那样早期的瀏覽器根據什麼他們在網頁可以瞭解。 像早期的瀏覽器,機器人就是不可能做某些事。 機器人不瞭解框架、一刹那電影、圖像或者Java語言。 他們不可能进入密碼被保护区,并且他們不可能点击您有在您的網站上的所有那些按鈕。 他們可以是被停止的寒冷,当標註動態地引起的URL和減慢對與Java語言航海时的中止。 搜索引擎機器人怎麼运转?

認為搜索引擎機器人作為自動化的数据检索節目,旅行網發現信息和鏈接。

当您遞交網頁給搜索引擎在「时遞交URL」頁,新的URL增加到網站機器人的隊列參觀在它的下次突襲在網上。 即使您不直接地遞交頁,許多機器人將發現您的站點由於從指向回到你的其他站點的鏈接。 這是其中一個原因为什么建立您的鏈接大眾化和從其他典型站點得到鏈接回到你的是重要的。

当到達您的網站时,自動化的機器人首先檢查看您是否有一個robots.txt文件。 這個文件被用于告诉機器人您的站點哪些區域是禁地對他們。 典型地這些也许是包含仅雙的目錄或其他歸檔機器人不需要有關自己與。

他們參觀的機器人從每頁收集鏈接和以后进行到底那些鏈接對其他頁。 这样,他們本質上跟隨從一頁的鏈接到另一个。 整個萬維網由鏈接,是的创新见解做成您可能跟隨從一個地方的鏈接到另一个。 這是機器人怎麼得到。

「smarts」關於在網上索引页来自搜索引擎工程師,構想使用的方法評估信息搜索引擎機器人檢索。 当介紹入搜索引擎數據庫,信息為詢問搜索引擎的搜尋者是可利用的。 当搜索引擎用戶参与他們的詢問搜索引擎时,有完成的一定數量快的演算确信,搜索引擎提出正确的套結果給他們的訪客對他們的詢問的最相關的反應。

您能看到在您的站點的哪些頁搜索引擎機器人通过看您的服務器日誌或從您的日誌統計節目的結果參觀了。 辨認機器人將显示您,當他們參觀了您的網站,頁他們參觀,并且他們多頻繁參觀。 有些機器人由他們的用户代理名字是欣然可識別的,像Google的「Googlebot」; 其他是被咬住的陰暗,像Inktomi的「啜食」。 仍然其他機器人在您不可能欣然辨認的您的日誌也许被列出; 有些也许甚而看来是供給人動力的瀏覽器。

與辨認各自的機器人和計數他們的參觀的数量一起,統計可能也顯示您積極的帶寬劫掠的您不可以想要參觀您的網站的機器人或機器人。 在结尾的资源部分的這篇文章,您將發現名單搜索引擎機器人的名字和IP地址帮助您的辨認他們的站點。 他們怎麼讀頁在您的網站?

当搜索引擎機器人參觀您的頁时,它看在頁、各種各樣的標記的內容用您的頁的原始代码(標題標記、階標記等等)和超鏈接的可看見的文本在您的頁。 從詞和機器人發現的鏈接,搜索引擎決定什麼您的頁是關於。 有被用于的許多因素推测什麼「有重要性」,并且每個搜索引擎有它自己的算法為了評估和處理信息。 根据機器人怎样通过搜索引擎被設定,信息被標註然后被提供到搜索引擎的數據庫。

信息被提供到數據庫然後成為一部分的搜索引擎和目錄等第過程。 当搜索引擎訪客遞交他們的詢問时,搜索引擎通过它的數據庫開掘給在結果頁被顯示的最後的目錄。

在變化的时刻的搜索引擎數據庫更新。 一旦您是在搜索引擎數據庫中,機器人继续週期性地拜访您,拾起對您的頁的所有變動,并且确定他們有最新的信息。 您拜访的次数依赖于怎样搜索引擎設定了它的參觀,可能每個搜索引擎變化。

有时他們參觀的參觀的機器人无法訪問網站。 如果您的站點下來,或者您體驗巨大的通信量,機器人可能不能訪問您的站點。 当這發生时,網站不可以根据機器人參觀的頻率被重新編目,到您的網站。 在许多情况下,不可能訪問您的頁的機器人以后將再试一次,希望您的站點然後將是容易接近的。

资源

*SpiderSpotting -搜索引擎手錶http://searchenginewatch.com/webmasters/spiders.html

機器人*Robotstxt.org設定的robots.txt名單和協議歸檔。 http://www.robotstxt.org/

*Spider-Food講解、論壇和文章关于搜索引擎蜘蛛和搜索引擎行銷。 http://spider-food.net/

關於跟蹤搜索引擎蜘蛛的*Spiderhunter.com文章和资源。 http://www.spiderhunter.com/

*Sim蜘蛛搜索引擎機器人模擬器搜索引擎世界有模仿的一隻蜘蛛什麼搜索引擎機器人從您的網站讀。 http://www.searchengineworld.com/cgi-bin/sim_spider.cgi

Daria Goetsch是查尋創新行銷的創建者和搜索引擎营销顾问,为小企业服务的搜索引擎優化公司。 她專門了研究搜索引擎促進自1998年以来,包括三年作為O'Reilly的Media, Inc.,一家技術書出版公司搜索引擎專家。

複製權ÃÆ'â⠂¬Å ¡ Âà ‚© 2002-2005查尋創新行銷。 http://www.searchinnovation.com版权所有。

授予允許重印這篇文章文章是否被再生產全部,无需編輯,包括生物信息。 当曾经在時事通訊的在網上时,這篇文章或請包括超鏈接對http://www.searchinnovation.com

文章來源: Messaggiamo.Com

Translation by Google Translator





Related:

» Credit Secrets Bible
» Cash Making Power Sites
» Home Cash Course
» Automated Cash Formula


網管得到HTML代碼
加上這條到你的網站!

網站管理員提交你的文章
無須登記!填寫好的表格和你的文章是在 Messaggiamo.Com 目錄!

Add to Google RSS Feed See our mobile site See our desktop site Follow us on Twitter!

提交你的文章,以 Messaggiamo.Com 目錄

分類


版權 2006-2011 Messaggiamo.Com - 網站地圖 - Privacy - 網站管理員提交你的文章,以 Messaggiamo.Com 目錄 [0.01]
Hosting by webhosting24.com
Dedicated servers sponsored by server24.eu