English version
German version
Spanish version
French version
Italian version
Portuguese / Brazilian version
Dutch version
Greek version
Russian version
Japanese version
Korean version
Simplified Chinese version
Traditional Chinese version
Hindi version
Czech version
Slovak version
Bulgarian version
 

Motor de busca robôs - como eles trabalham, o que fazem (parte i)

Seo RSS Feed





Robôs de busca automática do motor, às vezes chamado de "spiders" ou "crawlers", são os requerentes de páginas da web. Como elas funcionam? O que é que eles realmente? Por que eles são importantes? Você acha que com todo o alarido sobre a indexação páginas da web para adicionar a bases de dados do motor de busca, que os robôs seriam grandes e poderosos seres. Errado. Motor de busca robôs têm funcionalidade só básicas, como a dos navegadores da adiantada em termos do que eles podem compreender em uma página da web. Como primeiros navegadores, os robôs só não pode fazer certas coisas. Robôs não entende frames, animações em Flash, imagens ou JavaScript. Eles não podem entrar senha áreas protegidas e não possam, clique em todos os botões você tem no seu site. Eles podem ser interrompidos frio enquanto que a indexação um URL gerada dinamicamente e reduziram para parar com navegação em JavaScript. Como funcionam os robôs do Search Engine? Pense como motor de busca robôs automatizados programas de recuperação de dados, viajando na web para encontrar informação e links.When você enviar uma página web para um motor de busca na "Apresentar um URL da página", a nova URL é adicionado à fila do robô de sites para visitar a sua incursão próximo a sair para a web. Mesmo se você não apresentar diretamente uma página, muitos robôs irá encontrar o seu site por causa de links de outros sites que apontam para voltar ao seu. Esta é uma das razões porque é importante para construir sua popularidade da ligação e para obter links de outros sites da actualidade volta ao yours.When chegar ao seu site, verifique a primeira robôs automatizados para ver se você tiver um arquivo robots.txt. Este arquivo é usado para dizer que os robôs áreas do site estão fora dos limites para elas. Normalmente, estes podem ser diretórios que contém binários só ou outros arquivos que o robô não precisa se preocupar with.Robots recolher as ligações de cada página que visitam, e depois siga os links através de outras páginas. Desta forma, eles, essencialmente, siga os links de uma página para outra. A World Wide Web inteiro é formado por links, a idéia original é que você poderia seguir as ligações de um lugar para outro. Isto é como robôs obter todo lado "inteligência" sobre a indexação de páginas on-line vem os engenheiros motor de busca, que conceber os métodos utilizados para avaliar as informações que o motor de busca robôs recuperar. Quando introduzido no banco de dados do motor de pesquisa, a informação está disponível para consulta de pesquisadores no motor de busca. Quando um usuário entra no motor de busca a sua consulta para o motor de busca, há um número de cálculos rápidos feito para se certificar de que o motor de busca apresenta apenas o direito do conjunto de resultados para dar aos seus visitantes a resposta mais relevantes para a sua query.You pode ver quais páginas do seu site motor de busca robôs têm visitado por olhar para os logs do seu servidor ou os resultados de seu programa de estatísticas de log. Identificar os robôs irá mostrar-lhe, quando eles visitaram seu site, quais as páginas que visitaram e como muitas vezes eles visitam. Alguns robôs são facilmente identificáveis pelos seus nomes de usuário do agente, como o Google é "Googlebot", outros são pouco mais obscuros, como Inktomi "Slurp". Ainda outros robôs podem ser listados em seus registros que você não pode facilmente identificar, alguns deles podem até parecer humanos movidos browsers.Along com a identificação de robôs individuais e contando o número de suas visitas, as estatísticas também mostram agressivos largura de banda agarrando-robôs ou robôs você não pode querer visitar o seu site. Na seção de recursos no final deste artigo, você vai encontrar sites que lista os nomes e endereços IP do motor de busca robôs para ajudá-lo identificá-los. Como lêem as páginas do seu site? Quando o motor de busca do robô visita sua página, ele olha para o texto visível na página, o conteúdo das várias marcas em seu código-fonte da página tag (título, meta tags, etc), e os hiperlinks em sua página. Das palavras e os links que encontra o robô, o motor de busca decide qual sua página é sobre. Há muitos fatores usados para descobrir o que "importa" e cada motor de busca tem seu próprio algoritmo, a fim de avaliar e processar as informações. Dependendo de como o robô é criado através do motor de busca, a informação é indexada e em seguida entregue ao motor de busca informações Database.The entregues aos bancos de dados torna-se parte do mecanismo de busca e diretório processo de classificação. Quando o visitante motor de pesquisa sustenta a sua consulta, o motor de busca escavações através de seu banco de dados para dar o anúncio final que é exibido nos resultados de dados do motor de busca page.The atualização em momentos diferentes. Quando você estiver na base de dados do motor de busca, os robôs manter você visitando periodicamente, para pegar quaisquer alterações às suas páginas, e para certificar-se que as últimas informações. O número de vezes que é visitado depende de como o motor de busca fixa as suas visitas, que pode variar por engine.Sometimes pesquisa visitando os robôs são incapazes de acessar o site que está visitando. Se o seu site está para baixo, ou você está enfrentando enormes quantidades de tráfego, o robô pode não ser capaz de acessar seu site. Quando isso acontece, o site não pode ser re-indexados, dependendo da freqüência das visitas do robô para o seu site. Na maioria dos casos, os robôs que não podem acessar suas páginas tente novamente mais tarde, esperando que seu site estará acessível then.Resources * SpiderSpotting - Search Engine Watch http://searchenginewatch.com/webmasters/spiders.html * Lista Robotstxt.org de robôs e protocolos para a criação de um arquivo robots.txt. http://www.robotstxt.org/ * Spider-Tutoriais Alimentação, fóruns e artigos sobre aranhas do Search Engine e Search Engine Marketing. http://spider-food.net/ * Spiderhunter.com artigos e recursos sobre o acompanhamento de Search Engine aranhas. http://www.spiderhunter.com/ * Sim Spider Search Engine Robot Simulator Search Engine Mundo tem uma aranha que simula o que os robôs do Search Engine ler a partir de seu site. http://www.searchengineworld.com/cgi-bin/sim_spider.cgiDaria Goetsch é o fundador e Search Engine Marketing Consultant para Pesquisa de Inovação Marketing, uma empresa de Search Engine Optimization servir as pequenas empresas. Ela é especializada em Search Engine Promotion desde 1998, incluindo três anos, o Search Engine Especialista para O'Reilly Media, Inc., uma publicação técnica company.Copyright livro ÃÆ'à ¢ â, ¬ Å ¡Ãƒâ € šÃ,  © 2002-2005 Pesquisa de Inovação Marketing. Todos os Direitos http://www.searchinnovation.com Reserved.Permission para reimprimir este artigo é concedida se o artigo é reproduzido em sua

Artigo Fonte: Messaggiamo.Com

Translation by Google Translator





Related:

» Credit Secrets Bible
» Cash Making Power Sites
» Home Cash Course
» Automated Cash Formula


Webmaster começa O Código do HTML
Adicionar este artigo para o seu site agora!

Webmaster enviar seus artigos
Nenhum registro necessário! Preencha o formulário e seu artigo está no Messaggiamo.Com Diretório!

Add to Google RSS Feed See our mobile site See our desktop site Follow us on Twitter!

Envie os seus artigos para Messaggiamo.Com Directory

Categorias


Copyright 2006-2011 Messaggiamo.Com - Mapa do Site - Privacy - Webmaster enviar seus artigos para Messaggiamo.Com Directory [0.01]
Hosting by webhosting24.com
Dedicated servers sponsored by server24.eu