English version
German version
Spanish version
French version
Italian version
Portuguese / Brazilian version
Dutch version
Greek version
Russian version
Japanese version
Korean version
Simplified Chinese version
Traditional Chinese version
Hindi version
Czech version
Slovak version
Bulgarian version
 

Jouer dans Googlebots bac à sable avec slurp, Teoma, & msnbot - araignées afficher différentes personnalités

Seo RSS Feed





On a beaucoup spéculé webmaster sans fin et s'inquiètent de la soi-disant "Google Sandbox" - le délai d'indexation pour les nouveaux noms de domaine - rumeur pour durer au moins 45 jours à compter de la date du premier «découverte» par Googlebot. Ce retard a reconnu annonce venait d'être appelé le "Google effet Sandbox." Ruminations sur les éléments algorithmiques de ce délai sandbox ont varié largement depuis le retard d'indexation a été d'abord observé en printemps 2004. Certains croient qu'il s'agit d'un problème à un élément unique de l'optimisation bon moteur de recherche par exemple en associant campagnes. Link Building a fait l'objet de plus de débat, mais d'autres ont mis l'accent sur la possibilité de la taille d'un nouveau site ou une structure interne reliant ou juste des retards spécifiques comme la plupart elements.Rather algorithmique pertinente que contribuer à cette spéculation et boueux en outre le bac à sable, nous serons regardant une étude de cas d'un site sur un nouveau nom de domaine, établie Mai 11, 2005 et la structure du site spécifique, les présentations des activités externes et internes de la liaison. Nous verrons comment cela se passe dans les moteurs de recherche activité Spider vs indexation dates les quatre premiers engines.Ready de recherche? Nous allons donner les dates et l'action sur chenilles dans les listes de tous les jours et voir comment tout cela se joue sur ce nouveau site unique dans l'avenir .* Mai 11, 2005 Texte de base sur grand site affiché sur le nom de domaine nouvellement acquis et d'aller vivre ici la fin de jours. Rechercher structure conviviale mis en œuvre avec lien textuel faisant pleine découverte de tous les contenus possibles par des robots. Home page mise à jour avec 10 nouvelles pages de texte contenu ajouté quotidiennement. Soumis site sur Google avec "Add URL" la page de soumission .* Mai 12 - 14 - Pas de visites par Slurp, MSNbot, Teoma ou Google. (Slurp est spider de Yahoo et Teoma est de Ask Jeeves) Posté lien sur WebSite101 à nouveau domaine à Publish101.com * Mai 15 - Googlebot arrive et explore avidement 245 pages sur le domaine nouveau après recherchez, mais de ne pas trouver le fichier robots.txt. Oooops! Dois ajouter que le fichier robots.txt! * Mai 16 - Retourne Googlebot pour 5 pages de plus et s'arrête. Slurp gobe goulûment 1480 pages et 1892 liens bad! Ces mauvais liens ont été causés par nos masquage email destiné à tenir à l'écart les robots collecteurs de mauvais. Comment slurp ironique aime ces .* Mai 17 - Slurp trouve 1409 plus de liens de masquage & only 209 pages de nouveaux contenus. Visites MSNbot pour la première fois et demande des robots.txt 75 fois pendant la journée, mais laisse quand elle constate que le fichier manquant! Finit par en Ajouter robots.txt en jours de la fin et arrêt slurp ramper e-mail des liens de masquage et de laisser MSNbot sais qu'il est sécuritaire d'entrer! * Mai 23 - Teoma araignée apparaît pour la première fois et rampe 93 pages. Site reçoit fustigée par BecomeBot, un araignée qui frappe une page toutes les 5 à 7 secondes et souches de nos ressources avec 2409 demandes tir rapide des pages. Ajouté à BecomeBot robots.txt liste d'exclusion de garder 'em out .* Mai 24 - MSNbot a cessé de se présentant pour une semaine depuis les conclusions du fichier robots.txt manquants. Slurp le voit maintenant à quelques heures d'regardant robots.txt et de repartir sans avoir à ramper quelque chose maintenant qu'il est exclu de masquer les liens e-mail. BecomeBot semble être l'honneur de l'exclusion robots.txt, mais demande que ce fichier 109 fois pendant la journée. Teoma rampe 139 pages plus .* Mai 25 - Nous nous rendons compte que nous avons besoin de réaffecter des ressources du serveur et les bases de données cela requiert une modification à l'URL, qui désigne toutes les pages explorées auparavant sont maintenant de mauvais liens! Mettre en œuvre des sous-domaines et se demandent quoi maintenant? Slurp se montre et trouve des milliers de nouveaux e-mails de masquage des liens que le fichier robots.txt est pas déplacés vers les structures du nouveau répertoire. Araignées avez trouvé des erreurs sur les pages nouvelles visites. Scampering d'éteindre les incendies après de vastes changements au site, on manque ce pendant une semaine. Spider action est sporadique pendant 10 jours jusqu'à ce que l'on fixe robots.txt * Juin 4 - retourne Teoma et rampe 590 pages! Aucune autre .* Juin 5 - Déclarations Teoma et rampe 1.902 pages! Aucune autre .* Juin 6 - Retours Teoma et rampe 290 pages. Aucune autre .* Juin 7 - Teoma Retours et rampe 471 pages. Aucune autre .* Juin 8-14 Odd comportement de l'araignée, en regardant robots.txt uniquement .* Juin 15 - Slurp obtient soif, gorgées 1396 pages! Aucune autre .* Juin 16 - Slurp encore soif, gorgées 1379 pages! Non others.So nous allons faire une pause ici au point 5 semaines et de prendre note des comportement très différents les robots d'exploration supérieur. Googlebot visites une fois et se penche sur un nombre important de pages, mais ne revient pas pendant plus d'un mois. Slurp trouve des liens mauvais et semble accro à eux comme il s'arrête exploration de pages bien que lorsqu'elle est dit de licencier l'alcool mauvais, er qui est des liens en obtenant un fichier robots.txt pour slap slurp à la raison. MSNbot visites la recherche de ce fichier robots.txt, et ne sera pas explorer les pages jusqu'à ce que dit ce que ne pas faire par le fichier robots.txt. Teoma rampe tout comme fou, prend du bon temps, puis revient pour le comportement autres.Ce mai imiter les différents personnalités des ingénieurs en logiciels qui les ont conçus. Teoma est tenace et difficile travail. MSNbot est timide et a besoin d'instruction et d'être rassuré qu'il fait la bonne chose, ramasse pages lentement et avec soin. Slurp dotée de la personnalité addictive et fonctionne de manière irrégulière selon un horaire aléatoire. Googlebot jette un regard plutôt long, et les feuilles. Qui sait si elle sera de retour et when.Now regardons indexation par chaque moteur. À partir de cette écriture sur Juillet 7, chaque moteur, indique également différents comportements d'indexation ainsi. Google ne montre aucun pages indexées mais il rampa 250 pages il ya près de deux mois. Yahoo a trois pages indexée dans une clairement le vieillissement de routine qui ne répertorie pas les près de 8.000 pages, il a exploré à ce jour (pas tous détaillés ci-dessus.) MSN a 187 pages indexées lors de l'exploration moins de pages que n'importe lequel des autres. Ask Jeeves a exploré plus de pages à ce jour que n'importe quel moteur de recherche, n'a pas encore indexé un page.Each unique des moteurs affichera le nombre de pages indexées, si vous utilisez l'opérateur de requête "site: publish101.com" sans les guillemets. MSN 187 pages, Ask zéro, Yahoo 3 pages, Google activité quotidienne none.The ne figurant pas dans les trois semaines depuis Juin 16 ci-dessus n'a pas varié de manière spectaculaire, Teoma ramper un peu plus que les autres moteurs, Slurp erratique et vers le bas et MSN collecte lentement 30 à 50 pages par jour. Google est absent.Linking campagne a été minime à des messages pour les listes de discussion, un couple d'articles et de certaines activités de blog. Regardant par-dessus cette fois, c'est apparu qu'un délai liste est effectivement tout à fait raisonnable du point de vue des moteurs de recherche. Notre restructuration du site et mise en œuvre bobbled robots.txt semble avoir brusquement décroché ramper, mais l'indexation comportement de chaque moteur affiche nettement différentes de la politique par chaque sandbox player.The majeur est apparemment pas seulement terrain de jeu de Google, mais il est certes fastidieuse, après près de deux mois. Je pense que je voudrais partir pour la maison, avoir une certaine déjeuner et prendre une Now.back sieste à la classe avant de partir pour les kiddies jour. Qu'avons-nous appris aujourd'hui? Observer l'activité sur chenilles tôt et être certains de mettre en œuvre robots.txt tôt et souvent pour ajuster mauvais bots. Oh oui, et le bac à sable appartient à tous engines.Mike recherche Banks Valentine est un spécialiste de l'optimisation des moteurs de recherche qui exploite http://WebSite101.com et continuera rapports de la chronique de l'étude de cas

Source D'Article: Messaggiamo.Com

Translation by Google Translator





Related:

» Credit Secrets Bible
» Cash Making Power Sites
» Home Cash Course
» Automated Cash Formula


Webmaster obtenir le code html
Ajouter cet article sur votre site Web dès maintenant!

Webmaster envoyer vos articles
Aucune inscription requise! Remplissez le formulaire et votre article est dans le Messaggiamo.Com répertoire!

Add to Google RSS Feed See our mobile site See our desktop site Follow us on Twitter!

Soumettez vos articles à Messaggiamo.Com Directory

Catégories


Copyright 2006-2011 Messaggiamo.Com - Plan du site - Privacy - Webmaster soumettre vos articles à Messaggiamo.Com Directory [0.01]
Hosting by webhosting24.com
Dedicated servers sponsored by server24.eu