English version
German version
Spanish version
French version
Italian version
Portuguese / Brazilian version
Dutch version
Greek version
Russian version
Japanese version
Korean version
Simplified Chinese version
Traditional Chinese version
Hindi version
Czech version
Slovak version
Bulgarian version
 

Jugar en googlebots caja de arena con Slurp, Teoma, y msnbot - arañas mostrar diferentes personalidades

Seo RSS Feed





Se ha especulado webmaster interminables y la preocupación por el llamado "Google Sandbox" - el tiempo de demora de indexación de nuevos nombres de dominio - se rumorea que dure por lo menos 45 días desde la fecha de la primera "," por Googlebot. Este retraso de revistas reconocidas se dio en llamar el efecto "Google Sandbox". Reflexiones sobre los elementos algorítmica de este intervalo de tiempo de recinto de seguridad se han extendido ampliamente ya que el retraso de indexación sólo se advirtió en primavera de 2004. Algunos creen que es una cuestión de un solo elemento de la buena optimización de motores de búsqueda como la vinculación de las campañas. Vincular la construcción ha sido el foco de la mayoría de discusión, pero otros se han centrado en la posibilidad de que el tamaño de un nuevo sitio o estructura de enlaces internos o simplemente retrasos específicos como la mayoría de elements.Rather algorítmica relevantes que contribuyen a esta especulación y seguir enturbiando el recinto de seguridad, estaremos mirando a un estudio de caso de un sitio en un nuevo nombre de dominio, con domicilio 11 de mayo 2005 y la estructura del sitio específico, las presentaciones de la actividad, externa e interna de enlace. Vamos a ver cómo juega en el motor de búsqueda actividad de araña frente a la indexación fechas en el engines.Ready cuatro de búsqueda? Le daremos las fechas y la acción de orugas en las listas de todos los días y ver cómo todo esto juega a cabo en este nuevo sitio único en el tiempo .* 11 de mayo 2005 de texto básicos sobre Nuevo sitio grande en el nombre de dominio recién comprado y va en vivo por día final. Estructura de búsqueda amistoso a cabo con enlace de texto completo haciendo el descubrimiento de todo el contenido posible de los robots. Portada del sitio actualizado con 10 páginas de contenido nuevo texto añadido al día. Presentada en el sitio de Google "Añadir URL" Página de presentación .* 12 a 14 mayo - No hay visitas de Slurp, MSNbot, Teoma, o de Google. (Yahoo Slurp es araña y Teoma es de Ask Jeeves) Publicado el enlace en WebSite101 al nuevo dominio en Publish101.com * 15 de mayo - y con impaciencia que llegue Googlebot rastrea 245 páginas en el dominio de nuevo después de buscar, pero no encontrar el archivo robots.txt. Oooops! Tengo que añadir que el archivo robots.txt! * Mayo 16 - vuelve Googlebot para 5 páginas más y se detiene. Slurp devora con avidez las páginas 1480 y 1892 enlaces malo! Esos vínculos fueron mal causado por nuestra máscara de correo electrónico busca mantener fuera a los robots malos. ¿Cómo le gusta sorber irónico estos .* mayo 17 - Slurp 1409 se encuentra más vínculos de enmascaramiento y sólo 209 páginas de contenido nuevo. Visitas MSNbot por primera vez y pide robots.txt 75 veces durante el día, pero deja cuando se compruebe que el archivo que falta! Por último desplazarse a Añadir robots.txt últimos días y dejar de sorber el rastreo de correo electrónico enlaces de enmascaramiento y dejar MSNbot sabe que es seguro a pasar! * 23 de mayo - Teoma araña aparece por primera vez y se arrastra 93 páginas. Sitio se cerró por BecomeBot, un araña que golpea una página cada 5 a 7 segundos y cepas de nuestros recursos con 2409 solicitudes de tiro rápido de las páginas. Añadido BecomeBot a robots.txt lista de exclusión para mantener 'em out .* 24 de mayo - MSNbot ha dejado de mostrar al una semana después de encontrar el archivo robots.txt que faltan. Slurp está apareciendo cada pocas horas mirando robots.txt y dejando de nuevo sin tener que rastrear todo ahora que está excluido de los vínculos de ocultación de correo electrónico. BecomeBot parece ser en honor a la exclusión de robots.txt, pero pide que el archivo 109 veces durante el día. Teoma arrastra 139 páginas más .* 25 de mayo - Nos damos cuenta de que tenemos que volver a asignar los recursos del servidor y el diseño de bases de datos y de esto requiere cambios en URL, lo que significa que todas las páginas rastreadas anteriormente son ahora enlaces mal! Aplicar subdominios y me pregunto ¿ahora qué? Slurp se muestra y se encuentra a miles de enlaces de correo electrónico nueva máscara como la de robots.txt se no se trasladó a las estructuras de directorios. Las arañas están recibiendo errores de páginas sobre las nuevas visitas. Corriendo para apagar los incendios después de grandes cambios al sitio, no tenemos esto en una semana. Acción Spider es irregular por 10 días hasta que fijar robots.txt * 4 de junio - vuelve Teoma y se arrastra 590 páginas! No hay otros .* 5 de junio - vuelve Teoma y se arrastra 1.902 páginas! No hay otros .* 6 de junio - vuelve Teoma y se arrastra 290 páginas. No hay otros .* 7 de junio - Teoma vuelve y se arrastra 471 páginas. No hay otros .* June 8-14 comportamiento araña Odd, mirando robots.txt sólo .* 15 de junio - Slurp le da sed, tragos 1396 páginas! No hay otros .* 16 de junio - Slurp todavía sed, tragos 1379 páginas! No others.So tomaremos un descanso en el punto 5 semanas y tomar nota del comportamiento muy diferentes de los rastreadores de arriba. Googlebot visita una vez y mira a un gran número de páginas, pero no a cambio de más de un mes. Slurp encuentra enlaces mal y parece adicto a ellos, ya que deja de rastrear páginas bien hasta que se le dice a despedir el licor malo, er que los vínculos por conseguir robots.txt para sorber bofetada a sus sentidos. Visitas MSNbot buscando que robots.txt y no rastrear las páginas hasta que le digan lo que NO debes hacer por el archivo robots.txt. Teoma sólo se arrastra como un loco, se rompe, y después regresa para demás.Este puede imitar el comportamiento de los diferentes personalidades de los ingenieros de software que se diseñó. Trabajo Teoma es tenaz y duro. MSNbot es tímido y necesidades de instrucción y cierta seguridad de que está haciendo lo correcto, recoge las páginas lentamente y cuidadosamente. Slurp tiene personalidad adictiva y funciona de forma irregular en un horario al azar. Googlebot tiene un buen vistazo y hojas. ¿Quién sabe si va a estar de vuelta y when.Now echemos un vistazo a la indexación por cada uno de motor. A partir de este escrito el 7 de julio, cada motor también muestra el comportamiento de diferentes índices también. Google no muestra páginas indexadas, aunque se arrastró 250 páginas hace casi dos meses. Yahoo tiene tres páginas indexadas en una claro envejecimiento de rutina que no se incluya en alguna de las casi 8.000 páginas que ha rastreado hasta la fecha (no todas detalladas más arriba.) MSN tiene 187 páginas indexadas, mientras que el rastreo menos páginas que cualquiera de los otros. Ask Jeeves ha rastreado más páginas al día de cualquier motor de búsqueda, pero no ha indexado un page.Each único de los motores se muestran el número de páginas indexadas, si se utiliza el operador de consulta "site: publish101.com" sin las comillas. MSN 187 páginas, Ask ninguno y 3 páginas de Yahoo, Google actividad diaria none.The que no figuran en las tres semanas desde junio del 16, no ha variado dramáticamente, con Teoma arrastrándose un poco más que otros motores, Slurp de forma errática y hacia abajo y MSN reuniendo lentamente 30 a 50 páginas por día. Google es absent.Linking campaña ha sido mínima, con puestos de las listas de discusión, un par de artículos y de alguna actividad blog. Mirando atrás en este momento es evidente que una demora de revistas es bastante sensible a la vista de los motores de búsqueda. Nuestro sitio de reestructuración y malabareó aplicación robots.txt parece que de repente se estancó, pero el rastreo de la indexación el comportamiento de cada motor muestra claramente las diferentes políticas de cada caja de arena player.The importante es aparentemente no sólo patio de recreo de Google, pero es ciertamente molesto después de casi dos meses. Creo que me gustaría dejar para la casa, almorzar y tomar una siesta now.Back a clase antes de salir para el kiddies día. ¿Qué hemos aprendido hoy? Ver la actividad de orugas temprana y tener la certeza de robots.txt para aplicar principios y ajustar a menudo para contra los robots malos. Oh, sí, y la caja de arena es de todos búsqueda engines.Mike Bancos de San Valentín es un especialista en optimización del motor de búsqueda que opera http://WebSite101.com y continuará los informes de la crónica de los estudios de caso

Artículo Fuente: Messaggiamo.Com

Translation by Google Translator





Related:

» Credit Secrets Bible
» Cash Making Power Sites
» Home Cash Course
» Automated Cash Formula


Webmaster obtener el código html
Añadir este artículo a su sitio web ahora!

Webmaster Envíe sus artículos
No es necesario que se registre! Completa el formulario y su artículo está en el Messaggiamo.Com Directorio!

Add to Google RSS Feed See our mobile site See our desktop site Follow us on Twitter!

Envíe sus artículos a Messaggiamo.Com Directorio

Categorías


Derechos de autor 2006-2011 Messaggiamo.Com - Mapa del sitio - Privacy - Webmaster enviar sus artículos a Messaggiamo.Com Directorio [0.01]
Hosting by webhosting24.com
Dedicated servers sponsored by server24.eu