English version
German version
Spanish version
French version
Italian version
Portuguese / Brazilian version
Dutch version
Greek version
Russian version
Japanese version
Korean version
Simplified Chinese version
Traditional Chinese version
Hindi version
Czech version
Slovak version
Bulgarian version
 

Robot dei motori di ricerca - come funzionano, cosa fanno (I parte)

Seo RSS Feed





Robot dei motori di ricerca automatizzata, a volte chiamati "spider" o "crawler", sono le persone in cerca di pagine web. Come funzionano? Che cosa è realmente fare? Perché sono importanti? Si potrebbe pensare che con tutte le storie per l'indicizzazione pagine web per aggiungere al database del motore di ricerca, che i robot sarebbe grande e potente degli esseri. Sbagliato. I robot dei motori di ricerca hanno unica funzionalità di base come quello dei browser primi in termini di ciò che può comprendere fino in una pagina web. Come browser primi, i robot non si può fare certe cose. I robot non capisco fotogrammi, filmati Flash, immagini o JavaScript. Essi non possono entrare in aree protette da password e non possono fare clic su tutti quei bottoni che hai sul tuo sito web. Che possano essere fermati a freddo, mentre l'indicizzazione di un generato dinamicamente URL e ha rallentato fino a fermarsi con la navigazione JavaScript. How Do Search Engine Robot lavoro? Pensate di robot dei motori di ricerca come automatizzata i dati dei programmi di recupero, che viaggiano sul web per trovare informazioni e links.When si presenta una pagina web a un motore di ricerca su "Invia un URL" pagina, il nuovo URL viene aggiunto alla coda del robot di siti web da visitare per la sua successiva incursione fuori sul web. Anche se non direttamente presentare una pagina, robot molti troveranno il tuo sito a causa di link da altri siti che puntano al vostro. Questo è uno dei motivi per cui è importante per costruire il tuo link popularity e per ottenere link da altri siti di attualità torna alla yours.When che arrivano al vostro sito web, i robot automatici di controllo per vedere se si dispone di un file robots.txt. Questo file è usato per dire che i robot aree del sito sono off-limits per loro. In genere questi possono essere solo le directory che contengono file binari o altri file il robot non ha bisogno di occuparsi with.Robots raccogliere i link da ogni pagina che visita, e poi seguono quelle collegamenti attraverso ad altre pagine. In questo modo, in sostanza, seguire i link da una pagina all'altra. L'intero World Wide Web è costituito da link, l'idea originale è che si potrebbe seguire i collegamenti da un luogo all'altro. Questo è il modo Robot around.The "esperti" su pagine online di indicizzazione deriva dal ingegneri del motore di ricerca, che elabora i metodi utilizzati per valutare le informazioni che il motore di ricerca robot recuperare. Una volta introdotto nel database del motore di ricerca, le informazioni sono disponibili per ricerche interrogando il motore di ricerca. Quando un utente del motore di ricerca inserisce la propria query nel motore di ricerca, ci sono una numero di calcoli rapidi fatto per assicurarsi che il motore di ricerca presenta solo il diritto set di risultati a dare il proprio visitatore la risposta più pertinente alla loro query.You puoi vedere quali pagine del tuo sito I robot dei motori di ricerca hanno visitato guardando i log del server o dei risultati il tuo programma di statistiche di log. Individuare i robot vi mostrerà quando hanno visitato il vostro sito web, le pagine che hanno visitato e come spesso visita. Alcuni robot sono facilmente identificabili con i loro nomi user agent, come Google "Googlebot"; altri sono poco più oscuri, come Inktomi's "Slurp". Ancora altri robot possono essere elencati nei log che si non può facilmente identificare, alcuni di essi possono persino apparire a propulsione umana browsers.Along di identificare singoli robot e contando il numero delle loro visite, le statistiche possono anche mostrare aggressivi larghezza di banda acchiappa-robot o robot non si desidera visitare il tuo sito web. Nella sezione risorse della fine di questo articolo, troverete siti che elencare i nomi e gli indirizzi IP dei robot dei motori di ricerca per aiutarti identificarli. Come fanno a leggere le pagine sul vostro sito? Quando il robot dei motori di ricerca visitano la pagina, si guarda il testo visibile della pagina, il contenuto dei vari tag nel codice sorgente della pagina (tag title, meta tag, ecc), ed i collegamenti ipertestuali della pagina. Dalle parole e dai legami che i robot si trova, il motore di ricerca decide che la pagina è di circa. Ci sono molti fattori utilizzati per capire che cosa "materia" e ogni motore di ricerca ha il suo algoritmo proprio al fine di valutare ed elaborare le informazioni. A seconda di come il robot viene impostato attraverso il motore di ricerca, le informazioni vengono indicizzati e poi consegnato al motore di ricerca informazioni database.The consegnati alle basi di dati diventa quindi parte del motore di ricerca e directory processo di classificazione. Quando il visitatore motore di ricerca sostiene la ricerca, il motore di ricerca scava attraverso la sua banca dati per dare l'annuncio finale che viene visualizzato sui risultati database del motore di ricerca page.The aggiornamento in momenti diversi. Una volta che siete nel database del motore di ricerca, i robot a mantenere la visita si periodicamente, di far salire eventuali modifiche alle tue pagine, e per assicurarsi che essi hanno le informazioni più recenti. Il numero di volte che si è visitato dipende da come il motore di ricerca definisce le sue visite, che può variare in base alla engine.Sometimes ricerca visitando robot sono in grado di accedere al sito web che sta visitando. Se il vostro sito è giù, o si verificano enormi quantità di traffico, il robot non può essere in grado di accedere al tuo sito. Quando questo accade, il sito non può essere re-indicizzate, a seconda della frequenza delle visite robot al tuo sito web. Nella maggior parte dei casi, i robot che non possono accedere le vostre pagine saranno di riprovare più tardi, sperando che il tuo sito sarà accessibile then.Resources * SpiderSpotting - Search Engine Watch http://searchenginewatch.com/webmasters/spiders.html * Elenco Robotstxt.org di robot e di protocolli per la creazione di un file robots.txt. http://www.robotstxt.org/ * Spider-Tutorials Food, forum e articoli sui motori di ricerca e Search Engine Marketing. http://spider-food.net/ * Spiderhunter.com articoli e risorse sul monitoraggio Motore di Ricerca ragni. http://www.spiderhunter.com/ * Sim Spider Search Engine Robot Simulator motore di ricerca mondiale ha un ragno che simula ciò che il robot di Search Engine leggere dal tuo sito. http://www.searchengineworld.com/cgi-bin/sim_spider.cgiDaria Goetsch è il fondatore e Search Engine Marketing Consultant per l'innovazione Ricerca Marketing, una società di Search Engine al servizio delle imprese di piccole dimensioni. Si è specializzata nel Search Engine Promotion dal 1998, compresi tre anni come il motore di ricerca specializzato per O'Reilly Media, Inc., una tecnica company.Copyright book publishing ÃÆ'à ¢ â, ¬ Å ¡Ãƒâ € šÃ,  © 2002-2005 Ricerca Innovazione Marketing. http://www.searchinnovation.com Reserved.Permission Tutti i diritti per ristampare questo articolo è concesso se l'articolo è riprodotto nella sua

Fonte dell'articolo: Messaggiamo.Com

Translation by Google Translator





Related:

» Credit Secrets Bible
» Cash Making Power Sites
» Home Cash Course
» Automated Cash Formula


Webmaster prendi il Codice Html
Aggiungi questo articolo al tuo sito ora!

Webmaster invia i tuoi Articoli
Nessuna registrazione richiesta. Compila il form e i tuoi articoli sono nella Directory di Messaggiamo.Com

Add to Google RSS Feed See our mobile site See our desktop site Follow us on Twitter!

Invia i tuoi articoli alla Directory di Messaggiamo.Com

Categorie


Copyright 2006-2011 Messaggiamo.Com - Mappa del Sito - Privacy - Webmaster invia i tuoi articoli alla Directory di Messaggiamo.Com [0.01]
Hosting by webhosting24.com
Dedicated servers sponsored by server24.eu