English version
German version
Spanish version
French version
Italian version
Portuguese / Brazilian version
Dutch version
Greek version
Russian version
Japanese version
Korean version
Simplified Chinese version
Traditional Chinese version
Hindi version
Czech version
Slovak version
Bulgarian version
 

Recensione: l'attuazione del Google Search Appliance in un ambiente Intranet

Articoli RSS Feed





La nostra intranet aziendale è un non-incorniciato ambiente sia con Lotus Domino e IIS (. Net e ASP classico), le applicazioni ei contenuti. Abbiamo tra 300.000-500.000 pagine di contenuti web e documenti tra più di 1200 "siti" a circa 30 domini univoci. Abbiamo utilizzato per avere Inktomi's Ultraseek Server 3.0 come il nostro motore di ricerca Intranet, che stava cominciando ad assomigliare la sua età (acquistato nel 1998). Il prodotto ha Inktomi Non maneggiare gli allegati pure (DOC, PPT, PDF, ecc), non eseguire la scansione dei nostri siti garantiti, e non era più supportato dal produttore. Abbiamo fatto un esame superficiale dei venditori di ricerca e sono stati immediatamente attratti da Google 30 giorni di prova offre per il loro Google Search Appliance (GSA). Dopo aver firmato un contratto standard, hanno consegnato a noi una nuova unità di colore giallo brillante che abbiamo potuto provare per 30 giorni prima di tornare o purchasing.Product infoThe GSA è una "scatola nera" 1U rack standard-server montabili. Dalla "scatola nera" Voglio dire, Google fornisce una interfaccia web per amministrare il dispositivo, ma non vogliono accedere al sistema operativo (a pesantemente Google-versione personalizzata di Linux). In effetti, il contratto di licenza prevede che non manomettere l'hardware o sistema operativo dell'apparecchio in alcun modo. Il dispositivo non ha bisogno di una tastiera, un mouse o un video ? tutto il necessario per il funzionamento normale è un cavo di rete standard e input.The potere GSA è disponibile in diversi sapori per soddisfare esigenze diverse variabili in base alle dimensioni dei componenti hardware e di conseguenza la dimensione della licenza. (Licenza si basa sul numero di URL scansionati da parte dell'apparecchio.) Esistono 3 diverse configurazioni hardware, il GB-1001, GB-5005, e GB-800. Questi sono ripartiti come segue: GB-1001? 150K documenti per $ 28K, 300K documenti per $ 50K GB-5005? Documenti per 1,5 M $ 230K GB-8008? 4M documenti per $ 450K Perché Google? Quanto pubblicizzato, la GSA incontrato tutte le nostre esigenze sia in grado di indicizzare la grande varietà di tipi di file che abbiamo nel nostro , il contenuto dell'ambiente accesso sicuro, con un documentato API, ecc La forza del marchio Google è stato un altro grande fattore di vendita. Quando abbiamo detto ai nostri utenti che stavano andando a prendere un Google basato su motore di ricerca di conoscere la loro giorni di tormentata ricerca erano finiti. Infine, la prova di 30 giorni l'esperienza conduzione abbiamo avuto con il GSA sigillato l'affare. L'apparecchio è la soluzione più semplice impresa che abbia mai avuto da installare, configurare e mantenere. Noi sono stati letteralmente installato e funzionante all'interno di un ora di aprire l'apparecchio di navigazione box.InstallationThe dispone di due porte di rete sul pannello posteriore, uno per il normale funzionamento e gli altri utilizzati esclusivamente per la rete configurazione. Per configurare le impostazioni di rete che abbiamo un computer portatile collegato all'apparecchio tramite uno speciale (alcune pin-outs sono non-standard), cavo Ethernet arancio, che è incluso. Il processo di installazione è stata altrettanto facile come si può immaginare per una "scatola nera." Prima abbiamo collegato il cavo di rete normale funzionamento e quindi la potenza. La spina di alimentazione per l'apparecchio è l'interruttore di alimentazione, plug in per accendere e staccare la spina a sua volta it off. Dopo aver inserito dentro, abbiamo aspettato circa 5 minuti per l'apparecchio per riprodurre una melodia che è il segnale per continuare. Successivamente, abbiamo collegato il nostro portatile (già impostato sulla modalità DHCP) per l'apparecchio e alimentato in su. Dopo l'accesso al nostro computer portatile e fare in modo abbiamo avuto l'IP corretto assegnato dalla appliance's built-in DHCP server siamo pronti per configurare le impostazioni di rete. Tempo trascorso totale (esclusi il montaggio in rack): 10 configurazione minutes.ConfigurationNetwork, come normale amministrazione, è fatta interamente tramite un browser, ed è un processo semplice passaggio 5. First Screens chiediamo le informazioni di base della rete, l'indirizzo IP, subnet , mask gateway predefinito e DNS. Le schermate successive raccogliere server SMTP, indirizzo "Da" per i messaggi di notifica GSA, fuso orario, NTP (tempo) i server e il nome account admin / password. L'ultimo passo è quello di test di alcuni indirizzi che vi sarà la scansione per assicurarsi che hai fatto l'installazione correttamente. Dopo un finale impostazioni di configurazione dello schermo di revisione è stata completata e quindi è possibile scollegare il computer portatile e di arrivare alla parte buona; Avvia scansione. Tempo totale trascorso: 10 minutes.Crawling il sito (s) con l'URL fornito, tutta l'amministrazione della GSA è fatto da remoto. Dopo l'accesso con l'ID / password che abbiamo fornito nel passaggio precedente, siamo stati presentato con la console di amministrazione. Abbiamo creato una nuova collezione di tenere il nostro indice, messo in "Avvia scansione da" URL, copia l'URL nella "Segui e scansiona solo gli URL con il Seguenti modelli di "finestra e ci sono stati fatti. Abbiamo salvato le nostre impostazioni e poi cliccato su" Avvia scansione "pulsante. Poi si avvicinò allo status" Crawl "dello schermo e guardò il Scansionati" URL "aumento del contatore. Google annuncia che è in grado di scansionare circa 4.000 gli URL in circa 15 minuti o così. Abbiamo trovato il tempo di scansione potrebbe aumentare in modo significativo se non ci sono documenti (Word, PDF, Excel, ecc) collegati a da quelli URLS.After la scansione viene eseguita la raccolta viene indicizzata automaticamente e poi controllato contro i prerequisiti di elaborazione (i criteri che si desidera utilizzare per decidere se spostare una raccolta indicizzata di produzione) e la raccolta o sarà spostato alla produzione (e di conseguenza per la ricerca) o essere spostati nei punti di sosta. L'area di sosta ti permette di validare nuove scansioni prima di lasciare gli utenti della ricerca contro them.Crawling configurationAfter il primo scansione si può trovare la necessità di tornare indietro e modificare i parametri di scansione. Google offre una buona quantità di controllo su come i siti vengono scansionati, la frequenza, il numero di thread sono utilizzati, Per i siti con la sicurezza, la GSA supporta l'autenticazione di base e un modulo aggiuntivo di sicurezza è disponibile che supporta autenticazione basata su form. Aspetti più impegnativi di configurazione per noi erano la determinazione la giusta combinazione di modelli di URL di escludere dalla ricerca. Se sei un negozio di Domino e cercando di utilizzare il GSA potrebbe essere necessario per trascorrere del tempo trovato la configurazione spider giusto per sostenere la a volte contorti Domino parameters.After stringa di query abbiamo ottenuto i parametri di scansione sintonizzati e la prima scansione completa fatto che abbiamo fatto alcuni test per vedere se il crawler ha afferrato tutti i contenuti. Navigando nel nostro sito e test con alcune stringhe sepolto all'interno della tassonomia abbiamo sempre trovato la GSA ha strisciato in modo esatto. Abbiamo anche fatto dei test con le stringhe all'interno di documenti PDF, presentazioni PowerPoint e simili. Quando abbiamo ha incontrato qualcosa che non era stata eseguita la scansione una attenta analisi ci ha portato a scoprire che avevamo bisogno di fare qualche modifica più della scansione featuresGoogle settings.Other notevole fornisce anche uno strumento che KeyMatch consente di specificare quali documenti indicizzati dovrebbe apparire nella parte superiore della pagina dei risultati di una data query. Questi si manifestano in modo quasi identico al link sponsorizzati nella parte superiore della pagina dei risultati della Google tutti noi utilizziamo. Uno strumento Sinonimo permette di specificare le parole o frasi alternative per le query di ricerca. Ad esempio, se qualcuno cerca WCM, puoi suggerire "Web Content Management" nella parte superiore della Risultati della funzione il formato di output page.An ti permette di controllare (tramite un XSLT) la presentazione dei risultati della ricerca. È possibile utilizzare questo per cambiare i font, i colori, logo, intestazioni, ecc nella pagina dei risultati. Siamo stati in grado di rimuovere facilmente il "Copia cache" funzione nella pagina dei risultati, con qualche strumento di XSLT Reporting modifications.The ti permette di eseguire report per ricerche su intervalli di tempo diversi. Essa vi mostrerà il numero di ricerche al giorno, per ora, le prime 100 parole chiave e top 100 domande per il periodo di tempo specified.DownsidesThe GSA non è per le organizzazioni che cercano di indicizzare le loro unità di rete condivise, l'apparecchio non ha alcuna agevolazione per l' la scansione dei file system. Questo è veramente troppo male come molte aziende lotta con le enormi quantità di contenuti non strutturati su memorizzati sulle loro reti. Naturalmente, ci sono una pletora di altri prodotti là fuori per esattamente questo issue.Access direttamente alle basi di dati (ad esempio, SQL, Oracle, ecc) è un altro settore che è off-limits per la GSA, nonché qualsiasi tipo di integrazione con i contenuti o systems.ConclusionThe document management Google Search Appliance (GSA) è un ottimo prodotto di ricerca per il protocollo HTTP-contenuti accessibili. Dà un grande controllo su funzioni amministrative, come la configurazione del crawler e risultati che servono e sufficiente di segnalazione capacità pure. Coloro che cercano una soluzione per integrare direttamente con un contenuto / sistema di gestione dei documenti, database, o le unità di rete di indicizzazione dovrebbe guardare ad un altro prodotto. Tuttavia, se si dispone di una rete intranet o un sito intranet con abbondanza di contenuto HTML della GSA può essere solo quello need.Bryan si Mjaanes è il creatore / redattore di Intranet101.com, una comunità basata forum per i professionisti Intranet.

Fonte dell'articolo: Messaggiamo.Com

Translation by Google Translator





Related:

» Home Made Power Plant
» Singorama
» Criminal Check
» Home Made Energy


Webmaster prendi il Codice Html
Aggiungi questo articolo al tuo sito ora!

Webmaster invia i tuoi Articoli
Nessuna registrazione richiesta. Compila il form e i tuoi articoli sono nella Directory di Messaggiamo.Com

Add to Google RSS Feed See our mobile site See our desktop site Follow us on Twitter!

Invia i tuoi articoli alla Directory di Messaggiamo.Com

Categorie


Copyright 2006-2011 Messaggiamo.Com - Mappa del Sito - Privacy - Webmaster invia i tuoi articoli alla Directory di Messaggiamo.Com [0.01]
Hosting by webhosting24.com
Dedicated servers sponsored by server24.eu