English version
German version
Spanish version
French version
Italian version
Portuguese / Brazilian version
Dutch version
Greek version
Russian version
Japanese version
Korean version
Simplified Chinese version
Traditional Chinese version
Hindi version
Czech version
Slovak version
Bulgarian version
 

Review: de uitvoering van de Google Search Appliance in een intranet-omgeving

Artikelen RSS Feed





Onze corporate intranet is een non-framed omgeving met zowel Lotus Domino en IIS (. Net en klassieke ASP) applicaties en content. We hebben tussen 300,000-500,000 pagina's van web content en documenten in meer dan 1200 "sites" op ongeveer 30 unieke domeinen. Vroeger Inktomi's Ultraseek Server 3.0 hebben als onze intranet zoekmachine die begon te lijken op zijn leeftijd (gekocht in 1998). Het product heeft Inktomi niet bijlagen handvat goed (DOC, PPT, PDF, enz.), niet zou kruipen onze beveiligde sites, en werd niet meer ondersteund door de verkoper. We hebben een vluchtige herziening van het zoeken verkopers en werden onmiddellijk aangetrokken tot Google 30 dagen trial bieden voor hun Google Search Appliance (GSA). Na het ondertekenen van een standaard overeenkomst, verscheept ze ons een gloednieuwe glimmend geel eenheid die we konden testen gedurende 30 dagen vóór de terugkeer of purchasing.Product infoThe GSA is een "black box" standaard 1U rack-server. Met de "zwarte doos" Ik bedoel, Google geeft je een web-interface om het apparaat te beheren, maar willen niet dat u het besturingssysteem toegang (een Google-zwaar aangepaste versie van Linux). In feite is de licentie-overeenkomst bepaalt dat u niet knoeien met de hardware of besturingssysteem van het apparaat in geen enkele manier. Het apparaat heeft geen behoefte aan een toetsenbord, muis of video ? alles wat nodig is voor normaal gebruik is een netwerk kabel en standaard power input.The GSA komt in verschillende smaken op verschillende behoeften van verschillende grootte van de hardware passen en dienovereenkomstig de omvang van de licentie. (Licensing is gebaseerd op het aantal URL's doorzocht door het apparaat.) Er zijn 3 verschillende hardware configuraties, de GB-1001, GB-5005, en GB-800. Deze zijn als volgt verdeeld; GB-1001? 150K documenten voor $ 28K, 300K documenten voor $ 50K GB-5005? 1.5M documenten voor $ 230K GB-8008? 4M documenten voor $ 450K Waarom Google? Zoals geadverteerd, de GSA voldeed aan al onze behoeften te kunnen indexeren van de grote verscheidenheid aan bestandstypen hebben we in onze milieu, de toegang tot beveiligde content, met een gedocumenteerde API, etc. De Google-merk macht was een andere grote verkopen factor. Toen we vertelden onze gebruikers dat ze gingen naar een Google-zoekmachine op basis krijgen ze wisten hun dagen van onrustige zoeken voorbij waren. Ten slotte heeft de 30-dagen trial run ervaring hadden we met de GSA verzegeld de deal. Het apparaat is de makkelijkste oplossing onderneming die ik ooit heb gehad te installeren, configureren en te onderhouden. We waren letterlijk en het functioneren binnen een uur na opening van de scheepvaart box.InstallationThe toestel heeft twee netwerk poorten op het achterpaneel, een voor de normale werking en de andere die uitsluitend gebruikt worden voor netwerk configuratie. Voor het configureren van de netwerkinstellingen we een laptop aangesloten op het apparaat via een speciale (sommige pin-outs zijn niet-standaard) oranje Ethernet-kabel die is opgenomen. Het installatie proces was ongeveer net zo makkelijk als men zich kan voorstellen voor een "black box." Eerst hebben we aangesloten op de normale werking netwerkkabel en vervolgens de macht. De stekker van het toestel is de aan / uit-schakelaar, plug hem in te schakelen en haal te schakelen het af. Na het inpluggen in, wachtten we ongeveer 5 minuten voor het apparaat te spelen een melodie die het signaal door te gaan. Vervolgens haakte we onze laptop (al ingesteld op DHCP-modus) om het apparaat en aangedreven it up. Na het inloggen op onze laptop en ervoor te zorgen hadden we het juiste IP toegewezen door het apparaat de ingebouwde DHCP-server zijn we klaar voor het configureren van de netwerkinstellingen. Totaal verstreken tijd (met uitzondering van rack mounting): 10 minutes.ConfigurationNetwork configuratie, zoals normale overheid, gebeurt volledig via een browser en is een eenvoudig 5 stappen. De eerste schermen u vragen om basisnet informatie; IP-adres, subnet masker, standaard gateway en DNS. Latere schermen verzamelen SMTP-server, "From" adres voor GSA meldingen, tijdzone, NTP (tijd) servers en de admin account naam / wachtwoord. De laatste stap is test een paar URL's die u zal kruipen om te controleren of u de setup gedaan correct. Na een laatste scherm te bekijken configuratie is voltooid en u kunt vervolgens uw laptop loskoppelen en naar het goede deel; start kruipen. Totaal verstreken tijd: 10 minutes.Crawling de site (s) Met behulp van de URL die, alle administratie van de GSA is afstand gedaan. Na het inloggen met de ID / wachtwoord we die in de vorige stap, we waren gepresenteerd met de Administratie console. We hebben een nieuwe collectie te houden onze index, gezet in de "Start kruipen van" URL, gekopieerd dezelfde URL naar de "volgen en crawlen alleen URL's met de Na patronen "box en we waren klaar. Wij redden ons instellingen en vervolgens klikt op de" Start kruipen "knop. Vervolgens liep naar de" Crawl status "scherm en keek naar de" Gecrawld URL's "tegen te gaan verhogen. Google adverteert, dat zij ongeveer 4000 URL's kan kruipen in ongeveer 15 minuten of zo. We vonden het crawlen tijd aanmerkelijk zal stijgen als er documenten (Word, PDF, Excel, enz.) die verband houden vanaf die URLS.After de crawl wordt gedaan in de collectie wordt automatisch geïndexeerd en vervolgens getoetst aan de Serving Prerequisites (eventuele criteria die u wilt gebruiken om te bepalen of te verplaatsen naar een geïndexeerde collectie productie) en de collectie ofwel zullen worden verplaatst naar de productie (en dus doorzoekbaar) of worden verplaatst naar enscenering. De staging-ruimte kun je kruipt voor validatie van nieuwe gebruikers te laten zoeken tegen them.Crawling configurationAfter uw eerste crawl u wellicht de behoefte om terug te gaan en tweak het doorzoeken parameters te vinden. Google geeft u een goede mate van controle over de manier waarop sites worden doorzocht, de frequentie, hoeveel threads worden gebruikt, enz. Voor sites met de veiligheid, de GSA ondersteunt Basic Authentication en een extra beveiliging module is beschikbaar die formulierverificatie ondersteunt. De meest uitdagende configuratie aspecten voor ons waren de bepaling de juiste combinatie van URL-patronen uit te sluiten van de zoekopdracht. Als u een Domino-winkel en op zoek naar de GSA gebruiken moet u enige tijd om de crawler configuratie precies goed te ondersteunen doorbrengen soms ingewikkelde Domino query string parameters.After kregen we de crawl afgestemd parameters en de eerste volledige crawl gedaan hebben we een aantal testen om te zien of de crawler alle content greep. Browsen onze site en testen met een aantal strijkers begraven diep in de taxonomie we altijd vonden de GSA had kroop ze nauwkeurig. We hebben ook een aantal testen met strijkers in PDF-documenten, PowerPoint-presentaties en dergelijke. Wanneer we gekomen over iets dat niet was gekropen een zorgvuldige analyse leidde ons om te ontdekken dat we nodig hadden om wat meer tweaken van de crawl doen settings.Other opmerkelijke featuresGoogle geeft je ook een KeyMatch instrument dat kunt u die geïndexeerde documenten vermeld moet worden weergegeven aan de bovenkant van de pagina met zoekresultaten voor een bepaalde zoekopdracht. Deze manifesteren zich bijna identiek aan de gesponsorde links aan de bovenkant van de pagina met resultaten van de Google we allemaal gebruiken. Een synoniem tool kunt u alternatieve woorden of zinnen te geven voor zoekopdrachten. Bijvoorbeeld, als iemand zoekt naar WCM, kunt u de suggestie 'Web Content Management "aan de bovenkant van de resultaten page.An output formaat functie kunt u controleren (via een XSLT) de presentatie van de zoekresultaten. U kunt deze gebruiken voor het veranderen van de lettertypen, kleuren, logo, header, enz. van de resultatenpagina. We waren in staat om gemakkelijk verwijderen van de "cache"-functie op de resultaten pagina met wat XSLT modifications.The Reporting tool kunt u rapporten over zoekopdrachten over verschillende tijd bereiken. Het zal u tonen het aantal zoekopdrachten per dag, per uur, de top 100 zoekwoorden en top 100 zoekopdrachten voor de periode specified.DownsidesThe GSA is niet voor organisaties op zoek naar de index hun gedeelde netwerkstations als het apparaat heeft geen voorziening voor kruipende bestandssystemen. Dit is echt te slecht als veel bedrijven worstelen met de enorme hoeveelheden ongestructureerde content op opgeslagen op hun netwerken. Natuurlijk zijn er een overvloed aan andere producten die er voor precies deze issue.Access direct naar databases (bijvoorbeeld SQL, Oracle, etc.) is een ander gebied dat is off-grenswaarden voor de GSA, alsook elke vorm van integratie met content of document management systems.ConclusionThe Google Search Appliance (GSA) is een uitstekende Zoek product voor HTTP-toegankelijke inhoud. Het geeft grote controle over de administratieve functies zoals crawler configuratie en de resultaten dienen en voldoende rapportage mogelijkheden ook. Die op zoek zijn naar een oplossing om direct te integreren met een content / document management systeem, databestanden, of indexeren netwerkstations moeten kijken naar een ander product. Echter, als u een intranet of intranet site met veel van HTML-gebaseerde content de GSA kan zijn enkel wat u need.Bryan Mjaanes is de maker / redacteur van Intranet101.com, een community-based Intranet forum voor professionals.

Artikel Bron: Messaggiamo.Com

Translation by Google Translator





Related:

» Home Made Power Plant
» Singorama
» Criminal Check
» Home Made Energy


Webmaster krijgen html code
Voeg dit artikel aan uw website!

Webmaster verzenden van artikelen
Geen registratie vereist! Vul het formulier in en uw artikel is in de Messaggiamo.Com Directory!

Add to Google RSS Feed See our mobile site See our desktop site Follow us on Twitter!

Dien uw artikelen te Messaggiamo.Com Directory

Categorieën


Copyright 2006-2011 Messaggiamo.Com - Sitemap - Privacy - Webmaster verzenden van artikelen naar Messaggiamo.Com Directory [0.01]
Hosting by webhosting24.com
Dedicated servers sponsored by server24.eu