English version
German version
Spanish version
French version
Italian version
Portuguese / Brazilian version
Dutch version
Greek version
Russian version
Japanese version
Korean version
Simplified Chinese version
Traditional Chinese version
Hindi version
Czech version
Slovak version
Bulgarian version
 

Revisión: la aplicación de Google Search Appliance en un entorno de intranet

Artículos RSS Feed





Nuestra intranet corporativa no es un marco con el medio ambiente de Lotus Domino e IIS (. Net y ASP clásico), las aplicaciones y los contenidos. Tenemos entre 300,000-500,000 páginas de contenido web y documentos a través de más de 1200 "sitios" en aproximadamente 30 únicos dominios. Estamos acostumbrados a tener la Inktomi Ultraseek Server 3.0 como motor de búsqueda de nuestra intranet, que está empezando a parecerse a su edad (comprado en 1998). El producto no Inktomi no manejar bien los archivos adjuntos (DOC, PPT, PDF, etc), no garantizados nuestros sitios de rastreo, y ya no se apoya por el vendedor. Hicimos una rápida revisión de la búsqueda de proveedores y se atrajo de inmediato a Google la 30 días de prueba para su oferta de Google Search Appliance (GSA). Después de firmar un acuerdo, que nos envía una nueva unidad de color amarillo brillante que podemos probar durante 30 días antes de regresar o purchasing.Product infoThe GSA es un "recuadro negro" de 1U para montaje en rack estándar de servidor. Por el de "recuadro negro" Quiero decir, Google le proporciona una interfaz web para administrar el dispositivo, pero no quiere acceder a la del sistema operativo (un en gran medida de Google versión personalizada de Linux). De hecho, el acuerdo de licencia se establece que no se altere con el hardware o sistema operativo del aparato de ninguna manera. El dispositivo no tiene ninguna necesidad de un teclado, un ratón o un vídeo ? todo lo que necesita para el funcionamiento normal es un cable de red y el nivel de potencia input.The GSA viene en diferentes sabores para satisfacer diferentes necesidades diferentes según el tamaño del hardware y el tamaño de la correspondiente licencia. (Concesión de licencias se basa en el número de URL rastreadas por el aparato.) Existen 3 diferentes configuraciones de hardware, el GB-1001, GB-5005 y GB-800. Estas se desglosan de la siguiente manera, GB-1001? 150K documentos por $ 28K, 300K documentos por $ 50 K GB-5005? 1,5 M $ 230K documentos para GB-8008? 4M documentos por $ 450K ¿Por qué Google? Como publicidad, la Asociación se reunió de todas nuestras necesidades de poder al índice de la gran variedad de archivos que tenemos en nuestro medio ambiente, acceso a contenido protegido, con un API documentado, etc El poder de marca de Google es otro gran factor de venta. Cuando le dijimos a nuestros usuarios que iban a obtener de Google basados en motor de búsqueda que conocían su días de búsqueda más agitada. Por último, el de 30 días de prueba de la experiencia que tuvimos con la GSA sellado el acuerdo. El dispositivo es la solución empresarial más fácil que he tenido que instalar, configurar y mantener. Nosotros fueron literalmente en marcha y funcionando dentro de una hora de apertura del transporte marítimo box.InstallationThe dispositivo tiene dos puertos de red en el panel trasero, uno para el funcionamiento normal y el otro utilizado exclusivamente para la red configuración. Para configurar los ajustes de red que conecta un ordenador portátil a través de un aparato especial (algunas de pin-outs no son estándar) de color naranja que es el cable Ethernet incluido. El proceso de instalación es tan fácil como uno puede imaginar para un "recuadro negro". En primer lugar, conectado en el cable de red normal de operación y luego el poder. El enchufe en el aparato es el interruptor de encendido, conecte todo para encender y desconectar a su vez fuera. Después de conectarlo en, esperamos unos 5 minutos para que el dispositivo emite una melodía que es la señal para continuar. A continuación, conectar nuestro ordenador portátil (ya que el modo de DHCP) para el aparato y lo alimenta. Después de iniciar sesión en nuestro ordenador portátil y de asegurarse de que teníamos la correcta IP asignada por el dispositivo incorporado en el servidor DHCP que está listo para configurar los ajustes de red. Tiempo transcurrido total (excluidas las de montaje en rack): 10 minutes.ConfigurationNetwork de configuración, como la administración normal, se realiza enteramente a través de un navegador y es un simple proceso de 5 pasos. La primera pantalla le pedirá información básica de la red, dirección IP, subred máscara, puerta de enlace predeterminada, y DNS. Las pantallas recoger servidor SMTP, "De" la dirección para mensajes de notificación de GSA, la zona horaria, NTP (tiempo) y el administrador de servidores de nombre de cuenta y contraseña. El último paso es URL de prueba de unos pocos que se le de rastreo para asegurarse de que ha realizado la instalación correctamente. Después de un examen final de los ajustes de configuración de pantalla completa y se puede desconectar el ordenador portátil y acceder a la parte buena; iniciar el rastreo. Tiempo total: 10 minutes.Crawling el sitio (s) de Uso de la URL que se proporciona, de la administración de la Asociación se realiza a distancia. Después de iniciar la sesión con la ID y contraseña que proporcionó en el paso anterior, se nos presentado con la consola de administración. Hemos creado una nueva colección para celebrar nuestro índice, que en el "Inicio de rastreo de" URL, copiar ese mismo URL en el campo "Seguir y rastrear sólo las URL con los A raíz de los patrones "casilla y se hicieron. Salvamos nuestra configuración y, a continuación, clic en" Iniciar rastreo "botón. Luego, a la" condición de rastreo "de la pantalla y vio" rastreados URL "contra el aumento. Google anuncia que se puede rastrear unos 4.000 URL en unos 15 minutos más o menos. Encontramos el tiempo de rastreo aumentará significativamente si existen documentos (Word, PDF, Excel, etc) relacionados a partir de los URLS.After el rastreo se ha hecho la colección se indexan automáticamente y luego cotejarán con los requisitos previos (los criterios que desea utilizar para determinar si para mover una colección indexados a producción) y la colección de ser trasladado a la producción (y, por consiguiente, la búsqueda) o se traslade al Estadiaje. El área le permite validar nuevos rastreos antes de dejar que los usuarios realicen búsquedas en contra them.Crawling configurationAfter su primer rastreo puede encontrar la necesidad de volver atrás y modificar los parámetros de rastreo. Google le da una buena cantidad de control sobre cómo se rastrean los sitios, la frecuencia, cuántos hilos se utilizan, etc Para los sitios con la seguridad, la Asociación apoya la autenticación básica y un módulo de seguridad está disponible, que apoya las formas de autenticación. La configuración de los aspectos más difíciles para nosotros fueron determinar la combinación de patrones de URL de excluir de la búsqueda. Si usted es una tienda de Domino y que buscan utilizar la GSA es posible que tenga que pasar algún tiempo obtener el rastreador de configuración justo para apoyar el a veces tortuoso Domino cadena de consulta parameters.After tenemos el rastreo parámetros sintonizado y el primer rastreo completo de hecho hemos hecho algunas pruebas para ver si el rastreador agarró todo el contenido. Navegando por nuestro sitio y pruebas con algunas cadenas enterrado profundamente dentro de la taxonomía siempre ha encontrado la GSA rastrear con precisión. También hicimos algunas pruebas con las cadenas dentro de documentos PDF, presentaciones en PowerPoint y similares. Cuando llegó a través de algo que no había sido rastreado de un cuidadoso análisis nos llevó a descubrir que tenía que hacer más ajuste del rastreo settings.Other notables featuresGoogle también le ofrece una herramienta de concordancia de palabra clave que le permite especificar que indexan los documentos deben aparecer en la parte superior de la página de resultados para una determinada consulta. Estos se manifiestan casi idéntica a la Enlaces patrocinados en la parte superior de la página de resultados de la Google todos usamos. Un Sinónimo herramienta le permite especificar palabras o frases alternativas para las consultas de búsqueda. Por ejemplo, si alguien busca WCM, puede sugerir "Web Content Management" en la parte superior de la resultados page.An formato de salida característica le permite controlar (a través de un XSLT) la presentación de los resultados de búsqueda. Usted puede usar esto para cambiar las fuentes, colores, logotipo, cabeceras, etc de la página de resultados. Hemos sido capaces de eliminar fácilmente el "caché" característica en la página de resultados con algunas de XSLT modifications.The Informes herramienta permite generar informes sobre las consultas de búsqueda en varios rangos de tiempo. Le mostrará el número de búsquedas por día, por hora, las 100 palabras y 100 primeras consultas para el período de tiempo specified.DownsidesThe GSA no es para organizaciones que buscan su índice de las unidades de red compartidas en el dispositivo no tiene ninguna instalación para rastreo de los sistemas de archivos. Esto es realmente tan malo como muchas empresas luchan con las enormes cantidades de contenido no estructurado almacenado en sus redes. Por supuesto, hay una plétora de otros productos hacia fuera allí para exactamente este issue.Access directamente a las bases de datos (por ejemplo, SQL, Oracle, etc) es otra área que está fuera de los límites de la Asociación, así como cualquier tipo de integración con el contenido o la gestión de documentos systems.ConclusionThe Google Search Appliance (GSA) es un excelente producto de búsqueda de contenidos HTTP accesible. Es un gran control sobre las funciones administrativas, como rastreador de configuración y los resultados y al servicio de información suficiente así como las capacidades. Aquellos que buscan una solución para integrar directamente con un contenido / sistema de gestión de documentos, bases de datos, o la indexación de las unidades de red debe mirar a otro producto. Sin embargo, si tiene una intranet o sitio de intranet con un montón de contenido basado en HTML GSA puede ser justo lo que need.Bryan Mjaanes es el creador / editor de Intranet101.com, un foro basado en la comunidad de profesionales de la Intranet.

Artículo Fuente: Messaggiamo.Com

Translation by Google Translator





Related:

» Home Made Power Plant
» Singorama
» Criminal Check
» Home Made Energy


Webmaster obtener el código html
Añadir este artículo a su sitio web ahora!

Webmaster Envíe sus artículos
No es necesario que se registre! Completa el formulario y su artículo está en el Messaggiamo.Com Directorio!

Add to Google RSS Feed See our mobile site See our desktop site Follow us on Twitter!

Envíe sus artículos a Messaggiamo.Com Directorio

Categorías


Derechos de autor 2006-2011 Messaggiamo.Com - Mapa del sitio - Privacy - Webmaster enviar sus artículos a Messaggiamo.Com Directorio [0.01]
Hosting by webhosting24.com
Dedicated servers sponsored by server24.eu