English version
German version
Spanish version
French version
Italian version
Portuguese / Brazilian version
Dutch version
Greek version
Russian version
Japanese version
Korean version
Simplified Chinese version
Traditional Chinese version
Hindi version
Czech version
Slovak version
Bulgarian version
 

검토: 인트라넷 환경에 있는 google 수색 기구 실행

기사 RSS Feed





우리의 법인 인트라넷은 로터스 둘 다 도미노와 IIS를 가진 비 짜맞춰진 환경이다 (. 순수한 고전적인 ASP) 신청 및 내용. 우리는 웹 내용의 300,000-500,000 페이지 사이에서 가지고 있고 문서는의 맞은편에 대략 30의 유일한 영역에 매우 1200년 "위치를 차지한다". 우리는 (1998년에 구매되는) 그것의 나이와 같이 시작되고 있던 우리의 인트라넷 검색 엔진으로 Inktomi의 UltraSeek 서버 3.0가 있었었다 보이는 것을. Inktomi 제품은 부착을 (DOC, PPT, PDF, 등등) 잘 취급하지 않으며, 우리의 안전한 사이트 포복하지 않으며, 납품업자에 의해 더 이상 지원되었다. 우리는 수색 납품업자의 조잡한 검토를 하고 그들의 Google 수색 기구 (GSA)를 위한 Google의 30일간 예심 제안에 즉각 끌렸다. 표준 계약을 후에, 그들은 저희를 우리가 30 일 동안 돌려보내거나 구매하기 전에 시험할 수 있던 아주 새로운 빛나는 노란 단위 발송했다.

제품 정보

GSA는 "비행 기록 장치" 1U 표준 선반 mountable 서버이다. "" 나가 의미하는 비행 기록 장치에 의하여, Google 장치를 관리하기 위하여 주고 당신에게 웹 공용영역을 그러나 운영 체계 (리눅스의 몹시 Google 주문을 받아서 만들어진 버전)에 접근하는 원하지 않는다 당신을. 실제로, 인가 협정은 당신이 어떤 식으로든 기구의 기계설비 또는 OS를 함부로 변경하지 않을 것이라는 점을 규정한다. 장치에는 키보드, 쥐 또는 영상을 위한 아무 필요도 없는가? 당신이 정상 작동을 위해 오직 필요로 하는 것은 네트워크 케이블 및 표준 전원 입력이다.

GSA는 다른 풍미 기계설비의 크기 및 대응하게 면허의 크기를 거쳐 변화하는 다른 필요를 적합하기 위하여 들어온다. (허용은 기구를 거쳐 URL의 수에 포복했다 근거를 둔다.) 3개의 다른 하드웨어 구성이 있다; GB-1001, GB-5005 및 GB-800. 이들은 다음과 같이 나누어진다;

GB-1001? $28K를 위한 150K 문서, $50K를 위한 300K 문서 GB-5005? $230K를 위한 1.5M 문서 GB-8008? $450K를 위한 4M 문서

왜 Google?

광고되는 것과 같이, GSA는 우리가 우리의 환경에서 가지고 있는 파일 유형, 접근에 의하여 장악된 내용의 큰 다양성에 충족시켜, 문서화한 API 색인을 붙일 수, 있는 우리의 필요 전부를 등등이 있. Google 상표 힘은 또 다른 큰 판매 요인이었다. 그들은 Google 근거한 검색 엔진을 얻기 위하여 가고 있었다는 것을 우리가 우리 사용자에게 말할 때 고생한 찾는의 그들의 일이 끝났다는 것을 알고 있었다. 최근에, 우리가 거래이라고 밀봉된 GSA로 가지고 있던 30일간 시운전 경험. 기구는 나가 이제까지 설치하고, 형성하고 유지해야 한 것이 가장 쉬운 기업 해결책이다. 우리는 사실상 화물 박스를 열기의 1 시간 이내에 운영되었다.

임명

기구에는 뒷판에 2개의 네트워크 항구가 있다; 정상 작동을 위해 1개 및 네트워크 구성에 독점적으로 사용되는 다른 사람. 네트워크 조정을 형성하기 위하여는 우리는 포함되는 특별한 (몇몇 핀 밖은 비표준 이다) 주황색 이더네트 케이블을 통해 기구에 휴대용 퍼스널 컴퓨터를 연결했다. 설치 과정은 사람이 "비행 기록 장치를 위해." 상상할 수 있는 것처럼 대략 쉬웠다

첫째로 우리는 정상 작동 네트워크 케이블 및 그 후에 힘을 연결했다. 기구에 전원 플러그는 전원 스위치이다; 켜고 그것을 끄기 위하여 그것을 플러그를 뽑도록 그것을 연결하십시오. 그것을 연결한 후에, 우리는 기구가 계속하는 신호 인 곡을 하도록 대략 5 분을 기다렸다. 다음으로, 우리는 (이미 DHCP 형태에 놓이는) 우리의 휴대용 퍼스널 컴퓨터 높은 쪽으로 기구에 그것이라고 위로 강화해 구부리고. 우리의 휴대용 퍼스널 컴퓨터에 로그인하고 확인 후에 우리는 정확한 IP를 우리가 네트워크 조정을 형성하게 준비되어 있는 기구의 붙박이 DHCP 서버에 의해 할당해 달라고 했다. 총 경과 시간 (랙 장착을 제외하고): 10 분.

윤곽

네트워크 구성은, 정상적인 행정 같이 브라우저를 통해서, 완전히 행해지고 간단한 5개 단계 과정이다. 첫번째 스크린은 기본적인 네트워크 정보를 당신을 요구한다; IP 주소, 부속망 마스크, 디폴트 게이트웨이 및 DNS. 연속적인 스크린은" GSA 통보 메시지를 위한 주소에서 SMTP 서버를, ", 시간대, NTP (시간) 서버 및 admin 계좌명 또는 암호 모은다. 마지막 단계는 당신을 체제를 정확하게 하기 위하여 확인하기 위하여 당신이 포복할 약간 URL를 시험하기 위한 것이다. 마지막 조정 검토 스크린 윤곽이 완전하던 후에 당신은 그 후에 당신의 휴대용 퍼스널 컴퓨터의 플러그를 뽑고 좋은 부분에 얻을 수 있다; 시작 포복. 총 경과 시간: 10 분.

위치 포복

URL를 사용하여, GSA의 모든 행정 멀게 행해진다 제공했다. 우리가 이전 단계에서, 우리 제공한 ID/password로 로그인 후에 관리 콘솔로 선물되었다. 우리는으로 동일한 URL가 "URL 뒤에 오는 본" 상자를서만 가진 우리가 행해졌다는 것을 따르고 포복하고 새로운 베껴진 URL "에서" 포복하는 시작에서 있던 우리의 색인을 보전되기 위하여 소장품을 창조했다. 우리는 우리의 조정을 저장하고 그 후에 "시작 포복" 단추를 눌렀다. 우리는 "기어가기 상태" 스크린 그 때 가고 "포복한 URL" 반대 증가를 봤다. Google는에 있는 또는 이렇게 대략 4,000 URL 대략 15 분 포복할 수 있다 광고한다. 우리는 그 URL에서에 연결된 문서 (낱말, PDF, 엑셀, 등등)가 있는 경우에 기어가기 시간이 두드러지게 증가할 것이라는 점을 찾아냈다.

기어가기가 행해진 후에 수집은 자동적으로 색인이 붙고 서빙 전제조건 (어떤 표준든지 결정하기 위하여 생산으로 색인이 붙은 소장품을 이동하기 위하여 당신은 사용하도록 바란다) 및 수집에 대하여 그 때 검사해 생산 (그리고 그 결과로 찾을 수 있는)로 또는 발판으로 이동되기 위하여 이동될 것이다. 중간 준비 지역은 당신이 그(것)들에 대하여 사용자 검색을 시키기 전에 새로운 기어가기를 유효하게 하게 한다.

포복 윤곽

당신의 첫번째 기어가기 후에 당신은 돌아가고 포복 매개변수를 꼬집는 필요를 찾아낼지도 모른다. Google는 얼마나 많은 실이 이용되는지 위치가 어떻게에 포복되는지 상당량의 당신에게 통제, 주파수를, 등등 준다. 안전에 위치를 위해, GSA는 기본 입증을 지원하고 모양 입증을 지원하는 추가 안전 단위는 유효하다. 저희를 위한 도전적인 윤곽 양상은 수색에서 제외하기 위하여 URL 본의 정확한 배합을 결정하고 있었다. 당신이 도미노 상점 및 GSA를 사용하기 위하여 보는 인 경우에 당신은 때때로 복잡한 도미노 질문 끈 매개변수를 지원하기 위하여 크롤러 윤곽을 다만 바르게 얻는 약간 시간을 소요할 필요가 있을 수도 있다.

기어가기 매개변수를 조정되어 얻은 후에 잘 된 첫번째 완전한 기어가기 우리는 어떤 크롤러가 모든 내용을 움켜잡는지 보기 위하여 테스트를 하고. 우리의 위치를 찾아보고 약간 끈으로 시험은 GSA는 그(것)들 정확하게 포복했었다는 것을 우리가 항상 찾아낸 분류학 안쪽에 매장했다. 우리는 또한 PDF 문서, PowerPoint 발표 안쪽에 끈을 가진 어떤 테스트를 등등 했다. 우리가 우연히 만날 때 주의깊은 분석이라고 포복되지 않았었던 무언가는 저희를 우리가 기어가기 조정의 조금 더에게 꼬집는 할 필요가 있었다는 것을 발견하는 지도했다.

다른 두드러진 특징

Google는 또한 당신에게 당신이 문서에 나타나야 하는 색인을 붙인지 어느 것이 주어진 질문을 위한 결과 페이지의 정상에 지정하는 것을 허용하는 KeyMatch 공구를 준다. 이 명백한 그들자신 우리가 모두 이용하는 Google의 결과 페이지의 정상에 후원된 연결과 거의 동일하게. 동의어 공구는 당신이 수색 질문을 위해 교체 낱말 또는 어구를 지정하는 것을 허용한다. 예를 들면, 누군가가 WCM를 찾는 경우에, 당신은 결과 페이지의 정상에 "웹 내용 관리"를 건의할 수 있다.

산출 체재 특징은 당신이 (XSLT를 통해) 수색 결과의 발표를 통제하게 한다. 당신은 결과 페이지의 글꼴, 색깔, 로고, 우두머리, 등등을 바꾸기를 위해 이것을 사용할 수 있다. 우리는 쉽게 어떤 XSLT 수정으로 결과 페이지에 "숨겨지은" 특징을 제거할 수 있었다.

보고 공구는 당신이 각종 시간 범위에 수색 질문에 보고를 달리게 한다. 그것은 당신에게 지정된 기한 동안 시간, 최고 100개의 키워드 및 정상 100 질문 당 일 당 수색의 수를, 보여줄 것이다.

Downsides

GSA는 그들의 공유 통신망 드라이브에 색인을 붙이기 위하여 보는 조직을 위해 기구에는 포복 파일 시스템을 위한 아무 시설도 없기 때문에 이지 않는다. 이것은 위에 그들의 네트워크에 저장된 체계화되지 않는 내용의 거대한 양으로 진짜로 너무 나쁘다 만큼 회사 고투한다. 당연히, 정확하게 이 문제점을 위해 다른 제품의 거기 밖으로 다혈증이 있다.

데이타베이스 (예를들면 SQL, Oracle, 등등)에 접근은 직접 내용 또는 문서 관리 체계와의 통합의 아무 종류나 뿐만 아니라 GSA를 위해 출입 금지 인 또 다른 지역이다.

결론

Google 수색 기구 (GSA)는 HTTP 접근 가능한 내용을 위한 우수한 수색 제품이다. 그것은 및 충분한 보고 기능 또한 봉사하는 크롤러 윤곽과 같은 관리 특징에 중대한 통제를 및 결과 준다. 내용 또는 문서 관리 체계, 데이타베이스와 직접 통합하기 위하여 해결책을 찾거나, 네트워크 드라이브를 색인을 붙이는 그들은 다른 제품에 봐야 한다. 그러나, 당신은 HTML 근거한 내용의 많음을 가진 인트라넷 또는 인트라넷 위치가 있는 경우에 GSA는 모른다 다만일지도 당신이 필요로 하는지 무슨.

Bryan Mjaanes는 Intranet101.com의 창조자 또는 편집자, 인트라넷 전문가를 위한 community-based 공개토론이다.

ꀰ사냴ꀰ: Messaggiamo.Com

Translation by Google Translator





Related:

» Home Made Power Plant
» Singorama
» Criminal Check
» Home Made Energy


샹냈 삤퀰 삻쁄 쁔냜
ꃀ큘쁘 샹사쁴킸샐쁴 뀸쀜끼 삔ꀀ 샀ꀈ 냹삥!

샹냈 삤퀰샐ꂌ ꀰ사끼 쀜삜큘ꀰ
쁄냈삔 냱끝 큄쀘! ꃀ큘쁘 삑생쁄 삑쀱큘ꃠ쁴 뀸쀜낔 Messaggiamo.Com 뀔뀉킠났!

Add to Google RSS Feed See our mobile site See our desktop site Follow us on Twitter!

Messaggiamo.Com 뀔뀉킠났샐 ꀰ사끼 쀜삜큘ꀰ

쁴큌ꃠ났


쀀삑ꂌ 2006-2011 Messaggiamo.Com - 사쁴킸 냵 - Privacy - 샹냈 삤퀰 Messaggiamo.Com 뀔뀉킠났샐 ꀰ사끼 쀜삜큘ꀰ [0.01]
Hosting by webhosting24.com
Dedicated servers sponsored by server24.eu