개요:
Repia Search Appliance (RSA) v3.5는 ㈜레피아에서 제공하는 고성능 실시간 검색엔진입니다.
국내 최초로 도입된 검색엔진 원천기술을 보유하고 있으며, 다양한 공공기관 및 기업, 대학의 홈페이지에서 활발히 운영되고 있습니다.
또한 웹 문서, 일반문서와 같은 비정형 데이터와 DB에 저장된 정형데이터를 수집하여 신속하고 정확한 검색 기능을 제공하고 사용자 경험을 극대화하며,
고급 분산 및 병렬 처리 기법을 통해 대규모 데이터 처리가 가능합니다.
주요기능:
ㅇ수집기
■ URL String Pattern Matching 옵션을 통한 정교한 웹 콘텐츠 수집
■ 웹 콘텐츠내의 Noise를 제외한 사용자지정 구간 수집 기능
■ Inlink된 일반문서 파일(hwp, pdf, word, ppt, excel…), 이미지, 오디오, 비디오 정보 수집 기능
■ 사용자인증이 필요한 웹콘텐츠자료 수집 기능
■ MS-SQL, Oracle, Mysql, Cubrid, DB2, Tibero등 상용 DBMS와의 연동을 통한 수집 기능
■ Hop/Depth 옵션을 통하여 불필요한 자료 수집 배제 기능
■ 검색대상 웹서버의 부하 조절 기능다국어 수집을 위한 Unicode(UTF-8)수집
ㅇ색인기
■ DB 내용 갱신 시 일괄색인 및 실시간 색인 기능
■ 증분 색인기능
■ 컬렉션/파티션의 다단계 계층 구조의 색인 파일 기능
■ 검색대상 자료의 메타필드별 색인 및 중요도 조정 기능
■ 형태소 분석을 통한 자연어/키워드/N-gram 방식 색인 지원
■ 한글/한자 자동변환 색인 기능
■ FTSE(Full Text Search Engine) 방식 (첨부문서(hwp, doc, xls, ppt, pdf, zip 등) 포함)
ㅇ검색기
■ 정형/비정형화된 자료 전체를 통합해서 검색하거나 컬렉션/파티션별로 세분화하여 검색하는 기능
■ 검색어 자동 완성 기능, 인기검색어기능, 바로가기 및 콘텐츠 가이드 기능
■ 중요도별, 날짜별, 사용자지정 필드(제목, 작성자, 날짜, 본문 등)별 정렬 기능
■ 다양한 연산자(자연어/boolean/wild 등) 검색 기능
■ 동의어(유의어)/추천어검색 기능, 원문 미리보기 기능, 내가 찾은 검색어 기능
■ 상세/확장 검색 지원(기간별, 필드별, 정렬방법 지정 기능의 동시 지원)
■ 페이지별 출력 개수 지정 기능, XML기반 검색 결과 출력 기능, 검색어 Highlighting 기능
ㅇ관리기
■ Web기반 통합검색 관리 시스템 제공
■ 검색어/시스템 로그 분석 기능, 동의어(유의어)/추천어관리 시스템 제공
■ 년/월/주/일 별 자동 스케줄링 기능
■ 검색결과 화면 커스터마이징을 위하여 SDK(Software Development Kit) 제공
특장점:
ㅇ확장성과 안정성
■ 데이터의 양(Volume of Data) > 1TB
■ 사용자 수(Number of Users) > 100QPS
■ 데이터의 신선도(Freshness of Data) < 1min → 탑재되는 시스템 환경에 따라 최적화할 수 있음
■ 정형/비정형자료검색
■ 정형화된 자료와 비정형화된 자료에 대한 통합검색
■ 구 자료와 실시간으로 입력되는 신규자료에 대한 통합검색
■ 다양한 유형의 파일 포맷 지원 : HWP, PDF, XLS, PPT, WORD, HTML, XML, TIFF 등
ㅇ유연한 시스템
■ 다양한 운영체제 지원 : WINDOWS/UNIX/LINUX(최적) 등
■ 개발자를 위한 SDK 지원 : C, JAVA 기반의 SDK 지원
■ 검색 인터페이스를 위한 API 지원 : CGI, JSP, ASP, PHP, C/S 등
ㅇ정확한 검색 결과
■ 2단계 계층(Two level Hierarchy) 구조의 색인 파일 생성
■ 고성능의 정교한 형태소 분석 기술
■ 실시간 점진적 색인(Real time Incremental Indexing) 지원
ㅇ다양한 기능
■ 통합/컬렉션별/파티션별 검색
■ 필드(Field)별 검색
■ 다양한 연산자 검색
■ 동의어(유의어)/추천어 검색
■ 날짜별/중요도별/인기도별 정렬 기능
■ 검색어 Highlighting 기능
■ 검색어 자동완성 기능
■ 콘텐츠 가이드 기능(테마 검색)
■ 내가 찾은 검색어 기능
■ 바로가기, 기간지정 기능
■ 인기검색어, 실시간 인기검색어기능
ㅇ통합관리
■ 자료 수집기, 색인기, 검색기 등 모든 컴포넌트를 웹 기반으로 제어할 수 있도록 지원함
■ 검색 로그 분석 기능을 활용한 서비스 이용 성향 분석을 지원함