Solr 는 내장 검색 UI를 제공하는데 이를 이용해 색인결과를 테스트해 볼 수 있다. http://localhost:8983/solr/test/browse 로 이동하면 실습과정에서 지금까지 색인한 데이터들을 확인할 수 있다. 하지만 아래 그림처럼 속도라는 키워드로 검색했을때 "세상의 속도를 따라잡고 싶다면 DO IT(HTML5 CSS3)" 라는 글이 나와야한다는 우리의 생각과는 다르게 아무것도 찾지 못했다는 결과가 나온다. 이 문제를 해결하는 방법이 바로 한글 형태소 분석기를 적용하는 것이다. 특히 한글은 어미와 조사의 사용에 의해 단어의 형태적 변형이 심하기때문에 형태소 분석기의 역할이 더 중요하다. 형태소 분석을 잘 마친 후에 색인을 하고 검색을 하게 되면 좀 더 사용자가 원하는 것에 가까운 정보를..
두번째로 소개하는 색인 방법은 data-import handler를 이용한 db 색인이다. 1. solr 설치 및 준비 에서 현재 권장버전인 solr-6.4.0 에 오류가 있어 solr-6.4.1을 사용한다고 하였는데 6.4.0 버전에서 data-import handler를 쓸때 버그가 있기 때문이다 (http://stackoverflow.com/questions/41939621/solr-mysql-sorry-no-dataimport-handler-defined) data-import handler를 이용한 db 데이터 색인은 대량의 데이터를 색인할때 굉장히 유용한 방법이니 학습해두면 큰 도움이 될 것으로 생각된다. 실습 1. 색인을 할 db를 생성한다. (본 블로그에서는 https://github.co..
SolrJ 설명 및 실습 준비 본 블로그에서는 데이터를 색인 하는 방법으로 2가지를 소개할 예정이다. 첫번째 방법은 SolrJ 를 이용하는 방법이다. SolrJ는 Solr에 접근하기 위한 java client로 solr index에 add, update, query 하는 api를 제공한다. SolrJ 실습을 진행하기 위해 Java project를 준비해야 하는데 자신의 개인 프로젝트를 사용해도 상관없지만 본 블로그에서는 https://github.com/gujc71/project9 에 올라와 있는 게시판을 사용한다. 실습 1. 텍스트 편집기를 이용하여 solr-6.4.1/server/solr/test/conf 에 위치한 managed-schema를 열어 색인할 filed를 선언한다. (id 필드는 이미 ..
데이터를 색인하고 검색하기 위해선 먼저 Core를 생성해야 한다. Core를 생성하는 방법은 2가지다. 1. 명령어를 이용 2. Solr Admin을 이용 어떤 방법을 사용해도 상관없지만 1번 방법이 더 편하기때문에 이 방법으로 진행하겠다. Core 생성 1. 터미널에 bin/solr create -c test 를 입력한다. 이는 test라는 이름을 가진 Core를 생성하는 명령어이다. (bin/solr create -help 를 입력하면 추가 명령어에 대한 설명을 볼 수 있다.) 2. 터미널에 cd server/solr 를 입력한 후 ls 명령어로 test 폴더가 생겼는지 확인한다. 3. Solr Admin 페이지를 새로고침 한 후 Core Selector 메뉴에 test라는 Core가 존재하는지 확인..
Solr 란? Solr는 Apache Lucene을 기반으로 만들어진 검색엔진이다.검색은 크게 데이터 수집, 데이터 색인, 데이터 검색의 프로세스를 가지는데 Lucene은 색인과 검색 API를 제공해주는 라이브러리다.Solr는 색인과 검색은 Lucene 엔진을 사용하면서 Http 요청에 대한 처리와 응답을 하는 웹 기반 검색엔진이라고 할 수 있다. Solr 설치 및 실행 Solr는 HTML기반의 관리자 인터페이스 Solr Admin 사이트를 제공한다.다음은 Solr를 설치하고 Solr Admin 사이트에 접속하는 방법을 순서대로 정리한 것 이다. 1. http://archive.apache.org/dist/lucene/solr/ 링크로 이동하여 solr-6.4.1 을 설치한다. (권장 버전은 6.4.0 ..