데이터 과잉의 시대의 핵심은 ‘검색’
빅데이터의 시대라 했다. 세상 모든 정보가 디지털화되어 쌓이고 있다. 데이터는 그 자체로는 의미가 없다. 이를 조합하고 검색할 때 비로소 정보가 되는 것이다. 그래서 빅데이터 다음에 온 키워드가 분석이며, 분석과 함께 필연적으로 언급되는 것이 검색이다.
우리가 사용하는 대부분의 웹 서비스는 검색에 기인한다고 해도 과장이 아니다. 구글이나 네이버의 서비스 근간은 검색이었으며, 이제는 지도 서비스, 문서 서비스 혹은 메신저와 같은 개별 앱(프로그램)에서도 검색창이 있다. 원하는 걸 바로 찾아야만 데이터는 정보로써 가치가 있는 법이다.
지금까지는 상용 검색 엔진을 구입하거나 자체 엔진을 개발해야 했지만, 지금은 ‘루씬’이 있다. 루씬은 자바 기반의 오픈소스 검색 라이브러리로 상용 검색 엔진에 버금가는 안정성과 고급 검색 기술을 갖췄다. 웹서비스에서 여전히 각광받는 자바 라이브러리라 활용도가 높고, 커스터마이징도 가능하다.
자바 기반 오픈소스 검색 엔진 루씬에 입문하기 위한 안내
『실전비급 아파치 루씬 7』은 그간 검색 엔진에 관심 있어 루씬을 알아봤으나, 어떻게 시작할지 막막한 이들, 나아가 엘라스틱서치와 솔라의 핵심인 루씬을 더 깊이 이해하고자 하는 개발자를 위한 안내서다.
이 책은 검색의 기초부터 고급 검색까지 한 권으로 다뤄 입문자들이 쉽게 접근할 수 있게 도왔으며, 루씬의 주요 개념과 동작 원리 등의 정확한 개념 설명과 풍부한 코드를 제시해 기존 개발자들의 갈증을 해소하려 했다.
충분한 주석과 상세한 설명이 곁들여진 코드는 깃허브로 추가 제공하여 전체 코드를 바로바로 확인할 수 있게 구성했다. 또한 각 장의 파일럿 프로젝트는 기존 서비스에 추가할 수 있을 수준의 실무 예제로 구성하였다.
자, 이제 루씬의 검색 세계로 떠나보자.
누구를 위한 책인가?
이 책의 특징
CHPATER 1 루씬의 이해
1.1 루씬이란?
1.2 루씬이 제공하는 두 가지 핵심 기능
1.3 루씬 살펴보기
1.4 핵심 클래스 리뷰
CHPATER 2 루씬 파일럿 프로젝트
2.1 전국 음식점 검색 프로젝트 개요
2.2 파일럿 프로젝트 요구사항
2.3 파일럿 프로젝트 구성하기
2.4 파일럿 프로젝트 분석하기
CHPATER 3 쇼핑몰 후기로 알아보는 색인 이야기
3.1 파일럿 프로젝트 구축하기
3.2 색인 이해하기
3.3 IndexWriter
3.4 도큐먼트와 필드
3.5 다양한 데이터 타입 필드
3.6 DocValues
CHAPTER 4 트위터 날씨 데이터로 알아보는 분석 이야기
4.1 파일럿 프로젝트 구축하기
4.2 분석 이해
4.3 문장을 음절로 분석하기
4.4 기본 분석기
4.5 확장 분석기
4.6 언어별 형태소 분석기
CHAPTER 5 한국 걷기여행길 관광정보로 알아보는 검색 이야기
5.1 파일럿 프로젝트 구축하기
5.2 전문 검색의 이해
5.3 IndexReader와 IndexSearcher
5.4 Query와 QueryParser 클래스
5.5 다양한 검색 Query
CHPATER 6 루씬 고급 검색
6.1 파일럿 프로젝트 구축하기
6.2 검색 결과 정렬
6.3 검색 필터링
6.4 다중 색인 검색
6.5 텀벡터
6.6 검색 결과의 점수 계산법
CHAPTER 7 루씬 동작 방식 이해하기
7.1 세그먼트
7.2 색인과 동시성
7.3 순위 점수 계산 모델
CHAPTER 8 루씬 확장 기능
8.1 파일럿 프로젝트 구축하기
8.2 하이라이팅
8.3 다양한 한글 형태소 분석기
8.4 MoreLikeThis
리얼타임 eBook 안내
PDF 형식으로 제공되며, 다운로드한 eBook은 PDF 포맷을 지원하는 디바이스 또는 프로그램에서 제한없이 열람할 수 있습니다. 또한 eBook 내의 텍스트 검색 및 인쇄도 가능합니다.