Full Text Search란

주요 DBMS별 Full Text Search

DBMS 지원여부 특징 및 제한사항
MySQL 있음 (MyISAM, InnoDB) FULLTEXT 인덱스 지원, 기본 자연어 모드와 Boolean 모드 제공
MariaDB 있음 MySQL과 유사, 일부 기능 확장
PostgreSQL 있음 tsvector/tsquery 타입, 강력한 언어별 토크나이징 및 랭킹 지원
Oracle 있음 Oracle Text 기능, 고급 분석 및 자연어 처리 지원
SQL Server 있음 Full-Text Search 서비스, 복잡한 쿼리 지원

Full Text Search 작동 원리

  1. 토큰화(Tokenization)
  2. 불용어 제거(Stop Words Removal)
  3. 어근 추출(Stemming) 및 정규화
  4. 인덱스 생성
  5. 검색 쿼리 처리
    1. 사용자가 입력한 키워드도 토큰화, 정규화 후 인덱스 조회
    2. Boolean 연산자(AND, OR, NOT), 근접성 검색, 와일드카드 등 다양한 검색 옵션 가능

MySQL 예시(InnoDB기준)

활용 시 고려사항