Elasticsearch가 매일 수십억 로그를 수 밀리초에 검색하는 비결. Lucene segment 구조, inverted index, refresh/flush/merge 사이클, shard routing, near real-time 검색 구현까지 720줄로 완전 분석한다.
검색은 왜 어렵나? Lucene의 Segment와 Merge, Inverted Index의 수학, BM25가 TF-IDF를 어떻게 이겼나, primary/replica shard와 routing, Ingest 파이프라인, Query DSL의 미로, kNN과 HNSW, 2021년 Elastic vs AWS 라이선스 전쟁과 OpenSearch 포크, Hybrid Search로 완성되는 RAG 시대 — 모든 검색 뒤에 숨은 엔진의 모든 것.
검색 엔진의 모든 것! Inverted Index 구조, TF-IDF/BM25 알고리즘, Lucene/Elasticsearch 내부, Tokenization/Analyzer, Boolean/Phrase/Fuzzy 쿼리, Vector Search(임베딩), Hybrid Search, RRF, 검색 품질 평가.