Elasticsearch가 매일 수십억 로그를 수 밀리초에 검색하는 비결. Lucene segment 구조, inverted index, refresh/flush/merge 사이클, shard routing, near real-time 검색 구현까지 720줄로 완전 분석한다.
검색 엔진의 모든 것! Inverted Index 구조, TF-IDF/BM25 알고리즘, Lucene/Elasticsearch 내부, Tokenization/Analyzer, Boolean/Phrase/Fuzzy 쿼리, Vector Search(임베딩), Hybrid Search, RRF, 검색 품질 평가.
BM25와 벡터 검색의 약점을 서로 보완하는 Hybrid Search를 RRF(Reciprocal Rank Fusion)로 구현하는 방법을 실제 코드와 함께 설명합니다. 순수 벡터 검색의 한계, BM25의 강점, 그리고 LangChain으로 실전 구현하는 방법을 다룹니다.