데이터베이스를 "SQL 쓰는 곳"으로만 쓰면 평생 주니어다. B-Tree·LSM-Tree·Hash Index의 내부 구조, 쿼리 플래너가 쿼리를 어떻게 실행으로 바꾸는지, 트랜잭션 격리 수준 4단계, 샤딩·파티셔닝 전략, PostgreSQL의 2025년 독주 현상, 그리고 Vector DB(pgvector·Qdrant·Weaviate)까지 — DB의 내부를 회로도 수준으로 뜯는 한 편. Season 2의 열세 번째.
Season 5 Ep 6. ML의 언어는 피처, AI의 언어는 벡터, 관계의 언어는 그래프, 운영의 언어는 시계열. 2025년 각 DB 카테고리가 서로 경계를 넘고 Lakehouse·Postgres 위에 수렴한다. Feature Store 재정의, Online-Offline skew, Vector DB 지형, Graph DB와 지식 그래프, 시계열 DB의 현주소, "Unified DB"의 등장, AI가 DB 지형에 준 충격, 한국 기업의 실무 선택까지.
LLM에 외부 지식을 붙이는 가장 실용적인 패턴, RAG. 2025년 시점에서 임베딩 모델 선택, 청킹 전략, 벡터 DB 선택, Rerank, Hybrid Search, 그리고 Fine-tuning과의 경계까지. Notion AI와 Claude의 검색 아키텍처를 해부하고, 한국어 RAG의 특수성과 비용·지연시간 최적화 체크리스트를 한 호흡에 정리합니다.