데이터베이스를 "SQL 쓰는 곳"으로만 쓰면 평생 주니어다. B-Tree·LSM-Tree·Hash Index의 내부 구조, 쿼리 플래너가 쿼리를 어떻게 실행으로 바꾸는지, 트랜잭션 격리 수준 4단계, 샤딩·파티셔닝 전략, PostgreSQL의 2025년 독주 현상, 그리고 Vector DB(pgvector·Qdrant·Weaviate)까지 — DB의 내부를 회로도 수준으로 뜯는 한 편. Season 2의 열세 번째.
왜 PostgreSQL과 RocksDB는 다른 자료구조를 택했나. WAL이 없는 DB가 없는 이유. MVCC의 xmin/xmax, Vacuum이 느려지는 진짜 원인, BRIN/GIN/GiST/HNSW 인덱스, Query Planner가 같은 쿼리를 달리 실행하는 논리, Replication의 논리 vs 물리. '왜 DB는 느려지는가'에 대한 완전한 답.
1996년 Ingres 계보에서 파생된 PostgreSQL이 2024년 StackOverflow 개발자 설문 1위에 올랐다. pgvector가 Pinecone을 위협하고, JSONB가 MongoDB를 위협하고, Supabase/Neon이 Firebase를 위협한다. "하나의 DB로 모든 것"이라는 오래된 꿈이 현실이 된 배경 — MVCC의 우아함, Write-Ahead Logging, 확장 시스템, 그리고 AI 시대의 벡터 검색까지 추적한다.
Vector DB의 모든 것! 벡터 임베딩 원리, 유사도 검색(코사인/유클리드/내적), 인덱싱 알고리즘(HNSW/IVF/PQ), Pinecone vs Weaviate vs Qdrant vs Milvus vs pgvector 비교, 하이브리드 검색, 필터링, 프로덕션 운영, 성능 벤치마크.
RAG 시대의 핵심 인프라 Vector Database를 완전 분석합니다. Pinecone, Weaviate, Milvus, Qdrant, pgvector, Chroma 6대 벡터 DB 아키텍처/성능/비용 비교, 임베딩 모델 선택, ANN 알고리즘(HNSW/IVF), 하이브리드 검색, 프로덕션 운영 가이드.