LLM API 프로덕션 호출의 진짜 어려움, RAG가 단순 조회가 아닌 이유, 에이전트 패턴(ReAct/Plan-Execute/ReWOO), 파인튜닝 언제/언제 하지 말까(LoRA/QLoRA/DPO), 벡터 DB 선택 매트릭스, LLM 평가의 근본적 어려움, 비용 최적화, Prompt Injection 방어까지. 데모가 아닌 '진짜 프로덕션' AI 앱을 만드는 법.
검색은 왜 어렵나? Lucene의 Segment와 Merge, Inverted Index의 수학, BM25가 TF-IDF를 어떻게 이겼나, primary/replica shard와 routing, Ingest 파이프라인, Query DSL의 미로, kNN과 HNSW, 2021년 Elastic vs AWS 라이선스 전쟁과 OpenSearch 포크, Hybrid Search로 완성되는 RAG 시대 — 모든 검색 뒤에 숨은 엔진의 모든 것.
LLM을 "프롬프트에 답하는 블랙박스"로만 쓰면 임계점에서 막힌다. Transformer의 Attention이 실제로 어떻게 토큰 관계를 계산하는지, Pre-training → SFT → RLHF → DPO 파이프라인이 왜 이 순서로 설계됐는지, RAG 1/2/3세대의 차이와 Agentic RAG의 본질, Agent 설계(ReAct, Plan-and-Execute, Multi-Agent)의 근본 패턴, 그리고 LLM 평가가 왜 미해결 문제인지까지 — 블랙박스를 뜯어보는 한 편. Season 2의 여섯 번째, 2025년 엔지니어의 필수 교양.
1996년 Ingres 계보에서 파생된 PostgreSQL이 2024년 StackOverflow 개발자 설문 1위에 올랐다. pgvector가 Pinecone을 위협하고, JSONB가 MongoDB를 위협하고, Supabase/Neon이 Firebase를 위협한다. "하나의 DB로 모든 것"이라는 오래된 꿈이 현실이 된 배경 — MVCC의 우아함, Write-Ahead Logging, 확장 시스템, 그리고 AI 시대의 벡터 검색까지 추적한다.
LLM에 외부 지식을 붙이는 가장 실용적인 패턴, RAG. 2025년 시점에서 임베딩 모델 선택, 청킹 전략, 벡터 DB 선택, Rerank, Hybrid Search, 그리고 Fine-tuning과의 경계까지. Notion AI와 Claude의 검색 아키텍처를 해부하고, 한국어 RAG의 특수성과 비용·지연시간 최적화 체크리스트를 한 호흡에 정리합니다.
Databricks AI Engineer (FDE) JD를 완전 분석합니다. Spark/Delta Lake/Unity Catalog 기술 스택, Lakehouse 아키텍처, RAG 파이프라인 구축, 고객 현장 배포 역량까지 — 면접 예상 질문 25선과 8개월 학습 로드맵.
RAG 시대의 핵심 인프라 Vector Database를 완전 분석합니다. Pinecone, Weaviate, Milvus, Qdrant, pgvector, Chroma 6대 벡터 DB 아키텍처/성능/비용 비교, 임베딩 모델 선택, ANN 알고리즘(HNSW/IVF), 하이브리드 검색, 프로덕션 운영 가이드.
BM25와 벡터 검색의 약점을 서로 보완하는 Hybrid Search를 RRF(Reciprocal Rank Fusion)로 구현하는 방법을 실제 코드와 함께 설명합니다. 순수 벡터 검색의 한계, BM25의 강점, 그리고 LangChain으로 실전 구현하는 방법을 다룹니다.
RAGAS의 4가지 핵심 지표(Faithfulness, Answer Relevancy, Context Precision, Context Recall)를 이해하고, 실제 Python 코드로 RAG 시스템을 평가하는 방법을 설명합니다. 자동 평가 파이프라인 구축과 테스트셋 생성까지 실전 중심으로 다룹니다.
임베딩의 기본 개념부터 주요 모델 비교(OpenAI, Cohere, BGE, E5, GTE, Jina), Sentence Transformers 활용, 벡터 데이터베이스(Pinecone, Weaviate, Milvus, Chroma, FAISS) 인덱싱 전략, 유사도 검색, RAG 파이프라인 통합, 파인튜닝, MTEB 벤치마크 평가까지 임베딩 모델의 모든 것을 실전 코드와 함께 체계적으로 다룹니다.
Retrieval-Augmented Generation(RAG) 연구의 진화를 논문 중심으로 추적합니다. 초기 RAG(Lewis et al.)부터 RETRO의 대규모 검색, Self-RAG의 자기 반성, Corrective-RAG의 검색 품질 평가까지 핵심 아키텍처와 벤치마크를 비교 분석합니다.
RAG(Retrieval-Augmented Generation) 파이프라인의 프로덕션 구축을 체계적으로 다룹니다. 임베딩 모델 비교, 벡터 DB 선택(Pinecone·Milvus·Weaviate·Qdrant·Chroma), 청킹 전략, 하이브리드 검색, 리랭킹, RAGAS 평가 메트릭, 장애 대응까지 실전 운영 노하우를 제공합니다.
RAG(Retrieval-Augmented Generation) 시스템의 품질을 체계적으로 평가하는 방법과 흔히 발생하는 실패 패턴들을 분석합니다. Retriever, Reranker, Generator 각 컴포넌트의 평가 지표부터 RAGAS, DeepEval 같은 프레임워크 비교, 그리고 실전 디버깅 워크플로우까지 다룹니다.