LLM API 프로덕션 호출의 진짜 어려움, RAG가 단순 조회가 아닌 이유, 에이전트 패턴(ReAct/Plan-Execute/ReWOO), 파인튜닝 언제/언제 하지 말까(LoRA/QLoRA/DPO), 벡터 DB 선택 매트릭스, LLM 평가의 근본적 어려움, 비용 최적화, Prompt Injection 방어까지. 데모가 아닌 '진짜 프로덕션' AI 앱을 만드는 법.
RAG 시대의 핵심 인프라 Vector Database를 완전 분석합니다. Pinecone, Weaviate, Milvus, Qdrant, pgvector, Chroma 6대 벡터 DB 아키텍처/성능/비용 비교, 임베딩 모델 선택, ANN 알고리즘(HNSW/IVF), 하이브리드 검색, 프로덕션 운영 가이드.