LLM API 프로덕션 호출의 진짜 어려움, RAG가 단순 조회가 아닌 이유, 에이전트 패턴(ReAct/Plan-Execute/ReWOO), 파인튜닝 언제/언제 하지 말까(LoRA/QLoRA/DPO), 벡터 DB 선택 매트릭스, LLM 평가의 근본적 어려움, 비용 최적화, Prompt Injection 방어까지. 데모가 아닌 '진짜 프로덕션' AI 앱을 만드는 법.
LLM을 "프롬프트에 답하는 블랙박스"로만 쓰면 임계점에서 막힌다. Transformer의 Attention이 실제로 어떻게 토큰 관계를 계산하는지, Pre-training → SFT → RLHF → DPO 파이프라인이 왜 이 순서로 설계됐는지, RAG 1/2/3세대의 차이와 Agentic RAG의 본질, Agent 설계(ReAct, Plan-and-Execute, Multi-Agent)의 근본 패턴, 그리고 LLM 평가가 왜 미해결 문제인지까지 — 블랙박스를 뜯어보는 한 편. Season 2의 여섯 번째, 2025년 엔지니어의 필수 교양.
Python은 "느리고 GIL에 갇힌" 언어였다. 2024~2025년의 Python은 free-threading(No-GIL) 실험, JIT 컴파일러, uv라는 혁명적 패키지 매니저, Polars의 Rust 백엔드 DataFrame, Pydantic v2의 Rust Core, FastAPI의 타입 안전 API, 그리고 LangChain·LangGraph·Pydantic AI로 이어지는 AI 에이전트 스택까지 — 완전히 다른 언어가 되고 있다. 이 글은 Python 3.13 시대의 Python을 현대적으로 재학습하는 가이드다. Season 2의 다섯 번째.
AI 하네스(Harness)는 AI 모델을 감싸서 제어하는 오케스트레이션 레이어입니다. System Prompt, Tools, Context, Skills, Hooks, Permissions, Memory의 7가지 구성 요소를 해부하고, Claude Agent SDK와 LangGraph로 직접 만드는 방법까지 — AI 엔지니어 필독 가이드.