LLM API 프로덕션 호출의 진짜 어려움, RAG가 단순 조회가 아닌 이유, 에이전트 패턴(ReAct/Plan-Execute/ReWOO), 파인튜닝 언제/언제 하지 말까(LoRA/QLoRA/DPO), 벡터 DB 선택 매트릭스, LLM 평가의 근본적 어려움, 비용 최적화, Prompt Injection 방어까지. 데모가 아닌 '진짜 프로덕션' AI 앱을 만드는 법.
2024년 "에이전트의 해" 다음으로 온 2025년은 "에이전트가 제품이 된 해"다. ReAct와 Plan-Execute의 경계, Tool use 설계 원칙, LangGraph 상태 머신, 다중 에이전트 오케스트레이션, MCP와 에이전트의 관계, 그리고 실패 루프와 보안까지. 현업 관점으로 정리한 한 편.
Python은 "느리고 GIL에 갇힌" 언어였다. 2024~2025년의 Python은 free-threading(No-GIL) 실험, JIT 컴파일러, uv라는 혁명적 패키지 매니저, Polars의 Rust 백엔드 DataFrame, Pydantic v2의 Rust Core, FastAPI의 타입 안전 API, 그리고 LangChain·LangGraph·Pydantic AI로 이어지는 AI 에이전트 스택까지 — 완전히 다른 언어가 되고 있다. 이 글은 Python 3.13 시대의 Python을 현대적으로 재학습하는 가이드다. Season 2의 다섯 번째.
AI Agent Engineer는 2025년 가장 빠르게 성장하는 AI 직군입니다(시장 $47B 전망). LangGraph, CrewAI, AutoGen, Swarm, Claude Agent SDK — 에이전트 프레임워크 비교, 설계 패턴, 평가 방법, 면접 준비, 학습 로드맵 총정리.
챗봇의 멀티턴 대화에서 컨텍스트를 효과적으로 유지하는 메모리 관리 전략을 다룹니다. LangChain의 다양한 메모리 타입(Buffer, Summary, Window, Entity)과 LangGraph의 상태 기반 에이전트 아키텍처, 영속 메모리 구현, RAG 연동까지 프로덕션 환경에서의 실전 패턴을 설명합니다.