분산 트레이싱의 모든 것! Trace/Span/Context Propagation, OpenTelemetry SDK + Collector, Jaeger vs Tempo vs Zipkin, W3C Trace Context, 샘플링 전략(Head/Tail/Probabilistic), Auto-instrumentation, 비용 최적화.
"관측할 수 없으면 운영할 수 없다." Observability는 로그 수집·모니터링의 상위 개념으로, 알려지지 않은 문제(unknown unknowns)를 시스템 상태만으로 추론할 수 있게 하는 능력이다. 이 글은 Metric·Log·Trace 3축, Profile을 더한 4축, OpenTelemetry 표준의 진짜 가치, eBPF 커널 수준 관측, SLO·SLI·Error Budget 실전 설계, 그리고 Grafana Stack vs Elastic vs Datadog 2025 선택까지를 한 편에 정리한다. Season 2의 아홉 번째.