커널에 안전하게 코드를 주입한다 — 그것이 eBPF의 혁명이다. 이 글은 eBPF의 내부부터 실전까지 해부합니다. 가상머신과 바이트코드 구조, 프로그램을 안전하게 만드는 Verifier, 맵(Hash/Array/Ring Buffer/Perf), 프로그램 타입(kprobe/tracepoint/XDP/TC/LSM), BTF와 CO-RE, XDP 고성능 패킷 처리, 그리고 Cilium/Falco/Pixie가 이것을 어떻게 활용하는지 — 관측성, 보안, 네트워킹을 재정의한 기술을 처음부터 끝까지 이해하고 싶은 엔지니어를 위한 종합 가이드입니다.
eBPF의 모든 것 — 1992년 cBPF에서 2014년 eBPF, 그리고 2024년 sched_ext까지의 역사. 11개 레지스터의 가상 머신 ISA, Verifier의 정적 분석, JIT 컴파일, BTF와 CO-RE, 17종 이상의 BPF Map, 200개 넘는 헬퍼 함수, kprobe/uprobe/tracepoint/XDP/tc/LSM/cgroup/sched_ext 어태치 포인트, libbpf vs BCC vs bpftrace, Cilium·Tetragon·Falco·bpftune 실제 사례까지 1,400줄로 정리.
2014년 Google이 Borg 경험을 기반으로 공개한 Kubernetes는 10년 만에 클라우드의 운영 체제가 됐다. 하지만 그 복잡도는 악명 높고, "K8s는 정말 필요한가"라는 질문은 매년 반복된다. etcd부터 Ambient Mesh, ArgoCD, Backstage, Karpenter, WASM까지 — K8s 생태계의 전 지형도와 실전 운영 트레이드오프를 정리한다.
epoll의 후계자 io_uring, Docker를 만든 cgroups + namespaces, 커널에 안전하게 코드를 주입하는 eBPF, NUMA가 주는 숨은 비용, GPU 드라이버와 UVM, 2024년 Linux에 들어온 EEVDF 스케줄러, Zero-Copy + RDMA, WSL2. 앱 밑에서 OS가 하는 모든 일을 현대적 관점으로 한 번에 정리.
"관측할 수 없으면 운영할 수 없다." Observability는 로그 수집·모니터링의 상위 개념으로, 알려지지 않은 문제(unknown unknowns)를 시스템 상태만으로 추론할 수 있게 하는 능력이다. 이 글은 Metric·Log·Trace 3축, Profile을 더한 4축, OpenTelemetry 표준의 진짜 가치, eBPF 커널 수준 관측, SLO·SLI·Error Budget 실전 설계, 그리고 Grafana Stack vs Elastic vs Datadog 2025 선택까지를 한 편에 정리한다. Season 2의 아홉 번째.
분산 시스템에서 가장 중요한 역량은 "모르는 것을 알게 되는 능력"이다. 2024-2025년 관측 가능성은 혁명의 한복판에 있다. OpenTelemetry 1.0 GA, eBPF 기반 agentless 프로파일링, Continuous Profiling 주류화, Datadog vs Grafana vs Honeycomb 경쟁 재편. Metrics/Logs/Traces/Profiles 4-pillar부터 SLO 실전까지 추적한다.
eBPF 기술과 OpenTelemetry 표준화의 결합으로, 2026년 관찰가능성은 근본적으로 변화하고 있습니다. 제로 계측(zero-instrumentation) 트레이싱, AI 기반 근본원인 분석, 비용 최적화된 관찰가능성 스택이 표준이 되어, 엔지니어들은 이제 "왜"의 질문에 즉시 답할 수 있습니다.