DynamoDB, Cassandra, Memcached가 노드 추가/제거 시 데이터 이동을 최소화하는 비밀, Consistent Hashing을 완전 정복한다. 기본 아이디어부터 가상 노드(vnode), Jump Hash, Rendezvous Hashing, 실전 구현까지 700줄로 깊이 있게 다룬다.
CRDT의 모든 것! Conflict-free Replicated Data Types 원리, State-based vs Operation-based, 기본 CRDT(G-Counter/PN-Counter/G-Set/2P-Set/LWW-Register), 고급(Sequence/RGA/Yjs), 로컬 우선 소프트웨어, Automerge/Yjs 비교, Figma/Linear 사례.
왜 분산 시스템은 "동의"하는 것만으로도 어려운가? FLP 불가능성 정리의 충격, Lamport의 Paxos와 그 이해 불가능성, Raft가 바꾼 판도, ZooKeeper의 ZAB, KRaft의 탄생, Byzantine Fault Tolerance, CRDT의 합의 없는 수렴 — 모든 분산 시스템의 진짜 심장을 파헤친다.
분산 시스템은 "여러 컴퓨터가 협력하는 일"처럼 보이지만, 실제로는 "시계가 다른 여러 컴퓨터가, 일부가 고장난 상태에서, 메시지가 손실되고 지연되는 네트워크를 통해 합의에 이르는 일"이다. Lamport/Vector Clock·HLC부터 Raft·Paxos·PBFT, Event Sourcing·CQRS, Saga 패턴, CRDT, 그리고 8 Fallacies와 실전 장애 패턴까지. Byzantine Fault를 포함한 분산의 진짜 얼굴을 담은 한 편. Season 2의 열두 번째.
Cassandra, Consul, Redis Cluster가 어떻게 수천 대 노드의 상태를 동기화하는가? Gossip 프로토콜의 수학적 원리부터 SWIM, HyParView, Merkle Tree 기반 anti-entropy, 실전 시스템까지 720줄로 깊이 있게 파헤친다.
분산 시스템에서 "무엇이 먼저 일어났는가"를 어떻게 알 수 있을까? Lamport Clock, Vector Clock, Hybrid Logical Clock부터 Linearizability, Sequential, Causal, Eventual Consistency까지 — 이론과 실전을 720줄로 깊이 있게 다룬다.
etcd, Consul, CockroachDB, TiDB가 모두 Raft를 쓰는 이유는 이해하기 쉽기 때문이다. Leader Election, Log Replication, Safety Property, Membership Change, Snapshot까지 — 실전 시스템 분석과 함께 700줄로 깊이 있게 파헤친다.
Redis는 왜 싱글 스레드인데 초당 100만 QPS를 낼까? String부터 Stream까지 9가지 자료구조, Cluster의 Hash Slot, Sentinel HA, RDB/AOF 트레이드오프, Cache-Aside와 Thundering Herd, Redlock 논쟁, 2024년 라이선스 사태와 Valkey 포크, 멀티스레드 대안 Dragonfly/KeyDB까지 — 캐시 한 줄 뒤에 숨은 설계 철학을 뜯어본다.
100명 → 1K → 10K → 100K → 1M → 10M → 100M 사용자별로 아키텍처는 어떻게 진화해야 하는가. 단일 서버 SQLite부터 글로벌 멀티 리전 샤딩까지, 각 변곡점에서 깨지는 병목과 해결책. Stack Overflow, Shopify, Discord, Figma, Instagram 등 실제 회사의 변곡점 히스토리와 "언제 무엇을 해야 하는지"의 원칙. 조기 최적화의 함정과 "충분히 늦게, 충분히 일찍"의 균형까지.
분산 시스템의 모든 것! CAP/PACELC 정리, 합의 알고리즘(Raft/Paxos), 복제 전략(리더-팔로워/멀티리더/무리더), 일관성 모델(강한/최종/인과), 분산 클럭(Lamport/Vector), 장애 모델(비잔틴/크래시), 분산 트랜잭션(2PC/3PC/Saga).
분산 시스템의 모든 것! CAP/PACELC 정리, 합의 알고리즘(Raft/Paxos), 일관성 모델(Strong/Eventual/Causal), 복제(Leader-Follower/Multi-Leader/Leaderless), 파티셔닝, 분산 트랜잭션(2PC/3PC), 시계(Lamport/Vector Clock)까지.
Netflix는 2.6억 사용자를, Uber는 페타바이트 실시간 데이터를 비동기로 처리한다. CQRS, Saga(Choreography vs Orchestration), Event Sourcing, Outbox, 멱등성, DLQ까지 — 시니어 백엔드 개발자가 반드시 알아야 할 비동기 패턴 완전 가이드.
토스뱅크 Real-Time Data 팀의 Kafka & Streaming Data Engineer JD를 완전 분석합니다. Kafka Broker 운영, Spring Boot Kafka Client, Active-Active 이중화, CDC, Flink, ClickHouse까지 — 합격을 위한 기술스택 학습 로드맵과 면접 준비 전략.
etcd와 Kubernetes API Server의 통합을 분석합니다. kube-apiserver의 etcd 사용 방식(storage backend, codec, transformer), 키 계층 구조(/registry/ prefix), API Server의 Watch Cache(cacher, watchCache), etcd 사이징, Encryption at rest 구성을 다룹니다.
eBPF 기술과 OpenTelemetry 표준화의 결합으로, 2026년 관찰가능성은 근본적으로 변화하고 있습니다. 제로 계측(zero-instrumentation) 트레이싱, AI 기반 근본원인 분석, 비용 최적화된 관찰가능성 스택이 표준이 되어, 엔지니어들은 이제 "왜"의 질문에 즉시 답할 수 있습니다.
분산 시스템에서 상호 배제를 보장하는 분산 락 구현 패턴을 비교합니다. Redis Redlock 알고리즘과 Martin Kleppmann의 비판, ZooKeeper 임시 순차 노드, etcd Lease 기반 락까지 정합성·가용성·성능 트레이드오프를 실전 코드와 장애 사례로 분석합니다.