Published on2026년 3월 18일Google TPU 완전 해부: Systolic Array가 행렬 곱셈을 어떻게 완벽히 해결하는가TPUGoogleSystolic-ArrayLLM서빙JAXXLA행렬곱셈딥러닝하드웨어Google TPU의 핵심 혁신인 Systolic Array가 행렬 곱셈을 어떻게 극한까지 최적화하는지 완전 해부합니다. INT8 추론부터 bfloat16, XLA 컴파일러, TPU Pod까지 실제 숫자와 코드로 깊이 파헤칩니다.
Published on2026년 3월 17일컴파일러/인터프리터 설계 완전 정복: 파서부터 LLVM, AI 컴파일러(TVM/XLA)까지컴파일러LLVMTVMXLAMLCompilertorch.compile2026-032026-03-17어휘 분석, AST, LLVM IR부터 TVM, XLA 같은 AI 전용 컴파일러까지. torch.compile() 내부 동작과 커널 퓨전 최적화를 코드와 함께 완전 정복합니다.