AI Safety의 모든 것! Alignment 문제(목표 정렬), RLHF/DPO/Constitutional AI, 편향(Bias) 감지/완화, 환각(Hallucination) 방지, 레드팀 테스팅, AI Guardrails, 해석 가능성(SHAP/LIME), EU AI Act, 기업의 Responsible AI 프레임워크.
AI Safety Engineer는 2023년 대비 연봉 45% 상승한 가장 빠르게 성장하는 AI 직군입니다. Anthropic의 Constitutional AI, OpenAI의 Superalignment, DeepMind의 Scalable Oversight — AI 안전 분야의 핵심 연구, 필요 역량, 채용 기업, 학습 경로를 총정리합니다.