DevOpsGPUContainerCUDANCCLPyTorch
컨테이너 안의 GPU, 무엇이 일어나고 어디서 깨지는가
송이레
2026년 5월 29일
발표 소개
GPU 컨테이너 내부 동작 구조와 CUDA/NCCL 의존성 문제를 실제 사례 기반으로 살펴봅니다. PyTorch 분산 학습 환경에서 발생한 RTX 5090 + NCCL CUDA 미스매치 사례를 중심으로, NVIDIA Container Toolkit, Kubernetes GPU 구조, AWS DLC/EKS GPU 노드 전략 등을 소개합니다.
컨퍼런스/세미나 정보
AWSKRUG #container 🐳 EKS & Container Deep Dive Night
웹사이트 방문