AI 모델의 학습과 추론에는 막대한 병렬 연산이 필요하며, 단일 GPU로는 한계가 있다. GPU 클러스터는 수백~수만 대의 GPU를 고속 인터커넥트(InfiniBand, NVLink 등)로 연결하여 하나의 거대한 연산 자원으로 활용하는 인프라다. NVIDIA, CoreWeave, 클라우드 사업자들이 구축하며, AI 인프라 경쟁의 핵심 자산이다.
GPU 클러스터
aka GPU Cluster
여러 대의 GPU 서버를 고속 네트워크로 연결하여 대규모 AI 연산을 수행하는 시스템