모델 아키텍처 일반

추론

aka Inference

학습된 AI 모델이 새로운 입력을 받아 출력을 생성하는 과정

AI 모델의 생애주기는 크게 학습(training)과 추론(inference)으로 나뉜다. 학습은 데이터로부터 패턴을 배우는 과정이고, 추론은 학습된 모델이 실제로 사용자 요청에 응답하는 과정이다. ChatGPT에 질문을 입력하고 답변을 받는 것이 추론의 대표적 예시다. 서비스 운영에서는 추론이 비용의 대부분을 차지한다.

언급된 포스트

Anthropic이 Google TPU 2세대를 '통째로' 예약했다 2026-04-23
Google가 TPU v8을 둘로 쪼갰다 — Sunfish(훈련)·Zebrafish(추론) 2026-04-23
xAI Grok, 4월 23일 일시 응답 지연 — '수요 폭주형' 장애의 단면 2026-04-23
구글, '추론 전용 칩'으로 엔비디아 정면 도전 — 마벨·브로드컴·MediaTek·TSMC 4파트너 체제 완성 2026-04-21
Meta·CoreWeave, AI 인프라에 총 $350억 베팅 — 추론 시대의 서막 2026-04-11
AI 전력 소비 100배 줄이는 뉴로-심볼릭 AI 연구 발표 2026-04-10
AI 에너지 소비를 100배 줄인다? 뉴로-심볼릭 AI의 가능성 2026-04-07

관련 용어

언급된 포스트