모델이 답변을 생성할 때 얼마나 깊이 '생각'할지를 사용자가 조절할 수 있는 기능이다. minimal(최소)에서 high(최대)까지 단계를 선택하면, 낮은 단계에서는 빠르고 저렴하게, 높은 단계에서는 느리지만 정확하게 응답한다. Google의 Gemini 3.1 Flash-Lite에서 도입되어, 작업 복잡도에 따른 비용 최적화를 가능하게 한다.
생각 예산
aka Thinking Budget
AI 모델이 응답 생성 시 사용할 추론 깊이를 조절하는 설정