TOPS

aka Tera Operations Per Second (TOPS)

초당 1조(10^12) 회의 연산을 수행할 수 있는 처리 성능 단위

AI 가속기·NPU·GPU의 추론 처리 성능을 표기할 때 가장 흔히 쓰이는 단위다. 1 TOPS는 초당 1조 회의 연산 처리량을 뜻한다. 숫자가 클수록 동일 시간에 더 많은 신경망 연산을 처리할 수 있다는 의미지만, 실제 추론 속도는 정밀도(INT4·INT8·FP16), 메모리 대역폭, 모델 양자화 효율 등 다른 변수에도 강하게 의존한다. AI PC 마케팅에서 NPU 사양을 강조할 때 자주 등장하지만, TOPS 절대치만으로 모델별 추론 속도를 단순 비교하기는 어렵다.

관련 용어

4

언급된 포스트

1