Google가 TPU v8을 둘로 쪼갰다 — Sunfish(훈련)·Zebrafish(추론)
Google이 Cloud Next 2026 무대에서 8세대 TPU{{tensor-processing-unit}}를 공개했다. 이번 세대는 특이하다. 하나의 칩이 아니라, 훈련용 Sunfish{{sunfish-tpu}}와 추론용 Zebrafish{{zebrafish-tpu}} 두 개로 나눠 나왔다.
왜 둘로 쪼갰나
지금까지 TPU는 훈련과 추론{{inference}}을 한 아키텍처로 커버했다. 문제는 두 작업의 요구가 다르다는 것이다. 훈련은 고대역폭·고정밀 연산이 필요하고, 추론은 대기 시간과 비용이 더 중요하다. TechCrunch는 “에이전트 시대의 워크로드는 토큰당 비용이 수익성을 가르기 때문에, 추론 특화 칩이 전략적 의미를 갖는다”고 풀었다.
The Next Web은 이를 Nvidia와의 대비로 설명한다. Nvidia는 단일 GPU(H100, B200, 차세대 Rubin)로 훈련·추론을 모두 커버하지만, Google은 둘로 쪼개 각각을 최적화하는 길을 택했다. 성능면에서는 Google 자료 기준 7세대 Ironwood 대비 훈련·추론 모두 4배 이상 개선된 수치가 제시됐다. 다만 독립 벤치마크는 아직 공개되지 않았다.
주요 수치 비교
| 세대 | 코드명 | 용도 | 전 세대 대비 성능 |
|---|---|---|---|
| TPU v7 | Ironwood | 훈련·추론 겸용 | — |
| TPU v8 | Sunfish | 훈련 특화 | 약 4배 |
| TPU v8 | Zebrafish | 추론 특화 | 약 4배 |
출처: Google Cloud Next 2026 키노트 발표 자료 (TechCrunch, CNBC 2026-04-22). 성능 수치는 Google 자체 측정이며 독립 검증은 아직 없다.
Anthropic 앵커 계약과 엮이다
이번 v8 공개는 Anthropic 계약과 함께 발표됐다. Anthropic은 2026년 1GW 이상의 Ironwood(v7) 용량을 사용하며, 2027년부터는 신규 v8 세대로 3.5GW까지 확장하는 계약에 묶여 있다. Google Cloud로서는 v8 두 종의 첫 대형 고객이 확보돼 있는 셈이고, Anthropic으로서는 Nvidia GPU 의존도를 떨어뜨릴 장기 선택지가 생겼다.
긍정 관점
Bloomberg는 Google이 “Nvidia와 정면 대결 대신, 추론 경제성으로 공간을 여는 전략”을 택했다고 평가했다. 에이전트·자동화 워크로드가 늘어날수록 추론 비용이 전체 IT 예산에서 차지하는 비중이 커지므로, 추론 특화 칩은 실제 기업 구매 결정에 영향을 줄 수 있다.
부정 관점·우려
가장 큰 제약은 생태계다. Nvidia CUDA는 이미 수십만 개발자가 쓰는 표준이지만, Google TPU는 여전히 자체 소프트웨어 스택에 더 의존적이다. TechCrunch는 “TPU가 GCP 바깥에서도 쓰이려면 프레임워크 호환성 확대가 필요하다”고 지적했다. 또 하나 쪼갠 라인업은 고객 입장에서 용량 계획을 둘로 나눠 세워야 한다는 부담도 생긴다.
지켜볼 지점
단기(수개월)로는 v8 두 종에 대한 외부 벤치마크가 나오는 시점과, Google이 Anthropic 외에 어떤 고객을 추가로 확보하는지가 관건이다. 한국 관점에서는 SK hynix·삼성 HBM 공급 라인이 Nvidia 편중을 줄이고 Google TPU 확대에 얼마나 결합되는지도 지켜볼 지점이다. 중장기(1년 이상)로는 훈련·추론 이분화가 업계 표준이 될지, 아니면 Nvidia식 단일 GPU 노선이 유지될지가 칩 시장의 구도를 바꿀 수 있다.
출처 및 참고 자료
- Google Cloud launches two new AI chips to compete with Nvidia — TechCrunch, 2026-04-22
- Google Cloud Unveils New TPU Chips to Accelerate AI Training and Inference — Bloomberg, 2026-04-22
- Google unveils chips for AI training and inference in latest shot at Nvidia — CNBC, 2026-04-22
- Google splits its next TPU in two, and the AI chip war gets interesting — The Next Web, 2026-04-22
함께 보면 좋은 글
- Google debuts AI chips with 4X performance boost — 성능 수치 중심 비교