Google Gemma 4 출시 — 31B 오픈 모델이 400B급을 이기는 시대
Google이 4월 2일 Gemma 4를 공개했다. Gemini 3과 같은 기술 기반으로 만들어졌지만, 완전한 오픈소스(Apache 2.0)로 누구나 상업적으로 사용하고 수정할 수 있다. “파라미터 당 지능”을 극대화하겠다는 Google의 오픈 모델 전략이 한 단계 진화한 모습이다.
라인업은 네 가지다. 스마트폰이나 라즈베리파이에서 돌릴 수 있는 초소형 E2B(Effective 2B)부터, 소비자급 GPU에 적합한 E4B, MoE{{mixture-of-experts}} 아키텍처를 활용한 26B, 그리고 가장 강력한 31B Dense까지. 특히 31B Dense 모델은 일부 보도에 따르면 Arena AI 오픈 모델 순위에서 글로벌 3위를 기록했으며, 파라미터 수가 10배 이상 큰 400B급 모델들과 겨루는 성능을 보여주고 있다.
모든 모델이 텍스트+이미지 멀티모달 입력을 지원하고, 엣지 AI{{edge-ai}} 모델들은 오디오 입력까지 처리한다. 에이전틱 워크플로우(agentic workflow)와 최대 256K 토큰의 긴 컨텍스트 윈도우도 기본 지원한다.
Apache 2.0{{apache-license}} 라이선스는 이 모델의 가장 큰 장점이다. 상업적 사용, 수정, 재배포에 제한이 없다. Meta가 Muse Spark으로 독점 모델 전략을 택한 것과 대비되는 행보다. 오픈소스 AI를 필요로 하는 스타트업이나 연구자들에게는 Gemma 4가 현실적인 대안이 될 수 있다.
한국 개발자에게 특히 의미 있는 건 E2B, E4B 같은 초소형 모델의 존재다. 별도 서버 없이 모바일 앱이나 IoT 기기에서 AI를 돌릴 수 있게 되면, 한국의 제조업이나 모빌리티 분야에서 새로운 응용 가능성이 열린다.
출처 및 참고 자료
- Gemma 4: Byte for byte, the most capable open models — Google, 2026-04-02
- Gemma 4 — Google DeepMind — Google DeepMind, 2026-04-02
- Welcome Gemma 4: Frontier multimodal intelligence on device — Hugging Face, 2026-04-02
- Bring state-of-the-art agentic skills to the edge with Gemma 4 — Google Developers Blog, 2026-04-02
함께 보면 좋은 글
- Gemma 4: How a 31B Model Beats 400B Rivals — 31B 모델이 대형 모델들을 능가하는 벤치마크 분석
- Gemma 4 available on Google Cloud — Google Cloud에서의 배포 및 활용 방법