Anthropic, ‘너무 위험해서 공개 못 한다’ — Claude Mythos Preview와 Project Glasswing의 전말
Anthropic이 차세대 모델 Claude Mythos Preview를 공개했다. 단, 일반 사용자에게는 제공하지 않는다. 이 모델이 주요 운영체제와 웹 브라우저에서 제로데이 취약점을 자율적으로 발견하고 익스플로잇할 수 있기 때문이다.
기존 벤치마크를 포화시킨 모델
TechCrunch 보도에 따르면, Mythos Preview는 기존 벤치마크를 “대부분 포화(mostly saturate)“시킬 정도의 범용 성능을 보여준다. 하지만 세간의 관심을 끈 건 범용 능력이 아니라 사이버보안 분야에서의 압도적인 성능이다.
The Hacker News 보도에 의하면, Mythos Preview는 테스트 과정에서 FreeBSD의 NFS 서비스에 존재하던 17년 된 원격 코드 실행(RCE) 취약점을 완전 자율적으로 발견하고 익스플로잇했다. 루트 권한 획득까지 사람의 개입 없이 이뤄진 것이다. 모든 주요 운영체제와 주요 웹 브라우저에서 유사한 제로데이 발견 능력이 확인됐다.
Project Glasswing — 방어를 위한 제한 배포
Anthropic은 이 모델의 위험성을 인지하고, 일반 공개 대신 Project Glasswing이라는 프로그램을 통해 제한적으로 배포하기로 했다. VentureBeat에 따르면, AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Microsoft, NVIDIA 등 약 40개 이상의 기업과 기관이 참여한다.
목표는 명확하다. Mythos Preview를 사용해 세계에서 가장 중요한 소프트웨어 인프라의 취약점을 공격자보다 먼저 찾아내는 것이다. Anthropic은 이 프로젝트에 1억 달러 규모의 모델 사용 크레딧을 투자한다.
듀얼유스 딜레마, 그리고 AI 안전의 새 기준
이 사건은 AI 안전 논의에서 중요한 전환점이다. 지금까지의 AI 안전 논의가 “잘못된 정보 생성”이나 “편향”에 집중했다면, Mythos는 AI가 실질적으로 인프라를 파괴할 수 있는 능력을 갖췄음을 보여준다.
Anthropic의 결정은 자체 책임 있는 확장 정책(Responsible Scaling Policy, RSP)이 실제로 적용된 첫 주요 사례이기도 하다. “모델이 충분히 위험하면 공개하지 않는다”는 원칙이 말 그대로 실행된 것이다. 보안 전문가 Simon Willison은 이 접근 방식을 “필요한 조치”라고 평가했다.
한국 독자에게 어떤 의미가 있나
국내 주요 인프라(금융, 통신, 공공)에서 사용하는 소프트웨어도 Mythos 수준의 AI가 타겟이 될 수 있다. Project Glasswing 참여 기업 중 국내에서 널리 사용되는 AWS, Google, Microsoft가 포함돼 있어, 간접적으로나마 보안 혜택이 기대된다. 다만, 이런 수준의 공격 AI가 존재한다는 사실 자체가 국내 보안 업계에 경각심을 줄 수 있는 대목이다.
📎 출처 및 참고 자료
- Project Glasswing: Securing critical software for the AI era — Anthropic 공식, 2026-04-07
- Anthropic debuts preview of powerful new AI model Mythos in new cybersecurity initiative — TechCrunch, 2026-04-07
- Anthropic says its most powerful AI cyber model is too dangerous to release publicly — VentureBeat, 2026-04-07
- Anthropic’s Claude Mythos Finds Thousands of Zero-Day Flaws — The Hacker News, 2026-04-07
🔗 함께 보면 좋은 글
- Anthropic’s Project Glasswing sounds necessary to me — 보안 커뮤니티의 Glasswing 평가
- Claude Mythos Preview — Anthropic Red Team 공식 기술 분석