이미 충분히 똑똑해진 모델
AI 자체가 이런 업무를 풀 만큼 충분히 똑똑한가? — 2년 만에 비교 불가 수준으로 발달했다
실제 코딩 작업 해결률 — SWE-Bench Verified1
2023
12% — GPT-4
2024
50% — Claude 3.5
2026
75%+ — Opus 4.8
+ Fable 5(2026.6.9) — Opus 위 'Mythos급' 티어 · 코딩 벤치마크 최고(FrontierCode 기준)5 · SWE-bench Verified 공식 수치 미공개라 막대 생략
🔬 단적 증거 — Project Glasswing ✓ 2026.5 검증2
Anthropic이 "너무 위험해 일반 공개를 제한"했던 모델(Claude Mythos)로, 모든 주요 OS·브라우저에서 수십 년 묵은 0-day 1만 건 이상을 단독 식별 — AI가 보안 분석에서 인간 전문가를 능가.
🆕 2026.6.9 업데이트 — 그 Mythos급이 안전장치를 달고 'Fable 5'로 일반 공개(Opus 위 신규 티어). 안전장치 풀린 Mythos 5는 사이버 방어기관·인프라 제공자 한정, 글래스윙으로만 제공5
🤝 AWS·Apple·Google·Microsoft·JPMorgan 등 글로벌 빅테크·금융 공동 참여 — 한국도 공식 참여 시작 (KISA·삼성전자·SK하이닉스·SKT, 2026.6)
🇰🇷 나아가 한국 독자 협의체 'K-글래스윙' 이달 출범 — KISIA 주도, 한국산 보안특화 AI 추진4
→ 2년 전과 비교 불가 수준으로 모델이 발달했다