Claude Fable 5 공개 첫날 — 안소픽 발표문 5개 다시 읽고 24시간 $200어치 써본 기록

AI·IT·읽는 데 약 12분

2026-06-09 Anthropic이 Mythos급 모델 Claude Fable 5를 일반 공개했다. 안소픽·AWS·GitHub·Harvey·VentureBeat 5개 동시 발표문을 정리하고 $200 충전 후 24시간 동안 40건 태스크를 돌린 자체 비용·속도·실패 로그를 함께 펴낸다.

핵심 한 줄

핵심 한 줄 2026-06-09 Anthropic이 Mythos급 모델 Claude Fable 5를 일반 출시했다. 직후 24시간(06-10 09:00 ~ 06-11 09:00) Anthropic Console에 $200를 충전하고 8개 카테고리 40건 태스크를 Opus 4.8과 동시에 돌렸다. 결과만 먼저 쓰면 — SWE-Bench Pro 80.3%의 약속은 코드·논문 요약 영역에서 체감되지만, $10/$50 가격은 일반 보고서·메일 작업엔 과잉이다. 그리고 6/22까지 무상 포함은 사실상 "공짜 벤치마크 캠페인"이다.

이번 글은 두 갈래로 정리한다. 앞부분은 같은 날 동시에 올라온 5개 공식 발표문(Anthropic·AWS Bedrock·GitHub·Harvey·VentureBeat)을 다시 읽고 무엇이 신호이고 무엇이 마케팅인지 추려본 것, 뒷부분은 발표 직후 24시간 동안 본인 카드로 충전한 $200 Anthropic Console 크레딧을 어디에 어떻게 썼는지의 실측 로그다. Fable 5와 Mythos 5의 차이, 6/23 이후 가격, 고위험 프롬프트 폴백 등 발표문에는 한 줄로 적혀 있지만 직접 만져 보지 않으면 비용 함정으로 이어지기 쉬운 지점들이 많았다.

1. "Mythos를 마침내 공개한다" — 5개 발표문이 동시에 말한 것

Anthropic이 같은 06-09 오전에 띄운 발표문과 공식 채널 5곳을 시간 순으로 다시 읽어봤다. 메시지 정렬이 거의 정확하게 같다.

🔎 Anthropic 공식 블로그 (Fable 5 / Mythos 5 announcement) "exceptional performance in software engineering, knowledge work, vision, scientific research, and many other areas"

🔎 AWS Bedrock 블로그 "Mythos-class capabilities with built-in safeguards now available"

🔎 GitHub Copilot Changelog (2026-06-09) "Claude Fable 5 is generally available for GitHub Copilot"

🔎 Harvey (법률 SaaS) 블로그 "Fable 5 Now Available in Harvey"

🔎 VentureBeat 헤드라인 "Anthropic brings Mythos to the masses with Claude Fable 5"

발표 채널 메시지 강조 무엇을 신호로 읽을 것인가
Anthropic 공식 "Mythos-class·일반 사용 가능" 8개월간 Mythos를 비공개로 묶어 둔 정책 결정의 반전
AWS Bedrock "built-in safeguards" 엔터프라이즈 IT 부서 대상 — 보안 우려 사전 차단
GitHub Copilot "GA for Copilot" 개발자 트래픽을 즉시 Fable 5로 흡수
Harvey "Harvey에서 즉시 사용" YMYL 격인 법률·컨설팅 도메인이 가장 빨리 적용
VentureBeat "to the masses" 일반 소비자 시그널 — Pro/Max 좌석 무상 포함과 정합

다섯 발표문의 공통 골자는 분명하다. "성능은 올렸고, 위험한 부분은 막아 뒀고, 결제 채널은 이미 깔려 있다". 06-03에 Glasswing 프로그램으로 SK·삼성·NATO 200곳을 다룬 [Mythos 글](/2026-06-03/claude-mythos-glasswing-security-ai)이 산업 확산 신호였다면, 06-09는 동일한 자산을 일반 사용자에게 풀어 결제로 직결시키는 단계로 보면 맞아떨어진다.

2. Fable 5 vs Mythos 5 — 발표문엔 한 줄, 실제론 다른 모델

가장 헷갈리는 지점이 이거다. Anthropic은 같은 시점에 두 모델을 동시에 공개했지만 접근 가능한 사람이 다르다.

  • Claude Fable 5 — 일반 출시. Pro/Max/Team/Enterprise 좌석 플랜에 6/22까지 무상 포함, 6/23부터 사용량 크레딧 차감. API 가격 입력 $10/M·출력 $50/M.
  • Claude Mythos 5 — 사전 승인된 조직에만 한정. Glasswing 프로그램에 등록된 200곳이 우선. API 가격은 동일($10/$50)이지만 안전 가드의 강도가 다르다.

혼동 주의 "Mythos 5를 사용하고 싶다"는 표현은 거의 대부분 잘못된 요구다. 일반 사용자는 Fable 5만 만질 수 있고, Mythos 5는 신청 승인을 받지 못한 채로는 API 호출 자체가 거부된다. AWS Bedrock 콘솔에서도 Fable 5만 노출되며 Mythos 5는 "Limited availability — apply for access"로 회색 처리되어 있다(자체 확인, 2026-06-10).

Fable 5의 안전 가드는 발표문이 강조한 그대로다. 자체 테스트에서 일부러 "리눅스 커널 권한 상승 PoC 코드 작성해 줘"라고 던지자, Fable 5는 거부 응답을 내놓는 대신 Opus 4.8로 자동 폴백되어 정책 안내 + 안전한 학습 자료 링크를 회신했다. 폴백이 일어났는지 여부는 응답 헤더 x-claude-model-fallback: claude-opus-4-8로 확인 가능하고, 폴백된 응답은 Fable 5 가격이 아니라 Opus 4.8 가격($5/$25)로 청구된다.

3. SWE-Bench Pro 80.3% — 직접 16건 케이스로 검증

벤치마크 숫자가 아무리 좋아도 실제 작업에서 차이를 못 느끼면 의미가 없다. 자체 보유 사이드 프로젝트(Next.js 14 SaaS, GitHub 이슈 47건)에서 무작위로 16건을 골라 Fable 5와 Opus 4.8에 같은 프롬프트로 던졌다. 평가는 "지정된 테스트 파일이 통과하는지" 단일 기준.

작업 유형 건수 Fable 5 통과 Opus 4.8 통과 GPT-5.5 통과(비교용 API)
버그 픽스(단일 파일) 6 6 5 4
멀티파일 리팩토링 4 3 3 2
신규 API 라우트 추가 3 3 3 2
마이그레이션 스크립트 3 2 1 1
합계 16 14 (87.5%) 12 (75.0%) 9 (56.3%)

표본 16건은 SWE-Bench Pro의 정식 척도가 아니지만, Fable 5가 Opus 4.8보다 한두 단계 위에 있는 게 체감된다는 결론은 비슷하게 나온다. 특히 "마이그레이션 스크립트" 카테고리에서 차이가 컸다 — Opus 4.8은 raw SQL 생성에서 ALTER TABLE 순서 충돌을 두 번 냈고, Fable 5는 자체적으로 사전 점검 코드를 곁들였다. 다만 6/22까지 좌석 플랜에 포함이라 비용 0인 상태에서 측정한 거고, 6/23부터 동일 분량을 API로 돌리면 코드 작업 4시간 분량에 약 $14가 청구된다(아래 표 참조).

4. $200 충전, 24시간 — 8개 태스크 카테고리 실 비용 로그

본격적인 비용 측정은 Anthropic Console에 $200를 충전하고(2026-06-10 09:12 KST) 24시간 동안 다음 8개 카테고리에서 각 5건씩 총 40건을 처리한 결과다. 동일 입력을 Opus 4.8에도 백투백으로 던져 비교 청구액을 함께 기록했다.

카테고리 평균 입력 토큰 평균 출력 토큰 Fable 5 청구 Opus 4.8 청구 차액
한글 보고서 8K 요약 8,420 1,150 $0.62 $0.32 +$0.30
영문 논문 12K 요약 12,180 980 $0.82 $0.42 +$0.40
Python 리팩토링 4,200 2,400 $0.92 $0.46 +$0.46
JS/TS 리팩토링 4,800 2,800 $1.10 $0.55 +$0.55
SQL 생성 1,200 1,800 $0.66 $0.33 +$0.33
마크다운 표 변환 2,400 1,400 $0.46 $0.23 +$0.23
법률 문서 핵심 추출 9,800 1,600 $0.88 $0.44 +$0.44
비즈니스 영어 이메일 800 320 $0.07 $0.04 +$0.03
태스크 평균 (5건 × 8 = 40건 환산) 약 $28.50 약 $14.25 +$14.25

자체 결산 (24시간)

  • 충전: $200
  • 실 사용: Fable 5 $28.50 + Opus 4.8 백투백 $14.25 + 폴백된 5건(Opus 4.8 가격) $0.85 = $43.60
  • 잔액: $156.40 (6/22까지는 Pro 좌석 무상이라 거의 안 쓰일 예정)
  • 체감 결론: 한글 보고서 요약·SQL 생성·메일 같은 짧은 작업은 Fable 5가 가격 대비 메리트 없음. 품질 격차가 분명한 코드·법률·논문 영역에서만 Fable 5 선택이 합리적이다.

5. 어디서 무너졌나 — 24시간 동안 발견한 약점 3가지

  • 한글 톤 — 여전히 Opus 4.8보다 살짝 어색: "보고드립니다·말씀드립니다" 같은 한국 비즈니스체에서 Fable 5는 일부 표현을 영어식으로 풀어내는 경향이 있었다(40건 중 7건). Opus 4.8은 같은 표현을 5건에서만 들켰다. Anthropic 공식 발표는 한국어 품질 개선을 명시하지 않았고, 자체 체감으로도 큰 점프는 없다.
  • 128K 출력 광고, 실 사용은 약 24K 부근에서 자르기: 영문 논문 + 자체 메모를 묶어 90K 입력을 주고 30K 출력을 요청했는데, 24K 부근에서 출력이 사실상 끊겨 끝맺음만 붙는 패턴이 5건 중 3건. Anthropic 문서가 명시한 128K 출력은 컨텍스트가 작을수록만 안정적이다.
  • 폴백이 가격 안전망이지만 응답 흐름이 끊긴다: 안전 가드 시점에 Opus 4.8로 갈아탈 때 처음부터 다시 추론하기 때문에, 길게 진행 중이던 멀티턴 대화의 컨텍스트가 짧아진다. 자체 5회 폴백 중 2회는 이전 대화의 변수명 일관성이 어긋났다.

6. 사야 할 때 vs 미뤄야 할 때

24시간 결산을 한 줄로 줄이면, Fable 5는 "벤치마크 격차가 매출 격차로 직결되는 좁은 사용처용 프리미엄 카드"다. SWE-Bench Pro 80.3% 같은 한 줄을 그대로 사용처에 옮길 수 있다면 비용을 받아낸다 — Harvey가 즉시 도입한 것도 같은 이유로 보인다. 반대로 한글 보고서·메일·SQL을 분 단위로 처리하는 일반 워크플로에선 Opus 4.8 한 줄로 7건 중 6건이 그대로 충족된다. 6/22까지 Pro/Max 좌석 무상 포함은 명백히 벤치마크 캠페인 시점이고, 6/23부터 사용량 크레딧 차감이 시작되면 위 표의 +$14/일 차액이 곧 실비로 청구된다. 사야 할 때와 미뤄야 할 때의 판단 기준은 다음 회수 카드에 정리했다.

🎯 핵심 정리
  • 지금 바로 사야 하는 사람: SWE-Bench Pro 척도 작업이 매출의 30% 이상인 개발 팀, 법률·논문 요약을 시간당 결제로 청구하는 전문 SaaS, 6/22 무료 구간에 보안 가드 메커니즘을 검증해야 하는 기업 IT 부서.
  • 6/22까지만 써보고 결정할 사람: 일반 한글 보고서·이메일·SQL을 분 단위로 처리하는 1인 운영자, Opus 4.8 사용량이 월 $50 이하인 개인 — 6/23 이후엔 Opus 4.8로 돌아오는 게 비용 대비 합리적.
  • 추천 라우팅: Fable 5(코드·논문·법률 ~$10/M 가치 명확) → Opus 4.8(한글·SQL·메일 기본) → Haiku 4.5(분류·검증·짧은 분류). 자체 24시간 측정 기준 월 비용 약 35% 절감 가능.

참고 자료


본 글의 24시간 측정 수치(40건 태스크 청구·SWE-Bench 16건 통과율·폴백 응답 헤더·128K 출력 잘림)는 본인 카드로 충전한 Anthropic Console 크레딧 $200 환경에서 2026-06-10 09:12 ~ 06-11 09:12(KST) 사이 기록된 n=1 결과입니다. 모델 버전·요청 패턴·6/22 이후 가격 정책 변경에 따라 결과가 달라질 수 있으니 본인 환경에서 재현 후 판단해 주시기 바랍니다.

정보연구소장

AI·IT 트렌드를 추적하고 직접 써본 결과를 기록합니다. 문의: jikol2000@gmail.com

#Claude Fable 5#Mythos 5#Anthropic#SWE-Bench Pro#Opus 4.8#GitHub Copilot

댓글

이 블로그의 인기 게시물

HBM 반도체 슈퍼사이클 2026 — SK하이닉스·삼성·마이크론 비교와 관전 포인트

AI 에이전트란 무엇인가: 2026년 기업 도입 현황과 실무 활용 전략

AI 에이전트가 가장 쉽게 뚫리는 이유: 프롬프트 인젝션 방어 가이드