"GLM 5.1 나온 지 두 달도 안 됐는데 또 새 버전이라고요?"
📌 핵심 3줄 요약
- Z.ai(Zhipu AI)가 2026년 6월 13일 GLM 5.2를 공개. 구체 아키텍처(총·활성 파라미터)는 공식 미공개, 컨텍스트 1M, MIT 라이선스로 다음 주 공개 예정.
- 출시 시점엔 공식 벤치마크가 없고 Z.ai 코딩 플랜에서만 먼저 사용 가능. 일반 API·OpenRouter·Together AI 배포는 아직 대기.
- 한국 개발자가 당장 의미 있는 워크로드는 "긴 코드베이스 리팩터·에이전트 루프"이고, 한국어 RAG는 아직 Kimi K2.6 쪽이 안전한 선택.
🗓️ 출시 요약 — 무엇이, 언제, 어떻게
Z.ai는 6월 13일 공식 블로그에서 GLM 5.2를 발표했다. MoE 기반 모델로 컨텍스트 1M을 "실제 사용 가능한 수준"으로 끌어올렸다고 주장하지만, 총 파라미터·활성 파라미터·어텐션 구조 같은 아키텍처 세부는 공식 미공개다. 한 번에 출력 가능한 토큰 수는 131,072개로, 풀리퀘 단위 디프나 장기 에이전트 트레이스에 맞춰 설계됐다.
다만 6월 14일 현재 가중치는 아직 Hugging Face에 올라오지 않았고, 사용 경로는 GLM 코딩 플랜(Lite·Pro·Max·Team) 한 곳뿐이다. 표준 API와 오픈 가중치는 다음 주로 예고됐다.
💡 한 줄 정리
GLM 5.2는 "코딩 플랜 가입자에게 먼저, 가중치는 곧" 전략으로 출시됐다. 발표 시점엔 공개 벤치마크 0건이라 비교는 GLM 5.1·Kimi K2.6 등 직전 세대 수치로만 가능하다.
📊 GLM 5.2 vs Kimi K2.7 vs DeepSeek 비교
출시 직후라 GLM 5.2 자체 벤치마크는 공개되지 않았다. 그래서 아래 표는 공식 발표 스펙(컨텍스트·라이선스·구조)과 직전 세대 공식 결과를 기준으로 정리한 것이다. 새 점수가 나오면 갱신이 필요한 자료다.
| 항목 | GLM 5.2 (Z.ai) | Kimi K2.7 (Moonshot) | DeepSeek 최신 |
|---|---|---|---|
| 총 / 활성 파라미터 | MoE (공식 미공개) | 1T / 32B (MoE, 384 experts) | 671B / 37B (V3 계열) |
| 컨텍스트 길이 | 1,000,000 | 256,000 | 128,000 |
| 최대 출력 토큰 | 131,072 | 16,000 | 8,192 |
| 라이선스 | MIT (예고) | Modified MIT | DeepSeek License |
| 직전 세대 SWE-bench Pro | GLM 5.1: 58.4 | K2.6: 58.6 | 비공개 |
| 강점 포지션 | 긴 컨텍스트 에이전트 | 함수 단위 코딩 | 범용·가성비 |
표에서 가장 눈에 띄는 차이는 1M 컨텍스트 + 131K 출력 조합이다. Kimi K2.7(전 세대 K2.6 기준)이 함수 단위 코딩 점수에서 앞섰던 것과 달리, GLM 5.2는 처음부터 "리포 전체를 한 번에 읽고 패치하는 에이전트" 시나리오를 노린 설계다.
💰 가격과 접속 경로 — 지금 쓸 수 있나
출시 첫날 기준 GLM 5.2를 만질 수 있는 경로는 사실상 하나, Z.ai GLM 코딩 플랜이다. 정리하면 다음과 같다.
- Z.ai 코딩 플랜 — Lite 약 $18/월(주 400 프롬프트), Pro(주 2,000), Max(주 8,000), Team(좌석제). Claude Code·Cline·OpenCode 등 외부 에이전트에서 토큰 단위 대신 정액으로 사용 가능.
- 독립 API / chat.z.ai — 6월 13일 발표 기준 "다음 주 공개" 예고. 토큰 단가는 공식 발표 전.
- OpenRouter·Together AI — 6월 14일 현재 GLM 5.1까지만 등록(OpenRouter 기준 GLM 5.1 입력 약 $0.98 / 출력 $3.08 per 1M tokens). 5.2 등록은 가중치 공개 이후로 예상.
- 자가 호스팅 — MIT 라이선스 발표 후 Hugging Face에 가중치가 올라오면 가능. 단 정확한 파라미터 규모는 공식 미공개이며, MoE 대형 모델 특성상 단일 H100 한 장으로는 부족할 가능성이 커 멀티 GPU·INT4 양자화가 사실상 필수로 보인다.
⚠️ 가격을 단정하지 말 것
출시 첫날 가격을 "GLM 5.1과 비슷할 것"으로 추정하는 글이 많지만, 활성 파라미터 규모가 늘었을 경우 추론 비용이 더 붙을 가능성이 있다. 견적은 공식 API 가격이 나온 뒤 다시 계산할 것.
🙋 한국 개발자는 어디에 쓸 만한가
한국어 처리에 대한 별도 발표는 아직 없다. 다만 직전 모델 GLM 5.1까지의 경험을 종합하면, 워크로드별로 다음과 같은 그림이 그려진다.
- 긴 코드베이스 리팩터링 — 1M 컨텍스트 + 131K 출력은 모놀리식 레포를 한 번에 들고 패치하는 시나리오에서 Claude Sonnet 4.x·GPT-5보다 유리하다. 코딩 플랜 정액제가 토큰 폭주를 막아주는 점도 매력.
- 한국어 RAG / 챗봇 — 별도 한국어 벤치마크가 공개되지 않은 상황. 현재로선 검증된 Kimi K2.6 또는 Claude 4.x 쪽이 안전. 어제 다룬 Kimi K2.7 한국어 평가 글의 기준을 그대로 GLM 5.2에 다시 돌려봐야 한다.
- 에이전트 루프(코드 + 도구) — Claude Code·OpenCode·Cline 호환이 발표 시점부터 명시됐다는 점이 실용적. 비용 측면에서 Claude 4.x 대비 의미 있는 절감이 가능할지는 공식 API 단가 공개 후 판단.
⚠️ 단점과 주의할 점
- 공식 벤치마크 0건 — SWE-bench Verified·LiveCodeBench·HumanEval 어느 것도 출시일 기준 공개되지 않았다. "이전 세대보다 낫다"는 주장은 아직 검증 불가.
- 한국어 평가 부재 — KoBEST·HAE-RAE 같은 한국어 벤치마크는 커뮤니티 평가를 기다려야 한다. 한국어 RAG 본격 투입 전 자체 평가 셋으로 한 번 더 확인 필요.
- 접속 경로 제한 — 출시 첫 주는 사실상 Z.ai 코딩 플랜만 가능. 토큰 단위로 결제하던 워크플로엔 즉시 도입이 어렵다.
- 자가 호스팅 진입장벽 — 가중치가 풀려도 대형 MoE 모델은 GPU 다수 + 양자화가 필요할 가능성이 높아 개인·소규모 팀엔 부담(정확한 규모는 공식 미공개).
✅ 핵심 정리
- GLM 5.2 = MoE(세부 미공개) + 1M 컨텍스트 + MIT(예고)의 "긴 컨텍스트 에이전트" 특화 모델.
- 출시 첫 주 접속은 Z.ai 코딩 플랜뿐. OpenRouter·Together·자가 호스팅은 다음 주 가중치 공개를 기다려야 한다.
- 한국 개발자는 "리포 단위 코드 에이전트"부터 검토, 한국어 RAG는 벤치마크 공개 후 판단.
🚀 지금 바로 할 일
- Z.ai 블로그의 GLM 5.2 발표 글을 북마크하고, 다음 주 API/가중치 공개일을 캘린더에 표시한다.
- 현재 사용 중인 LLM 워크로드(코드 에이전트·한국어 RAG·내부 검색) 중 "1M 컨텍스트가 진짜 필요한 케이스"를 1개 골라 평가 세트로 준비한다.
- 가중치 공개 직후 OpenRouter 등록을 알림으로 받기 위해 OpenRouter Z.ai 페이지를 즐겨찾기에 추가한다.
💬 의견
국내 서비스에서 1M 컨텍스트를 정말 활용할 수 있는 시나리오가 있는지, 또 Claude 4.x에서 GLM 계열로 갈아탈 만큼의 비용 절감이 나오는지 직접 비교해 본 경험을 댓글로 공유해 주시면 다른 독자에게도 큰 도움이 됩니다.
참고 자료
- AI Weekly — GLM 5.2 출시 정리 (2026-06-13)
- Z.ai 공식 블로그 — GLM 5.1: Towards Long-Horizon Tasks (직전 세대 자료)
- OpenRouter — Z.ai GLM 5.1 모델 카드 (가격·컨텍스트 비교 기준)
- Z.AI Developer Document — Release Notes
작성자: AI 인프라·오픈소스 LLM을 매일 추적하는 한국 개발자. 신모델이 나오면 한국어 처리·실제 비용·도입 경로를 정리해 한국 팀이 의사결정에 쓸 수 있도록 글로 남기고 있다.
'AI 뉴스' 카테고리의 다른 글
| SpaceX의 Cursor 60억 달러 인수, 무엇이 달라지나 (2026) (0) | 2026.06.16 |
|---|---|
| ChatGPT Dreaming Memory 정리: OpenAI의 새 장기 기억 시스템은 무엇이 다른가 (2026) (0) | 2026.06.15 |
| NVIDIA SkillSpector: AI 스킬 보안 분석 (2026) (0) | 2026.06.13 |
| Kimi K2.7-Code 완전 분석: 오픈소스 코딩 LLM 정리 (0) | 2026.06.12 |
| Apache Burr 첫인상: 상태머신 기반 AI 에이전트 (2026) (0) | 2026.06.11 |