본문 바로가기
AI 뉴스

GLM 5.2 출시 정리: Zhipu AI 새 오픈소스 LLM (2026)

by 정부우르사 2026. 6. 14.
반응형

"GLM 5.1 나온 지 두 달도 안 됐는데 또 새 버전이라고요?"


📌 핵심 3줄 요약

  • Z.ai(Zhipu AI)가 2026년 6월 13일 GLM 5.2를 공개. 구체 아키텍처(총·활성 파라미터)는 공식 미공개, 컨텍스트 1M, MIT 라이선스로 다음 주 공개 예정.
  • 출시 시점엔 공식 벤치마크가 없고 Z.ai 코딩 플랜에서만 먼저 사용 가능. 일반 API·OpenRouter·Together AI 배포는 아직 대기.
  • 한국 개발자가 당장 의미 있는 워크로드는 "긴 코드베이스 리팩터·에이전트 루프"이고, 한국어 RAG는 아직 Kimi K2.6 쪽이 안전한 선택.

🗓️ 출시 요약 — 무엇이, 언제, 어떻게

Z.ai는 6월 13일 공식 블로그에서 GLM 5.2를 발표했다. MoE 기반 모델로 컨텍스트 1M을 "실제 사용 가능한 수준"으로 끌어올렸다고 주장하지만, 총 파라미터·활성 파라미터·어텐션 구조 같은 아키텍처 세부는 공식 미공개다. 한 번에 출력 가능한 토큰 수는 131,072개로, 풀리퀘 단위 디프나 장기 에이전트 트레이스에 맞춰 설계됐다.

다만 6월 14일 현재 가중치는 아직 Hugging Face에 올라오지 않았고, 사용 경로는 GLM 코딩 플랜(Lite·Pro·Max·Team) 한 곳뿐이다. 표준 API와 오픈 가중치는 다음 주로 예고됐다.

💡 한 줄 정리

GLM 5.2는 "코딩 플랜 가입자에게 먼저, 가중치는 곧" 전략으로 출시됐다. 발표 시점엔 공개 벤치마크 0건이라 비교는 GLM 5.1·Kimi K2.6 등 직전 세대 수치로만 가능하다.


📊 GLM 5.2 vs Kimi K2.7 vs DeepSeek 비교

출시 직후라 GLM 5.2 자체 벤치마크는 공개되지 않았다. 그래서 아래 표는 공식 발표 스펙(컨텍스트·라이선스·구조)과 직전 세대 공식 결과를 기준으로 정리한 것이다. 새 점수가 나오면 갱신이 필요한 자료다.

항목 GLM 5.2 (Z.ai) Kimi K2.7 (Moonshot) DeepSeek 최신
총 / 활성 파라미터 MoE (공식 미공개) 1T / 32B (MoE, 384 experts) 671B / 37B (V3 계열)
컨텍스트 길이 1,000,000 256,000 128,000
최대 출력 토큰 131,072 16,000 8,192
라이선스 MIT (예고) Modified MIT DeepSeek License
직전 세대 SWE-bench Pro GLM 5.1: 58.4 K2.6: 58.6 비공개
강점 포지션 긴 컨텍스트 에이전트 함수 단위 코딩 범용·가성비

표에서 가장 눈에 띄는 차이는 1M 컨텍스트 + 131K 출력 조합이다. Kimi K2.7(전 세대 K2.6 기준)이 함수 단위 코딩 점수에서 앞섰던 것과 달리, GLM 5.2는 처음부터 "리포 전체를 한 번에 읽고 패치하는 에이전트" 시나리오를 노린 설계다.


💰 가격과 접속 경로 — 지금 쓸 수 있나

출시 첫날 기준 GLM 5.2를 만질 수 있는 경로는 사실상 하나, Z.ai GLM 코딩 플랜이다. 정리하면 다음과 같다.

  • Z.ai 코딩 플랜 — Lite 약 $18/월(주 400 프롬프트), Pro(주 2,000), Max(주 8,000), Team(좌석제). Claude Code·Cline·OpenCode 등 외부 에이전트에서 토큰 단위 대신 정액으로 사용 가능.
  • 독립 API / chat.z.ai — 6월 13일 발표 기준 "다음 주 공개" 예고. 토큰 단가는 공식 발표 전.
  • OpenRouter·Together AI — 6월 14일 현재 GLM 5.1까지만 등록(OpenRouter 기준 GLM 5.1 입력 약 $0.98 / 출력 $3.08 per 1M tokens). 5.2 등록은 가중치 공개 이후로 예상.
  • 자가 호스팅 — MIT 라이선스 발표 후 Hugging Face에 가중치가 올라오면 가능. 단 정확한 파라미터 규모는 공식 미공개이며, MoE 대형 모델 특성상 단일 H100 한 장으로는 부족할 가능성이 커 멀티 GPU·INT4 양자화가 사실상 필수로 보인다.

⚠️ 가격을 단정하지 말 것

출시 첫날 가격을 "GLM 5.1과 비슷할 것"으로 추정하는 글이 많지만, 활성 파라미터 규모가 늘었을 경우 추론 비용이 더 붙을 가능성이 있다. 견적은 공식 API 가격이 나온 뒤 다시 계산할 것.


🙋 한국 개발자는 어디에 쓸 만한가

한국어 처리에 대한 별도 발표는 아직 없다. 다만 직전 모델 GLM 5.1까지의 경험을 종합하면, 워크로드별로 다음과 같은 그림이 그려진다.

  • 긴 코드베이스 리팩터링 — 1M 컨텍스트 + 131K 출력은 모놀리식 레포를 한 번에 들고 패치하는 시나리오에서 Claude Sonnet 4.x·GPT-5보다 유리하다. 코딩 플랜 정액제가 토큰 폭주를 막아주는 점도 매력.
  • 한국어 RAG / 챗봇 — 별도 한국어 벤치마크가 공개되지 않은 상황. 현재로선 검증된 Kimi K2.6 또는 Claude 4.x 쪽이 안전. 어제 다룬 Kimi K2.7 한국어 평가 글의 기준을 그대로 GLM 5.2에 다시 돌려봐야 한다.
  • 에이전트 루프(코드 + 도구) — Claude Code·OpenCode·Cline 호환이 발표 시점부터 명시됐다는 점이 실용적. 비용 측면에서 Claude 4.x 대비 의미 있는 절감이 가능할지는 공식 API 단가 공개 후 판단.

⚠️ 단점과 주의할 점

  • 공식 벤치마크 0건 — SWE-bench Verified·LiveCodeBench·HumanEval 어느 것도 출시일 기준 공개되지 않았다. "이전 세대보다 낫다"는 주장은 아직 검증 불가.
  • 한국어 평가 부재 — KoBEST·HAE-RAE 같은 한국어 벤치마크는 커뮤니티 평가를 기다려야 한다. 한국어 RAG 본격 투입 전 자체 평가 셋으로 한 번 더 확인 필요.
  • 접속 경로 제한 — 출시 첫 주는 사실상 Z.ai 코딩 플랜만 가능. 토큰 단위로 결제하던 워크플로엔 즉시 도입이 어렵다.
  • 자가 호스팅 진입장벽 — 가중치가 풀려도 대형 MoE 모델은 GPU 다수 + 양자화가 필요할 가능성이 높아 개인·소규모 팀엔 부담(정확한 규모는 공식 미공개).

✅ 핵심 정리

  • GLM 5.2 = MoE(세부 미공개) + 1M 컨텍스트 + MIT(예고)의 "긴 컨텍스트 에이전트" 특화 모델.
  • 출시 첫 주 접속은 Z.ai 코딩 플랜뿐. OpenRouter·Together·자가 호스팅은 다음 주 가중치 공개를 기다려야 한다.
  • 한국 개발자는 "리포 단위 코드 에이전트"부터 검토, 한국어 RAG는 벤치마크 공개 후 판단.

🚀 지금 바로 할 일

  1. Z.ai 블로그의 GLM 5.2 발표 글을 북마크하고, 다음 주 API/가중치 공개일을 캘린더에 표시한다.
  2. 현재 사용 중인 LLM 워크로드(코드 에이전트·한국어 RAG·내부 검색) 중 "1M 컨텍스트가 진짜 필요한 케이스"를 1개 골라 평가 세트로 준비한다.
  3. 가중치 공개 직후 OpenRouter 등록을 알림으로 받기 위해 OpenRouter Z.ai 페이지를 즐겨찾기에 추가한다.

💬 의견

국내 서비스에서 1M 컨텍스트를 정말 활용할 수 있는 시나리오가 있는지, 또 Claude 4.x에서 GLM 계열로 갈아탈 만큼의 비용 절감이 나오는지 직접 비교해 본 경험을 댓글로 공유해 주시면 다른 독자에게도 큰 도움이 됩니다.


참고 자료


작성자: AI 인프라·오픈소스 LLM을 매일 추적하는 한국 개발자. 신모델이 나오면 한국어 처리·실제 비용·도입 경로를 정리해 한국 팀이 의사결정에 쓸 수 있도록 글로 남기고 있다.

반응형