GLM 5.2 출시 정리: Zhipu AI 새 오픈소스 LLM (2026)

"GLM 5.1 나온 지 두 달도 안 됐는데 또 새 버전이라고요?"

📌 핵심 3줄 요약

Z.ai(Zhipu AI)가 2026년 6월 13일 GLM 5.2를 공개. 구체 아키텍처(총·활성 파라미터)는 공식 미공개, 컨텍스트 1M, MIT 라이선스로 다음 주 공개 예정.
출시 시점엔 공식 벤치마크가 없고 Z.ai 코딩 플랜에서만 먼저 사용 가능. 일반 API·OpenRouter·Together AI 배포는 아직 대기.
한국 개발자가 당장 의미 있는 워크로드는 "긴 코드베이스 리팩터·에이전트 루프"이고, 한국어 RAG는 아직 Kimi K2.6 쪽이 안전한 선택.

🗓️ 출시 요약 — 무엇이, 언제, 어떻게

Z.ai는 6월 13일 공식 블로그에서 GLM 5.2를 발표했다. MoE 기반 모델로 컨텍스트 1M을 "실제 사용 가능한 수준"으로 끌어올렸다고 주장하지만, 총 파라미터·활성 파라미터·어텐션 구조 같은 아키텍처 세부는 공식 미공개다. 한 번에 출력 가능한 토큰 수는 131,072개로, 풀리퀘 단위 디프나 장기 에이전트 트레이스에 맞춰 설계됐다.

다만 6월 14일 현재 가중치는 아직 Hugging Face에 올라오지 않았고, 사용 경로는 GLM 코딩 플랜(Lite·Pro·Max·Team) 한 곳뿐이다. 표준 API와 오픈 가중치는 다음 주로 예고됐다.

💡 한 줄 정리

GLM 5.2는 "코딩 플랜 가입자에게 먼저, 가중치는 곧" 전략으로 출시됐다. 발표 시점엔 공개 벤치마크 0건이라 비교는 GLM 5.1·Kimi K2.6 등 직전 세대 수치로만 가능하다.

📊 GLM 5.2 vs Kimi K2.7 vs DeepSeek 비교

출시 직후라 GLM 5.2 자체 벤치마크는 공개되지 않았다. 그래서 아래 표는 공식 발표 스펙(컨텍스트·라이선스·구조)과 직전 세대 공식 결과를 기준으로 정리한 것이다. 새 점수가 나오면 갱신이 필요한 자료다.

항목	GLM 5.2 (Z.ai)	Kimi K2.7 (Moonshot)	DeepSeek 최신
총 / 활성 파라미터	MoE (공식 미공개)	1T / 32B (MoE, 384 experts)	671B / 37B (V3 계열)
컨텍스트 길이	1,000,000	256,000	128,000
최대 출력 토큰	131,072	16,000	8,192
라이선스	MIT (예고)	Modified MIT	DeepSeek License
직전 세대 SWE-bench Pro	GLM 5.1: 58.4	K2.6: 58.6	비공개
강점 포지션	긴 컨텍스트 에이전트	함수 단위 코딩	범용·가성비

표에서 가장 눈에 띄는 차이는 1M 컨텍스트 + 131K 출력 조합이다. Kimi K2.7(전 세대 K2.6 기준)이 함수 단위 코딩 점수에서 앞섰던 것과 달리, GLM 5.2는 처음부터 "리포 전체를 한 번에 읽고 패치하는 에이전트" 시나리오를 노린 설계다.

💰 가격과 접속 경로 — 지금 쓸 수 있나

출시 첫날 기준 GLM 5.2를 만질 수 있는 경로는 사실상 하나, Z.ai GLM 코딩 플랜이다. 정리하면 다음과 같다.

Z.ai 코딩 플랜 — Lite 약 $18/월(주 400 프롬프트), Pro(주 2,000), Max(주 8,000), Team(좌석제). Claude Code·Cline·OpenCode 등 외부 에이전트에서 토큰 단위 대신 정액으로 사용 가능.
독립 API / chat.z.ai — 6월 13일 발표 기준 "다음 주 공개" 예고. 토큰 단가는 공식 발표 전.
OpenRouter·Together AI — 6월 14일 현재 GLM 5.1까지만 등록(OpenRouter 기준 GLM 5.1 입력 약 $0.98 / 출력 $3.08 per 1M tokens). 5.2 등록은 가중치 공개 이후로 예상.
자가 호스팅 — MIT 라이선스 발표 후 Hugging Face에 가중치가 올라오면 가능. 단 정확한 파라미터 규모는 공식 미공개이며, MoE 대형 모델 특성상 단일 H100 한 장으로는 부족할 가능성이 커 멀티 GPU·INT4 양자화가 사실상 필수로 보인다.

⚠️ 가격을 단정하지 말 것

출시 첫날 가격을 "GLM 5.1과 비슷할 것"으로 추정하는 글이 많지만, 활성 파라미터 규모가 늘었을 경우 추론 비용이 더 붙을 가능성이 있다. 견적은 공식 API 가격이 나온 뒤 다시 계산할 것.

🙋 한국 개발자는 어디에 쓸 만한가

한국어 처리에 대한 별도 발표는 아직 없다. 다만 직전 모델 GLM 5.1까지의 경험을 종합하면, 워크로드별로 다음과 같은 그림이 그려진다.

긴 코드베이스 리팩터링 — 1M 컨텍스트 + 131K 출력은 모놀리식 레포를 한 번에 들고 패치하는 시나리오에서 Claude Sonnet 4.x·GPT-5보다 유리하다. 코딩 플랜 정액제가 토큰 폭주를 막아주는 점도 매력.
한국어 RAG / 챗봇 — 별도 한국어 벤치마크가 공개되지 않은 상황. 현재로선 검증된 Kimi K2.6 또는 Claude 4.x 쪽이 안전. 어제 다룬 Kimi K2.7 한국어 평가 글의 기준을 그대로 GLM 5.2에 다시 돌려봐야 한다.
에이전트 루프(코드 + 도구) — Claude Code·OpenCode·Cline 호환이 발표 시점부터 명시됐다는 점이 실용적. 비용 측면에서 Claude 4.x 대비 의미 있는 절감이 가능할지는 공식 API 단가 공개 후 판단.

⚠️ 단점과 주의할 점

공식 벤치마크 0건 — SWE-bench Verified·LiveCodeBench·HumanEval 어느 것도 출시일 기준 공개되지 않았다. "이전 세대보다 낫다"는 주장은 아직 검증 불가.
한국어 평가 부재 — KoBEST·HAE-RAE 같은 한국어 벤치마크는 커뮤니티 평가를 기다려야 한다. 한국어 RAG 본격 투입 전 자체 평가 셋으로 한 번 더 확인 필요.
접속 경로 제한 — 출시 첫 주는 사실상 Z.ai 코딩 플랜만 가능. 토큰 단위로 결제하던 워크플로엔 즉시 도입이 어렵다.
자가 호스팅 진입장벽 — 가중치가 풀려도 대형 MoE 모델은 GPU 다수 + 양자화가 필요할 가능성이 높아 개인·소규모 팀엔 부담(정확한 규모는 공식 미공개).

✅ 핵심 정리

GLM 5.2 = MoE(세부 미공개) + 1M 컨텍스트 + MIT(예고)의 "긴 컨텍스트 에이전트" 특화 모델.
출시 첫 주 접속은 Z.ai 코딩 플랜뿐. OpenRouter·Together·자가 호스팅은 다음 주 가중치 공개를 기다려야 한다.
한국 개발자는 "리포 단위 코드 에이전트"부터 검토, 한국어 RAG는 벤치마크 공개 후 판단.

🚀 지금 바로 할 일

Z.ai 블로그의 GLM 5.2 발표 글을 북마크하고, 다음 주 API/가중치 공개일을 캘린더에 표시한다.
현재 사용 중인 LLM 워크로드(코드 에이전트·한국어 RAG·내부 검색) 중 "1M 컨텍스트가 진짜 필요한 케이스"를 1개 골라 평가 세트로 준비한다.
가중치 공개 직후 OpenRouter 등록을 알림으로 받기 위해 OpenRouter Z.ai 페이지를 즐겨찾기에 추가한다.

💬 의견

국내 서비스에서 1M 컨텍스트를 정말 활용할 수 있는 시나리오가 있는지, 또 Claude 4.x에서 GLM 계열로 갈아탈 만큼의 비용 절감이 나오는지 직접 비교해 본 경험을 댓글로 공유해 주시면 다른 독자에게도 큰 도움이 됩니다.

참고 자료

작성자: AI 인프라·오픈소스 LLM을 매일 추적하는 한국 개발자. 신모델이 나오면 한국어 처리·실제 비용·도입 경로를 정리해 한국 팀이 의사결정에 쓸 수 있도록 글로 남기고 있다.

저작자표시 비영리 변경금지 (새창열림)

'AI 뉴스' 카테고리의 다른 글

SpaceX의 Cursor 60억 달러 인수, 무엇이 달라지나 (2026) (0)	2026.06.16
ChatGPT Dreaming Memory 정리: OpenAI의 새 장기 기억 시스템은 무엇이 다른가 (2026) (0)	2026.06.15
NVIDIA SkillSpector: AI 스킬 보안 분석 (2026) (0)	2026.06.13
Kimi K2.7-Code 완전 분석: 오픈소스 코딩 LLM 정리 (0)	2026.06.12
Apache Burr 첫인상: 상태머신 기반 AI 에이전트 (2026) (0)	2026.06.11

AI·개발자 도구를 실무에서 쓰며 정리하는 블로그

GLM 5.2 출시 정리: Zhipu AI 새 오픈소스 LLM (2026)

📌 핵심 3줄 요약

🗓️ 출시 요약 — 무엇이, 언제, 어떻게

📊 GLM 5.2 vs Kimi K2.7 vs DeepSeek 비교

💰 가격과 접속 경로 — 지금 쓸 수 있나

🙋 한국 개발자는 어디에 쓸 만한가

⚠️ 단점과 주의할 점

🚀 지금 바로 할 일

💬 의견

참고 자료

'AI 뉴스' 카테고리의 다른 글

티스토리툴바

GLM 5.2 출시 정리: Zhipu AI 새 오픈소스 LLM (2026)

📌 핵심 3줄 요약

🗓️ 출시 요약 — 무엇이, 언제, 어떻게

📊 GLM 5.2 vs Kimi K2.7 vs DeepSeek 비교

💰 가격과 접속 경로 — 지금 쓸 수 있나

🙋 한국 개발자는 어디에 쓸 만한가

⚠️ 단점과 주의할 점

🚀 지금 바로 할 일

💬 의견

참고 자료

'AI 뉴스' 카테고리의 다른 글

관련글

티스토리툴바