본문 바로가기
AI 튜토리얼

CLI-Anything 입문: GUI 앱을 에이전트 CLI로 자동 래핑 (2026)

by 정부우르사 2026. 5. 23.
반응형

"GIMP를 Claude Code가 직접 조작하게 하고 싶은데, 그놈은 GUI밖에 없네." 이런 막막함을 한 번이라도 느껴봤다면 이 글이 정확히 그 답을 준다.

홍콩과기대 HKUDS 랩이 공개한 CLI-Anything은 "모든 소프트웨어를 에이전트가 다룰 수 있는 CLI로 자동 래핑한다"는 도발적인 프레임워크다. GIMP·Blender·LibreOffice·Inkscape·OBS·n8n 등 40여 종 데스크톱·SaaS 앱에 대해 에이전트 호출 가능한 CLI 하네스(harness)를 자동 생성한다. 이 글은 설치부터 첫 하네스 생성, Claude Code 연결까지 따라할 수 있는 입문 가이드다.


📌 핵심 3줄 요약

  • CLI-Anything은 HKUDS 랩의 오픈소스(Apache 2.0)로, GUI/SDK만 있는 소프트웨어를 에이전트가 호출 가능한 CLI로 자동 변환한다.
  • Claude Code에서는 /plugin marketplace add HKUDS/CLI-Anything 한 줄로 설치되고, /cli-anything ./gimp 식으로 하네스가 생성된다.
  • Claude Code·OpenCode·Goose·Codex·GitHub Copilot CLI 등 SKILL 표준을 따르는 거의 모든 코딩 에이전트와 호환된다.

1. CLI-Anything이 정확히 해결하는 문제

요즘 LLM 에이전트는 텍스트는 잘 다루지만, 데스크톱 그래픽 툴이나 SDK가 없는 SaaS는 여전히 사각지대다. GIMP 보정을 자동화하려 해도, Blender 일괄 렌더링을 시키려 해도 결국 사람이 마우스를 잡아야 한다.

  • GUI 자동화(pyautogui)는 깨지기 쉽고 헤드리스 환경에서 못 쓴다.
  • 각 앱의 내부 API(예: GIMP Script-Fu)는 학습 곡선이 가파르다.
  • 에이전트는 결국 "터미널 명령"이라는 단순 인터페이스를 가장 안정적으로 호출한다.

CLI-Anything은 이 갭을 메운다. 대상 소프트웨어의 소스·문서를 LLM 코딩 에이전트가 분석해 명령 트리·인자·JSON 응답 스키마까지 갖춘 에이전트 친화적 CLI를 자동 생성한다. 결과물은 cli-anything-blender scene new --name ProductShot 같은 명령으로 떨어진다.


2. 설치: Claude Code 플러그인이 가장 빠르다

요구사항부터 정리하면 Python 3.10 이상, 대상 소프트웨어 설치, 그리고 지원되는 코딩 에이전트(Claude Code 권장). Windows 사용자는 Git Bash(cygpath 지원)도 필요하다.

# 1) Claude Code에서 마켓플레이스 추가
/plugin marketplace add HKUDS/CLI-Anything
/plugin install cli-anything

# 2) Pi Coding Agent를 쓴다면
git clone https://github.com/HKUDS/CLI-Anything.git
bash .pi-extension/cli-anything/install.sh

# 3) OpenCode 사용자
cp CLI-Anything/opencode-commands/*.md ~/.config/opencode/commands/
cp CLI-Anything/cli-anything-plugin/HARNESS.md ~/.config/opencode/commands/

설치 직후 에이전트에 /cli-anything/cli-anything:refine 두 슬래시 커맨드가 등록된다. 둘이 사실상 입구의 전부라 학습 부담이 작다.


3. 첫 하네스 생성: GIMP를 예로 4단계

한 번의 슬래시 명령으로 대상 소프트웨어의 CLI 하네스가 자동 생성된다. 흐름은 다음 4단계다.

  1. 대상 지정/cli-anything ./gimp처럼 소스 디렉터리나 설치 경로를 알려준다.
  2. 구조 분석 — 코딩 에이전트가 진입점·문서·플러그인 API를 훑어 명령 트리를 설계한다.
  3. 코드 생성 — <software>/agent-harness/ 폴더에 Click/Typer 기반 CLI가 작성된다.
  4. 설치·검증 — cd gimp/agent-harness && pip install -e .로 명령을 등록하고 시험 호출한다.
# 생성된 하네스 설치
cd gimp/agent-harness
pip install -e .

# 첫 호출 (JSON 응답 모드)
cli-anything-libreoffice document new -o report.json
cli-anything-blender --json scene new --name ProductShot

품질이 부족하면 /cli-anything:refine ./gimp "batch processing and filters"로 특정 기능군을 더 정밀하게 깎을 수 있다. 1차 생성 → 검증 → refine 2~3회 사이클로 다듬는 게 현실적이다.


4. 호환 에이전트와 적용 가능한 앱

SKILL 표준을 따르는 거의 모든 코딩 에이전트에서 동작한다. 조합별 안정성을 비교하면 다음과 같다.

호스트 에이전트 설치 방식 체감 안정성
Claude Code /plugin install cli-anything 최상 (공식 권장)
OpenCode / Goose 명령 파일 복사
Codex / Copilot CLI SKILL spec 주입 중~상
Pi / Qodercli / OpenClaw 전용 install.sh

적용 앱은 GIMP·Blender·Inkscape·Audacity·LibreOffice·OBS Studio·Draw.io·Ollama·ComfyUI·Zotero·Calibre·n8n·Godot 등 40종이 넘는다. 즉 그래픽·오디오·DTP·노트·자동화 워크플로 도구 대부분이 1차 후보다.


⚠️ 단점과 주의할 점

  • 1차 생성된 하네스가 항상 완벽하진 않다. 명령 누락·인자 타입 오류는 흔하니 refine 2~3회와 사람 검수가 사실상 필수다.
  • 대상 소프트웨어가 헤드리스 모드를 지원하지 않으면 결국 GUI가 떠야 해 CI/서버 환경에서는 한계가 있다.
  • Claude Code 외 에이전트는 설치·연결 단계가 수동 복사 기반이라 처음엔 잔손이 간다.
  • SaaS 앱의 경우 공식 API 키·OAuth 설정을 별도로 해야 하므로 CLI 생성만으로 즉시 동작하지 않는다.

🚀 지금 바로 할 일

  1. Claude Code에서 /plugin marketplace add HKUDS/CLI-Anything/plugin install cli-anything을 차례로 실행해 환경을 갖춘다.
  2. 가장 자주 쓰는 GUI 도구 한 개(예: GIMP, LibreOffice)에 /cli-anything ./<path>를 돌려 하네스를 생성하고 pip install -e .로 설치한다.
  3. 생성된 명령을 5~10개 시험 호출해 보고, 누락된 기능은 /cli-anything:refine으로 한 차례 더 보강한 뒤 운영 스크립트에 끼워 넣는다.

💬 의견

에이전트로 자동화하고 싶지만 CLI가 없어 막혔던 소프트웨어가 있었다면 댓글로 공유 부탁드립니다. 다음 글은 생성된 하네스를 Claude Code 워크플로에 묶어 실제 디자인 자동화 파이프라인을 짜는 사례를 다룰 예정입니다.


함께 보면 좋은 글

참고 자료

반응형