GitHub 트렌딩에서 "멀티 에이전트 × 금융" 키워드를 보고 들어왔다면 TradingAgents가 정확히 그 교차점에 있다. TauricResearch가 공개한 오픈소스 프레임워크로, 분석가·연구원·트레이더·리스크 매니저를 각각 LLM 에이전트로 만들어 한 종목에 대한 매매 시그널까지 도출한다.
⚠️ 디스클레이머
본 글은 학술용/연구용 오픈소스 프레임워크 분석이며, 실거래·투자 추천이 아닙니다. 백테스팅 결과는 과거 데이터 기반 시뮬레이션이며 미래 수익을 보장하지 않습니다.
📌 핵심 3줄 요약
- TradingAgents는 7~8개 역할 에이전트가 토론·합의해 매매 시그널을 내는 멀티 에이전트 워크플로다.
- Python 3.13 + OpenAI/Anthropic 키만 있으면 5분 안에 첫 실행이 가능하지만, 1 사이클당 LLM 호출이 30회 이상이라 토큰 비용을 먼저 가늠해야 한다.
- 단일 파운데이션 모델인 Kronos와 정반대 접근이며, 학술용 시뮬레이션이라는 점을 명확히 인지하고 시작한다.
1. TradingAgents가 뭐고 왜 멀티 에이전트인가
TradingAgents는 헤지펀드 트레이딩룸의 회의 구조를 LLM 에이전트로 옮긴 프레임워크다. 한 모델이 종목을 보고 "사라/팔라"를 즉답하는 대신, 각 분야 전담 에이전트가 각자 데이터를 보고, 토론하고, 리스크 매니저가 최종 검토하는 흐름을 거친다. arXiv:2412.20138 논문이 이 구조의 백테스팅 성능을 보고했고, 2026년 6월 현재 GitHub 트렌딩 Python 상위에 올라 있다.
핵심은 "멀티 에이전트가 단일 LLM보다 합의된 판단을 더 잘 내릴 수 있다"는 가설이다. 실제 코드를 읽어보면 토론 라운드 수, 리서처 간 의견 충돌 시 중재 로직 등이 명시적으로 들어 있다.
2. 프레임워크 아키텍처: 누가 무엇을 하는가
처음 코드를 켜보면 에이전트가 너무 많아 흐름이 잡히지 않는다. 책임 범위와 LLM 호출 횟수를 표로 정리한다. 호출 횟수는 기본 설정(DEFAULT_CONFIG)에서 1회 사이클 기준 추정치다.
| 역할 | 책임 | LLM 호출(추정) | 주 입력 데이터 |
|---|---|---|---|
| Fundamental Analyst | 재무제표·실적 분석 | 2~3회 | 10-K/10-Q 요약, EPS |
| Sentiment Analyst | 소셜·커뮤니티 심리 | 2~3회 | Reddit, StockTwits |
| News Analyst | 헤드라인·이벤트 | 2~3회 | 뉴스 API, Google News |
| Technical Analyst | 차트·지표 | 2~3회 | yfinance OHLCV, MACD/RSI |
| Bull Researcher | 매수 논거·토론 | 3~5회 | 4 분석가 보고서 |
| Bear Researcher | 매도 논거·토론 | 3~5회 | 4 분석가 보고서 |
| Trader | 토론 종합·시그널 산출 | 2~3회 | 양측 리서치 결론 |
| Risk Manager | 포지션·리스크 검토 | 2~3회 | 트레이더 시그널, 변동성 |
내 환경(MacBook Pro M2 24GB, OpenAI gpt-4o-mini)에서 1 종목 1회 사이클이 약 3~5분 걸렸고, 토큰 사용량은 8~12만 토큰 사이였다. gpt-4o로 올리면 같은 사이클이 1~2분으로 짧아지지만 비용은 5배 넘게 뛰었다.
3. 설치: Windows와 macOS 모두 30분 안에
설치 자체는 어렵지 않지만 Python 버전이 까다롭다. 공식 README가 Python 3.13을 요구하기 때문에 시스템 파이썬을 그대로 쓰면 의존성 충돌이 잦다. uv 또는 conda로 격리하는 편이 안전하다.
Windows는 PowerShell에서 uv venv --python 3.13 .venv 후 .\.venv\Scripts\Activate.ps1로 들어가면 동일하게 진행된다. conda를 선호하면 conda create -n tradingagents python=3.13도 README에 명시돼 있다.
설치 직후 python -c "import tradingagents"로 import만 통과되는지 먼저 확인한다. 여기서 막히면 대부분 Python 버전 문제다.
4. 환경변수 설정과 가격 주의
TradingAgents는 LLM 호출이 많은 만큼 API 키 한도와 비용을 미리 체크해야 한다. 최소 구성은 OpenAI 키 하나면 되지만, 뉴스/감성 분석을 풀로 돌리려면 추가 키가 필요하다.
⚠️ 비용 감각
기본 설정에서 1 종목 1 사이클이 OpenAI gpt-4o-mini로 약 $0.05~$0.15, gpt-4o로 약 $0.40~$1.20 정도 들었다. 50일치 백테스팅이면 사이클이 50회 누적되므로, 본격 실험 전에 OpenAI 대시보드에서 사용량 한도(usage limit)를 먼저 걸어두는 편이 안전하다. Yahoo Finance(yfinance)는 무료지만 분당 호출 제한이 있어 종목을 늘리면 rate limit에 자주 걸린다.
5. 첫 실행: 5분 안에 매매 시그널 받기
설치와 키 설정이 끝났다면 종목 하나를 던져 첫 사이클을 돌려본다. README가 제시하는 최소 코드는 4줄이다.
debug=True는 각 에이전트의 중간 출력까지 stdout에 흘리기 때문에 처음에는 켜두는 편이 흐름 파악에 좋다. 출력은 보통 BUY / HOLD / SELL + 근거 요약 + 리스크 매니저 메모 순서로 나온다. 5분 후 NVDA에 대한 멀티 에이전트 합의 시그널이 손에 들어오면 1차 목표 달성이다.
만약 sentiment·news 에이전트가 데이터 부족으로 스킵된다면 FinnHub 키 또는 더 최근 날짜로 다시 시도한다.
6. LLM 백엔드 교체: Claude Opus 4.7로 바꾸기
TradingAgents는 다중 LLM 백엔드(OpenAI, Anthropic, Gemini, Grok, DeepSeek, Qwen, Ollama 등)를 지원한다. 추론 품질이 아쉽다면 Claude Opus 4.7로 갈아끼우는 변경이 가장 간단하다.
deep_think_llm은 리서처·트레이더처럼 긴 추론이 필요한 에이전트가, quick_think_llm은 단순 요약·분류 에이전트가 호출한다. 둘을 분리하면 비용을 절반 가까이 줄이면서 핵심 추론 품질은 유지할 수 있다.
내 테스트에서 Claude Opus 4.7로 바꾼 뒤 Bull/Bear 리서처 토론의 논거 깊이가 눈에 띄게 늘어났고, 사이클 시간은 4~7분, 비용은 1 사이클당 약 $0.80~$1.50로 올라갔다.
7. Kronos와 무엇이 다른가
같은 시기 화제가 된 Kronos는 시계열 단일 파운데이션 모델이다. 가격 시퀀스를 직접 학습해 다음 가격을 예측하는, 말 그대로 "하나의 모델로 끝내는" 접근이다. 반면 TradingAgents는 멀티 에이전트 워크플로로, LLM이 가격을 예측하지 않고 외부 도구·데이터·서로의 의견을 종합해 의사결정을 내린다. 가격 예측을 신뢰하지 않고 LLM의 추론·도구 활용 능력만 활용한다는 점에서 두 프로젝트는 거의 반대편에 있다. 어느 쪽이 더 우월하다기보다, 도메인과 검증 방법이 다르다고 보는 편이 정확하다.
⚠️ 단점과 주의할 점
- 백테스팅 결과는 과거 데이터 기반 시뮬레이션이라 미래 수익을 전혀 보장하지 않는다. 실제 시장 노이즈·체결 슬리피지·세금이 빠져 있다.
- LLM 호출이 많아 비용이 빠르게 누적된다. usage limit 없이 백테스팅을 풀로 돌리면 며칠 만에 수십~수백 달러가 사라질 수 있다.
- 학술/연구용 프레임워크라 실거래 API 연동·주문 안전장치는 포함돼 있지 않다. 자금 운용에 그대로 쓰는 것은 금지다.
✅ 핵심 정리
- TradingAgents는 분석가·리서처·트레이더·리스크 매니저를 LLM 에이전트로 만든 멀티 에이전트 워크플로다.
- Python 3.13 + OpenAI 키 하나면 5분 안에 첫 시그널이 나오고, Claude/Gemini로 백엔드 교체도 2~3줄이면 끝난다.
- 단일 모델 Kronos와는 정반대 접근으로, "LLM 협업이 단일 추론보다 나은가"를 직접 실험하는 도구다.
- 학술·연구용이며 실거래 연동이 없다는 점을 항상 인지하고 다룬다.
🚀 지금 바로 할 일
- Python 3.13 + uv 가상환경 생성, 레포 클론·
pip install -e . .env에 OpenAI 키만 넣고import tradingagents통과 확인- NVDA 한 종목, gpt-4o-mini로 첫 사이클 실행 후 로그 정독
💬 의견
멀티 에이전트 프레임워크를 실제로 켜본 분이 있다면 어느 에이전트가 가장 신뢰할 만하다고 느꼈는지 댓글로 공유 부탁드립니다.
⚠️ 다시 한 번 디스클레이머
본 글은 학술용/연구용 오픈소스 프레임워크 분석이며, 실거래·투자 추천이 아닙니다. 백테스팅 결과는 과거 데이터 기반 시뮬레이션이며 미래 수익을 보장하지 않습니다. 실제 자금 운용에 사용하지 마세요.
참고 자료
- TauricResearch/TradingAgents GitHub 레포
- arXiv:2412.20138 — TradingAgents: Multi-Agents LLM Financial Trading Framework
- yfinance 공식 문서
작성자: AI/기술 도메인 블로거. 오픈소스 LLM 에이전트 프레임워크를 실제로 켜보고, 토큰 사용량과 출력 품질을 직접 측정해 한국어 개발자 관점에서 정리합니다. 본 글은 정보 제공 목적이며 투자 권유가 아닙니다.
'AI 튜토리얼' 카테고리의 다른 글
| LangChain DeepAgents 입문: 장기 작업 가능한 AI 에이전트 만들기 (2026) (0) | 2026.06.09 |
|---|---|
| Transformer Explainer로 GPT 작동 원리 30분 만에 끝내기 (0) | 2026.06.06 |
| MAI-Code-1-Flash 출시 1차 분석 정리 (2026) (0) | 2026.06.03 |
| 스탠포드 CS336 LLM 강의 6주 학습 로드맵 (2026) (0) | 2026.06.02 |
| VoxCPM2 사용법: 로컬 오픈소스 TTS·보이스 클로닝 완벽 가이드 (2026) (0) | 2026.06.01 |