1AutoResearch란 무엇인가
Andrej Karpathy가 2026년 3월 7일 공개한 오픈소스 도구입니다. GitHub 공개 직후 엄청난 반응을 이끌어냈습니다.
핵심 설계 원칙: 5분 실험 제한
AutoResearch의 가장 독특한 설계는 모든 실험을 정확히 5분으로 제한하는 것입니다. 덕분에 시간당 약 12회, 하룻밤 동안 100회 이상의 실험이 가능하며, 모든 실험이 동일한 시간 조건에서 진행되어 결과를 공정하게 비교할 수 있습니다.
3개 파일로 이루어진 단순한 구조
prepare.py
데이터 준비 스크립트. 수정 불가 — 공정한 비교를 위한 고정 기반
train.py
에이전트가 반복해서 수정하는 학습 스크립트. 실험의 핵심 파일
program.md
에이전트에게 전달하는 지시 파일. 연구자가 목표와 제약을 기술
에이전트는 program.md를 읽고 train.py를 수정하면서 제안 → 학습 → 평가 → 유지/폐기 루프를 반복합니다. 검증된 개선 사항만 남겨나가는 방식입니다.
2Claude Code란 무엇인가
Claude Code는 Anthropic이 개발한 에이전틱 코딩 도구입니다. 코드베이스를 읽고, 파일을 편집하고, 명령을 실행하며, 개발 도구와 통합됩니다. 터미널, IDE, 데스크톱 앱, 브라우저 환경 어디서나 사용할 수 있습니다.
주요 성능 지표
2026년 2월 추가된 주요 기능
멀티 에이전트 협업 New
Agent Teams: 여러 에이전트가 병렬로 태스크를 분담하여 처리
MCP 서버 통합 New
외부 도구와 실시간 연결. 데이터베이스, API, 모니터링 등 확장 가능
커스텀 훅 New
워크플로우를 사용자 환경에 맞게 확장. 자동화 트리거 설정 가능
Claude Code가 AutoResearch 1순위 권장 도구인 이유
3핵심 관계: AutoResearch의 실행 엔진이 Claude Code
AutoResearch를 실제로 실행할 때 Claude Code를 에이전트로 사용합니다. 리포지토리에 Claude Code를 실행시키면, 수 시간 혹은 며칠 동안 루프를 돌면서 더 나은 모델이 자동으로 만들어집니다.
설계 레이어 + 실행 레이어
AutoResearch가 “무엇을 어떻게 반복할지” 설계하면,
Claude Code가 그 설계를 실제로 실행합니다.
autoresearch 루프를 구동하는 도구 선택지 중 Claude Code가 1순위 권장 도구로 꼽히는 이유는 강력한 추론 능력과 장시간 자율 운용 능력 때문입니다.
4한눈에 보는 비교 표
| 항목 | AutoResearch | Claude Code |
|---|---|---|
| 성격 | 실험 루프 설계 패턴 (프레임워크) | AI 코딩 에이전트 (도구) |
| 역할 | 무엇을 반복할지 정의 | 실제로 실행하는 주체 |
| 도메인 | ML 학습 실험 자동화 | 범용 코드 작업 |
| 오픈소스 | ✅ MIT 라이선스 | ❌ 상용 (Anthropic) |
| 자율성 | 밤새 무인 실험 가능 | 복잡한 태스크 자율 수행 |
| 계층 관계 | 설계 레이어 | 실행 레이어 |
| 공개일 | 2026년 3월 7일 | 2024년 (지속 업데이트) |
| 주요 지표 | GitHub ⭐ 21,000+ | SWE-bench 80.9% |
5실제 활용 시나리오
AutoResearch + Claude Code를 함께 사용하는 일반적인 흐름입니다.
연구자가 program.md 작성
실험 목표, 평가 지표, 제약 조건을 자연어로 기술합니다.
Claude Code가 train.py 수정
지시를 해석하여 첫 번째 실험 변형(variation)을 생성합니다.
5분 제한 학습 실행
모든 실험이 동일한 시간 조건에서 진행되어 결과가 공정하게 기록됩니다.
Claude Code가 결과 분석
유망한 방향은 유지, 성과 없는 변형은 폐기. 다음 실험 방향을 결정합니다.
루프 반복 — 수십~수백 회
하룻밤 동안 100회 이상 반복하며 최적 모델을 자동으로 찾아냅니다.
6마치며
AutoResearch와 Claude Code는 경쟁 관계가 아니라 계층 관계에 있습니다. 두 도구를 함께 이해하면, AI 주도 연구 자동화의 현재 방향을 훨씬 명확하게 볼 수 있습니다.
한 줄 요약
AutoResearch = “무엇을 어떻게 자동화할지”의 설계
Claude Code = “그 설계를 실행하는” 에이전트