Superpowers, 코딩 에이전트에게 TDD와 코드리뷰를 가르치는 스킬 프레임워크

2026-03-17 · # AI 활용

코딩 에이전트에게 “이 기능을 만들어줘”라고 말하면, 대부분은 곧바로 코드를 쓰기 시작한다. 테스트 없이, 설계 없이, 리뷰 없이. 결과물이 돌아가는 것처럼 보여도 한두 주 뒤에는 기술 부채가 쌓여 있다. Jesse Vincent가 만든 Superpowers는 이 문제를 정면으로 겨냥했다. 에이전트가 코드를 쓰기 전에 브레인스토밍하고, 스펙을 작성하고, TDD로 구현하고, 코드리뷰까지 거치게 만드는 “스킬 프레임워크이자 소프트웨어 개발 방법론”이다.

2025년 10월 Claude Code 플러그인 시스템 출시와 동시에 공개된 이 프로젝트는 2026년 3월 현재 GitHub 스타 42,000개를 넘겼다¹. Anthropic 공식 플러그인 마켓플레이스에도 등록되어 있으며, Claude Code 외에 Cursor, Codex, OpenCode, Gemini CLI까지 지원한다.

Jesse Vincent — RT에서 키보드까지, 그리고 에이전트로

Superpowers를 이해하려면 제작자의 배경을 알 필요가 있다. Jesse Vincent(GitHub: obra)는 Perl 커뮤니티에서 티켓 추적 시스템 Request Tracker(RT)를 만든 개발자다². Best Practical Solutions를 설립해 오픈소스 인프라 도구를 20년 넘게 유지보수해왔다. 2014년에는 Keyboardio를 공동 창업해 에르고노믹 키보드 Model 01을 설계·제조했다³.

RT를 유지보수하며 축적한 이슈 트래킹과 워크플로 자동화 경험, 하드웨어 제품을 직접 설계하며 익힌 체계적 엔지니어링 습관 — 이 두 갈래가 Superpowers의 설계 철학에 그대로 반영되었다. Vincent 본인이 블로그에서 밝힌 것처럼, Superpowers는 그가 수개월간 코딩 에이전트와 협업하며 발견한 패턴을 마크다운 파일로 체계화한 결과물이다⁴.

작동 원리 — 스킬이 에이전트를 조종한다

Superpowers의 핵심 개념은 스킬(Skill)이다. 각 스킬은 SKILL.md라는 마크다운 파일로 정의되며, 에이전트가 특정 상황을 인식하면 자동으로 해당 스킬을 읽고 지시를 따른다. 사용자가 수동으로 호출할 필요가 없다.

설치 후 새 세션을 시작하면, 에이전트는 부트스트랩 프롬프트를 주입받는다. 이 프롬프트가 에이전트에게 “너는 스킬을 가지고 있다. 스킬이 있으면 반드시 사용해야 한다”고 알려준다. 이후 전체 워크플로는 다음과 같이 진행된다.

graph TD
    A[사용자 요청] --> B[brainstorming<br/>소크라틱 설계 정제]
    B --> C[스펙 문서 승인]
    C --> D[writing-plans<br/>구현 계획 작성]
    D --> E[git worktree<br/>격리 브랜치 생성]
    E --> F[subagent-driven-development<br/>태스크별 서브에이전트 배치]
    F --> G[2단계 코드리뷰<br/>스펙 준수 → 코드 품질]
    G --> H[finishing-a-development-branch<br/>머지/PR/폐기 결정]

브레인스토밍에서 스펙까지

에이전트가 구현 요청을 감지하면 곧바로 코드를 쓰지 않는다. 대신 brainstorming 스킬이 활성화되어 사용자에게 질문을 던지고 대안을 탐색한다. 완성된 설계는 사람이 읽을 수 있을 만큼 짧은 섹션으로 나뉘어 제시된다.

구현 계획과 TDD

승인된 스펙을 바탕으로 writing-plans 스킬이 작업을 2–5분 단위의 태스크로 쪼갠다. 각 태스크에는 정확한 파일 경로, 코드 내용, 검증 단계가 명시된다. 구현 단계에서는 test-driven-development 스킬이 RED-GREEN-REFACTOR 사이클을 강제한다. 실패하는 테스트를 먼저 작성하고, 테스트를 통과할 최소한의 코드만 작성하며, 테스트 없이 작성된 코드는 삭제한다.

[!KEY] Superpowers는 에이전트에게 “테스트를 먼저 써라”가 아니라 “테스트 없이 쓴 코드는 지워라”라고 지시한다. 제안이 아니라 강제다.

Subagent-Driven Development

가장 독창적인 부분이다. 계획이 승인되면 subagent-driven-development 스킬이 각 태스크마다 새로운 서브에이전트를 생성한다. 서브에이전트는 할당된 태스크만 수행하며, TDD 원칙을 따른다. 태스크 완료 후에는 2단계 리뷰가 진행된다.

스펙 준수 리뷰 — 구현이 원래 계획과 일치하는지 확인
코드 품질 리뷰 — 코드 자체의 품질, 패턴, 잠재적 문제를 점검

이 구조의 핵심 이점은 컨텍스트 격리다. 메인 에이전트의 컨텍스트 윈도우를 오염시키지 않고 탐색적 작업(파일 검색, 코드 분석 등)을 서브에이전트에 위임할 수 있다. Hacker News의 한 사용자는 이를 “에이전트를 도구로 사용하는 패턴”이라 부르며, 복잡한 태스크를 위한 장시간 자율 작업을 가능하게 하는 핵심 기능이라 평가했다⁵.

git worktree 기반 격리

using-git-worktrees 스킬은 설계 승인 직후 새 브랜치와 워크트리를 생성한다. 같은 프로젝트에서 여러 태스크를 병렬로 진행해도 서로 충돌하지 않는다. 작업 완료 후에는 머지, PR 생성, 브랜치 유지, 폐기 중 하나를 선택할 수 있다.

스킬 라이브러리 전체 구성

Superpowers에 포함된 스킬은 크게 네 범주로 나뉜다.

범주	스킬	역할
테스팅	test-driven-development	RED-GREEN-REFACTOR 사이클, 테스팅 안티패턴 참조
디버깅	systematic-debugging	4단계 근본 원인 분석
	verification-before-completion	수정 후 실제 해결 여부 검증
협업	brainstorming	소크라틱 설계 정제
	writing-plans / executing-plans	구현 계획 작성 및 배치 실행
	subagent-driven-development	태스크별 서브에이전트 + 2단계 리뷰
	dispatching-parallel-agents	동시 서브에이전트 워크플로
	requesting-code-review / receiving-code-review	코드리뷰 요청 및 피드백 처리
	using-git-worktrees / finishing-a-development-branch	워크트리 생성 및 머지 워크플로
메타	writing-skills	새 스킬 작성 가이드
	using-superpowers	스킬 시스템 소개

AGENTS.md, Cursor Rules와 무엇이 다른가

코딩 에이전트에 지시를 주입하는 방법은 여러 가지가 있다. 대표적인 것이 AGENTS.md(또는 CLAUDE.md), Cursor Rules(.mdc 파일), 그리고 Superpowers의 스킬이다.

AGENTS.md는 프로젝트 루트에 놓는 단일 마크다운 파일로, 에이전트가 세션 시작 시 읽는 “상시 적용” 지침이다. 코딩 스타일, 아키텍처 규칙, 금지사항 등 선언적 규칙에 적합하다. 단점은 모든 지침이 항상 컨텍스트에 포함되어 토큰을 소비한다는 것이다.

Cursor Rules는 .cursor/rules/*.mdc 형식으로, alwaysApply, autoAttach(glob 패턴 매칭), agentRequested(에이전트가 필요 시 요청) 등의 트리거 유형을 지원한다. 선언적 규칙과 동적 규칙을 분리할 수 있지만, 절차적 워크플로를 표현하기에는 한계가 있다.

Superpowers 스킬은 이 두 접근법과 근본적으로 다르다. 각 스킬은 독립된 SKILL.md 파일로, 에이전트가 상황을 인식하면 자동으로 읽고 절차적으로 따른다. “코딩 스타일을 이렇게 유지해라”가 아니라 “브레인스토밍이 끝나면 다음 단계로 계획을 작성해라”와 같은 워크플로 지시를 담는다.

Cursor 블로그도 이 차이를 인정했다. “상시 적용되는 선언적 규칙과 비교할 때, 스킬은 동적 컨텍스트 발견과 절차적 how-to 지침에 더 적합하다”⁶. 즉, AGENTS.md와 스킬은 경쟁 관계가 아니라 상호 보완적이다. AGENTS.md로 프로젝트 전반의 규칙을 정의하고, Superpowers로 개발 워크플로를 강제하는 조합이 가능하다.

커뮤니티 반응과 실제 한계

Superpowers에 대한 커뮤니티 반응은 대체로 긍정적이었다. Simon Willison은 공개 직후 상세 분석 노트를 작성했고⁷, Hacker News에서도 활발한 토론이 이어졌다. 특히 서브에이전트 패턴에 대한 관심이 높았는데, 컨텍스트 격리를 통해 장시간 자율 작업이 가능해진다는 점이 핵심 매력으로 꼽혔다.

그러나 한계도 분명했다. 커뮤니티에서 반복적으로 지적된 문제는 다음과 같다.

토큰 소비 폭증. 서브에이전트를 적극적으로 활용하면 토큰 사용량이 급격히 늘어난다. Reddit의 한 사용자는 “Superpowers + Opus 4.5 조합이 매우 좋은 코드를 생산하지만 과잉 설계되고 토큰을 전부 소모한다”고 보고했다⁸. Pro 요금제(월 $20)로는 서브에이전트 기반 워크플로를 감당하기 어렵다는 의견이 다수였다.

계획 비대화. 브레인스토밍과 계획 작성 스킬이 때로는 과도하게 작동한다. 작은 버그 수정에도 전체 워크플로(브레인스토밍 → 스펙 → 계획 → 서브에이전트)를 밟으려 하고, 계획 자체가 지나치게 커져서 오히려 비효율적이 되는 경우가 보고되었다⁹.

스킬 문서의 가독성. Hacker News 토론에서 일부 개발자는 SKILL.md 파일이 사람이 읽기에 혼란스럽다고 지적했다⁵. 이 파일들은 사람이 아니라 에이전트를 위해 작성된 것이기 때문에, 에이전트 지시와 개발자 문서 사이의 간극이 존재한다.

더 큰 흐름 — 에이전트 스킬 생태계의 형성

Superpowers가 특별한 이유는 단순히 “좋은 프롬프트 모음”이 아니라, 에이전트가 스킬을 자체적으로 작성할 수 있다는 점이다. writing-skills 스킬이 그 메타 레이어를 담당한다. Vincent는 블로그에서 프로그래밍 서적을 에이전트에게 읽히고 재사용 가능한 스킬을 추출하게 했다고 밝혔다⁴. 이는 Microsoft의 Amplifier 프레임워크가 추구하는 “자기 개선 에이전트” 패턴과 동일한 방향이다.

이 흐름은 에이전트 플랫폼 전쟁의 연장선에 있다. Claude Code, Cursor, Codex가 각각 플러그인·스킬·규칙 시스템을 도입하면서, 에이전트의 행동을 정의하는 “메타 레이어”가 새로운 경쟁 지점이 되었다. Superpowers는 이 경쟁에서 특정 플랫폼에 종속되지 않은 크로스 플랫폼 스킬 프레임워크로 자리 잡았다. GitHub 트렌딩에서도 꾸준히 상위권을 유지하는 이유다.

결론 — 에이전트에게 방법론을 가르치는 시대

Superpowers의 핵심 통찰은 명확했다. 코딩 에이전트의 문제는 코드를 못 쓰는 것이 아니라, 소프트웨어 개발 방법론을 모른다는 것이었다. 테스트를 먼저 쓰고, 설계를 검증하고, 코드리뷰를 받는 — 주니어 개발자에게 가르치는 것과 동일한 프로세스를 에이전트에게도 가르쳐야 했다.

42,000개의 스타는 이 접근법에 대한 개발자 커뮤니티의 공감을 보여준다. 물론 토큰 비용과 과잉 설계라는 한계는 남아 있다. 하지만 에이전트가 몇 시간 동안 자율적으로 작업하면서도 TDD를 지키고 코드리뷰를 거치는 미래가 현실적으로 가능하다는 것을 Superpowers는 이미 증명했다.