39K 스타 에이전트 페르소나, 42K 스타 스킬 프레임워크, 27K 스타 1비트 LLM: 2026년 3월 GitHub 트렌딩이 가리키는 것

2026-03-16 · # AI 뉴스

GitHub AI 에이전트 BitNet 오픈소스 Claude Code 1비트 LLM

2026년 3월 둘째 주, GitHub 트렌딩 목록에서 이례적인 장면이 펼쳐졌다. AI 에이전트와 관련된 세 개의 오픈소스 프로젝트가 서로 다른 범주에서 동시에 상위권을 점령한 것이다. 하나는 AI 에이전트 페르소나(persona) 컬렉션이고, 하나는 코딩 에이전트의 행동 방법론이며, 마지막 하나는 LLM 자체의 추론 효율을 바꾸는 프레임워크였다.

세 프로젝트가 각자 다른 문제를 풀고 있는데도 같은 시점에 폭발한 것은 우연이 아니었다. AI 에이전트가 실제 업무에 투입되기 시작하면서, 개발자들이 “무엇을 시킬 것인가”, “어떻게 시킬 것인가”, “어디서 실행할 것인가”라는 세 가지 질문에 동시에 답을 찾고 있다는 신호였다.

1. agency-agents: 에이전트 팀을 즉시 소환하다

msitarzewski/agency-agents¹는 레딧 스레드 하나에서 시작됐다. 개발자 msitarzewski가 AI 에이전트 페르소나를 공유하자, 12시간 안에 50명이 넘는 사용자가 추가 배포를 요청했다. 그 요청에 답해 GitHub에 공개된 이 레포지토리는 2026년 3월 기준 39,300개의 스타와 5,900개의 포크를 기록했다.²

프로젝트의 핵심 아이디어는 단순하다. AI 에이전트에게 맡길 역할을 마크다운 파일로 정의하고, 그것을 Claude Code, Cursor, Aider, Windsurf 같은 코딩 환경에 복사해 쓴다. 각 에이전트 파일에는 정체성, 성격, 핵심 미션, 작업 프로세스, 기대 산출물, 커뮤니케이션 스타일이 명시돼 있다.

부서 구성은 실제 에이전시를 모델로 설계됐다. 엔지니어링 부문에는 프런트엔드 개발자, 백엔드 아키텍트, 모바일 앱 빌더, AI 엔지니어가 있고, 그 외에도 UX 리서처, 브랜드 가이언, 그로스 해커, 지원 응답자, 프로젝트 셰퍼드 등이 포진해 있다. “Whimsy Injector”(유머 주입 담당)나 “Reality Checker”(현실 점검 담당) 같은 독특한 역할도 눈에 띈다.

레포지토리에 포함된 Nexus Spatial Discovery Exercise는 멀티 에이전트 협업의 작동 방식을 보여주는 예시다. 제품 트렌드 리서처, 백엔드 아키텍트, 브랜드 가이언, 그로스 해커, 지원 응답자, UX 리서처, 프로젝트 셰퍼드, XR 인터페이스 아키텍트 — 총 8개의 에이전트가 소프트웨어 기회를 동시에 평가해 시장 검증, 기술 아키텍처, 브랜드 전략, 고객 확보 전략, UX 리서치, 프로젝트 실행 계획을 단일 보고서로 통합한다.

Claude Code를 기본 환경으로 권장하지만, 설치 스크립트(convert.sh, install.sh)가 각 도구에 맞는 형식으로 변환을 자동화한다. MIT 라이선스여서 상업적 활용에도 제약이 없다.

[!KEY] agency-agents의 강점은 프레임워크가 아니라 큐레이션에 있다. 각 에이전트 파일은 수개월간 커뮤니티 피드백을 반영해 다듬어진 실전형 프롬프트다. 제네릭한 “전문가처럼 행동해” 지시문과 달리, 실제 워크플로우와 검증 가능한 산출물이 함께 정의돼 있다.

2. obra/superpowers: 바이브 코딩 대신 스펙 주도 개발

obra/superpowers³는 “바이브 코딩”(vibe coding) — 감으로 코딩 에이전트에게 지시를 날리는 방식 — 에 대한 정면 반박이다. Jesse(obra)가 수개월에 걸쳐 자신의 코딩 에이전트 활용 노하우를 체계화한 결과물로, 2025년 10월 Claude Code가 플러그인 시스템을 출시하면서 공개됐다.⁴ 2026년 3월 기준 42,000개 이상의 스타를 기록했으며,⁵ 2026년 1월에는 Anthropic 공식 Claude 플러그인 마켓플레이스에 등재됐다.⁶

프로젝트의 철학은 명확하다. 에이전트에게 코드를 바로 작성하게 하지 않는다. 대신 다음 순서를 강제한다.

발견: 에이전트가 무엇을 만들려는지 대화로 파악한다
스펙 작성: 충분히 짧아서 실제로 읽을 수 있는 단위로 스펙을 나눠 제시한다
검토 및 승인: 사용자가 스펙에 서명한다
구현 계획: “판단력이 부족한 열정적인 주니어 엔지니어도 따를 수 있을 만큼 명확한” 구현 계획을 수립한다
서브에이전트 실행: 서브에이전트들이 각 엔지니어링 작업을 처리하며, 완료 후 스펙 준수 여부와 코드 품질을 2단계로 검토한다

YAGNI(You Aren’t Gonna Need It), DRY(Don’t Repeat Yourself), TDD(Test-Driven Development) 원칙이 기본값으로 내장돼 있다. 서브에이전트 시스템 덕분에 Claude는 몇 시간씩 계획에서 이탈하지 않고 자율적으로 작업을 이어갈 수 있다.⁷

기술적으로는 스킬 시스템이 핵심이다. 에이전트가 필요에 따라 스킬 파일을 로드해 행동한다. 스킬은 조합 가능하며, 커뮤니티가 새 스킬을 추가해 생태계를 확장한다. Claude Code 공식 마켓플레이스, Cursor 플러그인 마켓플레이스, Codex, OpenCode, Gemini CLI를 지원한다.

Git 워크트리(worktree) 자동 생성도 주목할 기능이다. 병렬 작업 시 서로 간섭하지 않도록 각 작업에 독립된 브랜치 환경을 제공한다.

3. BitNet: 100B 파라미터를 노트북 CPU로 돌리다

microsoft/BitNet⁸은 결이 다르다. 어떤 에이전트를 써야 하는지, 어떻게 시켜야 하는지의 문제가 아니라, 모델 자체를 어떻게 효율적으로 실행하느냐에 관한 것이다. 2024년 10월 처음 공개된 이 프레임워크는 2026년 1월 15일 CPU 추론 최적화 업데이트를 거치면서⁹ 다시 한번 Hacker News 프런트 페이지에 올랐다.¹⁰ 현재 스타 수는 27,400개다.

bitnet.cpp는 1비트(실질적으로 -1, 0, +1의 3값을 사용하는 1.58비트) LLM 전용 추론 프레임워크다. GPU 없이 표준 CPU만으로 대규모 모델을 실행할 수 있도록 커널을 최적화했다. 공식 벤치마크는 다음과 같다.

하드웨어	속도 향상	에너지 절감
ARM CPU	1.37× – 5.07×	55.4% – 70.0%
x86 CPU	2.37× – 6.17×	71.9% – 82.2%

2026년 1월 최적화 업데이트는 병렬 커널 구현과 임베딩 양자화 지원을 추가해 기존 구현 대비 1.15× – 2.1× 추가 가속을 달성했다.¹¹

가장 인상적인 수치는 100B 파라미터 규모다. BitNet b1.58 100B 모델을 단일 CPU에서 초당 5–7토큰으로 실행할 수 있는데, 이는 인간의 평균 독서 속도와 비슷하다. GPU 없이, 클라우드 없이, 일반 노트북에서 100B 모델이 동작한다는 의미다.

Microsoft는 2025년 4월 Hugging Face에 2B 파라미터 공개 모델(BitNet-b1.58-2B-4T, 4조 토큰 학습)을 올렸고,¹² 2025년 5월에는 GPU 추론 커널도 공개했다.¹³ Azure 기반 데모¹⁴도 제공해 빌드 없이 바로 테스트해볼 수 있다.

[!KEY] BitNet이 증명하는 것은 “더 적은 비트로 더 많은 것을 할 수 있다”는 명제다. 1비트 양자화는 단순 압축이 아니라 훈련 단계부터 설계된 아키텍처다. 이 방향이 성숙하면 클라우드 API 없이 엣지 디바이스에서 실용적인 LLM 추론이 가능해진다.

세 프로젝트를 한 장의 지도에 놓으면

세 프로젝트는 AI 에이전트 워크플로우의 서로 다른 층위에 위치한다.

graph TD
    User["개발자/사용자"]

    User -->|"무엇을 시킬 것인가"| AA["agency-agents<br/>에이전트 페르소나 라이브러리<br/>⭐ 39.3K"]
    User -->|"어떻게 시킬 것인가"| SP["obra/superpowers<br/>스펙 주도 개발 방법론<br/>⭐ 42K+"]
    User -->|"어디서 실행할 것인가"| BN["microsoft/BitNet<br/>1비트 CPU 추론 프레임워크<br/>⭐ 27.4K"]

    AA -->|"역할 정의"| Agent["AI 에이전트<br/>(Claude Code, Cursor 등)"]
    SP -->|"실행 방법론"| Agent
    BN -->|"로컬 LLM 백엔드"| Model["1비트 LLM<br/>(온디바이스 실행)"]

    Agent -->|"모델 호출"| Model

agency-agents는 무엇을 시킬지를 해결한다. 역할 정의가 명확하지 않으면 아무리 좋은 에이전트도 산만해진다. 잘 다듬어진 페르소나 파일은 에이전트의 행동 범위와 기대 산출물을 고정시킨다.

superpowers는 어떻게 시킬지를 해결한다. 좋은 역할을 가진 에이전트도 지시 없이 코드부터 작성하면 표류한다. 스펙 주도 개발은 구현 전 맥락 합의를 강제해, 에이전트가 “계획에서 이탈하지 않고 몇 시간씩” 작업할 수 있게 한다.

BitNet은 어디서 실행할지를 해결한다. 클라우드 API는 비용, 지연, 프라이버시 문제를 수반한다. 1비트 추론이 성숙하면 에이전트의 백엔드 모델이 로컬 CPU로 이동한다.

세 프로젝트가 동시에 폭발한 이유는 이 세 가지 질문이 독립적이지 않기 때문이다. 역할이 정의되고, 방법론이 갖춰지고, 실행 비용이 낮아지는 세 조건이 동시에 충족될 때 비로소 에이전트가 실제 업무에 투입될 수 있다.

비교: 어떤 프로젝트가 어떤 상황에 맞는가

아래 표는 세 프로젝트의 사용 시나리오와 진입 장벽을 비교한다.

항목	agency-agents	superpowers	BitNet
주요 사용자	AI 에이전트 활용 개발자/기획자	코딩 에이전트 사용자	ML 엔지니어, 엣지 개발자
핵심 가치	역할 정의	프로세스 규율	추론 효율
진입 장벽	낮음 (마크다운 복사)	중간 (플러그인 설치 + 학습)	높음 (빌드 또는 호환 모델 필요)
모델 의존성	모델 무관	Claude Code 최적화	BitNet 전용 모델
클라우드 필요	에이전트 모델에 따라 다름	에이전트 모델에 따라 다름	없음 (CPU 전용 실행 가능)
라이선스	MIT	MIT	MIT

트렌딩이 끝난 뒤 남는 것

GitHub 트렌딩은 변덕스럽다. 하룻밤 사이 수천 스타를 얻고 다음 달이면 잊히는 프로젝트도 많다. 그러나 이 세 프로젝트가 가리키는 방향은 유행보다 길다.

agency-agents는 “에이전트에게 좋은 역할 부여하기”라는 지극히 인간적인 문제를 탐색하고 있다. 팀을 꾸릴 때 직책과 책임을 정의하듯, AI 에이전트에게도 같은 작업이 필요하다는 인식이 커지고 있다. 레딧에서 시작해 커뮤니티가 반년 넘게 다듬어온 이 컬렉션은 그 과정의 산물이다.

superpowers는 “에이전트가 좋은 코드를 생산하려면 좋은 프로세스가 필요하다”는 명제를 실증하고 있다. Claude 공식 마켓플레이스 등재는 Anthropic이 이 접근법을 공식적으로 인정했다는 신호다. 바이브 코딩이 초기 실험 단계를 넘어 생산성 도구로 진화하려면 이런 방법론이 반드시 필요하다.

BitNet은 가장 긴 시간 지평을 가진 프로젝트다. 1비트 LLM 아키텍처는 하드웨어 제약을 소프트웨어로 극복하려는 시도다. CPU에서 100B 모델이 5–7 tok/s로 돌아간다면, AI 추론의 접근 비용 구조가 바뀐다. 클라우드 API 없이 로컬에서 실행 가능한 에이전트는 프라이버시, 비용, 응답 지연 면에서 근본적으로 다른 선택지다.

에이전트 플랫폼 생태계가 어디로 향하는지 더 넓은 맥락이 궁금하다면 에이전트 플랫폼 전쟁: NemoClaw, DeerFlow, OpenClaw 비교를, 로컬 LLM 도구를 선택하는 실용적인 기준이 필요하다면 로컬 LLM 도구 선택 가이드를 참고할 수 있다.

msitarzewski. agency-agents: A complete AI agency at your fingertips. GitHub, 2025. https://github.com/msitarzewski/agency-agents ↩
GitHub branches page for msitarzewski/agency-agents (조회: 2026-03-13). 스타 39.3K, 포크 5.9K 확인. https://github.com/msitarzewski/agency-agents/branches ↩
Jesse (obra). superpowers: An agentic skills framework & software development methodology that works. GitHub, 2025. https://github.com/obra/superpowers ↩
Jesse (obra). “Superpowers: How I’m using coding agents in October 2025”. blog.fsck.com, 2025-10-09. https://blog.fsck.com/2025/10/09/superpowers/ ↩
Pasquale Pillitteri. “Superpowers for Claude Code: Complete Guide 2026”. pasqualepillitteri.it, 2026. 42,000+ 스타 수치 인용. https://www.pasqualepillitteri.it/en/news/215/superpowers-claude-code-complete-guide ↩
r/ClaudeCode. “Superpowers is now on the official Claude marketplace”. Reddit, 2026-01-18. https://www.reddit.com/r/ClaudeCode/comments/1qgkupf/superpowers_is_now_on_the_official_claude/ ↩
obra/superpowers README. “It’s not uncommon for Claude to be able to work autonomously for a couple hours at a time without deviating from the plan you put together.” https://github.com/obra/superpowers ↩
Microsoft. BitNet: Official inference framework for 1-bit LLMs. GitHub, 2024. https://github.com/microsoft/BitNet ↩
Microsoft. “BitNet CPU Inference Optimization”. GitHub, 2026-01-15. https://github.com/microsoft/BitNet/blob/main/src/README.md ↩
“BitNet: Inference framework for 1-bit LLMs”. Hacker News, item #47334694, 2026-03-13. https://news.ycombinator.com/item?id=47334694 ↩
Wang et al. “Bitnet.cpp: Efficient Edge Inference for Ternary LLMs”. arXiv, 2025-02-18. https://arxiv.org/abs/2502.11880 ↩
Microsoft. BitNet-b1.58-2B-4T. Hugging Face, 2025-04-14. https://huggingface.co/microsoft/BitNet-b1.58-2B-4T ↩
Microsoft. BitNet Official GPU inference kernel. GitHub, 2025-05-20. https://github.com/microsoft/BitNet/blob/main/gpu/README.md ↩
Microsoft. BitNet Demo (Azure). https://demo-bitnet-h0h8hcfqeqhrf5gf.canadacentral-01.azurewebsites.net/ ↩