Emergent, Claude로 자율 코딩 에이전트 구축

산업:

소프트웨어

기업 규모:

중소기업

제품:

Claude Platform

위치:

북아메리카

ARR 2천 5백만 달러

상용화 출시 4.5개월 만에 달성

200만 명

코딩 지식 없이 애플리케이션을 개발할 수 있게 된 사용자 수

Customer story: Brex

compliance rate vs 70% industry standard

Customer story: Brex

compliance rate vs 70% industry standard

Video caption

Customer story: Brex

94%

compliance rate vs 70% industry standard

Video caption

Emergent는 소프트웨어 개발을 대화하는 것만큼이나 단순하게 만드는 AI 플랫폼입니다. 이 기업은 클라우드 기반 개발 환경에서 실행되는 자율 코딩 에이전트를 구축하여, 사람의 개입 없이 코드를 작성하고, 데이터베이스를 관리하며, 배포를 처리하고, 문제를 디버깅합니다.

Claude를 통해 Emergent가 달성한 성과:

상용화 출시 4.5개월 만에 ARR 2천 5백만 달러 달성
200만 명이 넘는 사용자가 코딩 지식 없이 애플리케이션 개발 가능
평균 5,000줄 이상의 코드로 구성된 완전한 풀스택 애플리케이션 생성
프론트엔드, 백엔드, 테스트, 배포를 각각 전담하는 특화된 Claude 인스턴스로 멀티 에이전트 시스템 구축

과제

Emergent는 코딩이라는 장벽을 없애 소프트웨어 개발을 대중화하고자 했습니다. Emergent 고객은 MVP를 구축하는 창업자, 사내 도구를 제작하는 제품 관리자, 산업 솔루션을 개발하는 분야별 전문가, 운영을 자동화하려는 소상공인 등으로, 기존에 5만 달러 이상의 개발비가 들던 애플리케이션을 월 25-50달러의 비용으로 제작합니다.

Emergent의 CEO이자 공동 창업자인 Mukund Jha는 "우리는 세 번의 변화를 겪었습니다"라고 말했습니다. 회사는 처음에 웹 애플리케이션을 탐색하고 인터페이스를 이해하며 기능을 검증할 하는 에이전트를 갖춘 AI 기반 QA 테스팅 제품을 개발했습니다. 그리고 Y Combinator 첫날 깨달은 것입니다. 'AI가 애플리케이션을 테스트할 수 있을 정도로 잘 이해한다면, 아예 직접 만드는 것은 어떨까?'

팀은 즉시 사업을 전환했습니다. 두 번째 버전은 SWE 벤치마크 1위에 올랐고 Devin의 점수를 능가한 엔터프라이즈 코딩 에이전트가 되었습니다. 그러나 기업 판매 주기로 인해 피드백이 수개월씩 지연되었습니다. 회사는 1월에 다시 한번 사업을 전환하여, 이번에는 소비자 시장을 대상으로 에이전트를 누구나 즉시 개발을 시작할 수 있는 웹 플랫폼으로 패키징했습니다.

그러나 세 가지 중요한 기술적 과제에 직면했습니다. 모델이 같은 세션 내에서 지침을 잊어버리고, 서식 요구사항을 지정해도 몇 분 후에 무시하는 문제가 발생한 것입니다. 또한 '나머지는 동일함'과 같은 주석을 달며 코드 일부만 작성하여 실제 개발에 사용할 수 없는 결과물을 내놓기도 했습니다. 가장 큰 문제는, 에이전트가 수백 개의 터미널 명령을 실행해야 했지만, 모델이 올바른 구문과 매개변수 순서를 일관되게 유지하지 못했다는 점입니다.

Claude, 완전한 자율 개발 워크플로우 실현

Emergent는 주요 독점 모델부터 오픈소스 옵션까지 모든 것을 테스트했습니다. 그중 Claude는 가장 중요한 지표에서 월등히 우수한 성능을 보였습니다.

한 번 주어진 지시사항은 전체 프로젝트에서 일관되게 유지되었습니다. 도구 호출 구문과 다단계 워크플로우에서의 명령 실행은 높은 정확도를 보였습니다. 또한 모델은 500줄 이상의 전체 코드 파일을 잘림 없이 일관되게 생성했습니다.

Jha는 "API 통합은 간단했습니다. 이틀 만에 프로덕션에 적용할 수 있었죠"라고 말했습니다.

Emergent, 개발 라이프사이클 전반에 Claude 배포

Claude는 Emergent 플랫폼에서 다섯 가지 핵심 기능을 지원합니다. 코드 생성에 있어서는 Python 백엔드, JavaScript 프론트엔드, 데이터베이스 스키마에 걸쳐 평균 5,000줄 이상의 완전한 애플리케이션을 제합니다. 멀티 에이전트 오케스트레이션에서는 서로 다른 Claude 인스턴스가 전문화된 작업을 처리합니다. 하나는 프론트엔드 작업을, 다른 하나는 백엔드 로직을, 세 번째는 테스트를, 네 번째는 배포를 관리합니다.

자율 디버깅을 위해 Claude는 스택 트레이스를 분석하고, 근본 원인을 파악하며, 사람의 개입 없이 수정 사항을 구현합니다. 비전 기능을 활용하여 시각적 테스트를 통해 UI 기능을 검증하기도 합니다. 또한 적절한 기술 스택을 선택하고 디자인 패턴을 구현하는 아키텍처 의사결정까지 내립니다.

Jha는 이렇게 말했습니다. "더 큰 도전은 Claude를 신뢰하는 법을 배우는 것이었습니다" 라며, "우리는 계속 Claude를 제한하고, 가드레일을 추가하고, 기능을 제한하려 했습니다. 그러다 깨달았습니다. Claude는 제약이 적을수록 성능이 뛰어나다는 것을 말이죠. 그래서 가상 머신에 대한 전체 액세스 권한을 부여했습니다. 바로 그때 마법 같은 일이 일어났습니다."

이러한 접근 방식은 이전에는 불가능했던 기능을 실현했습니다. 이제 프로젝트는 이전의 10~15단계에 비해 100단계 이상의 워크플로우를 성공적으로 완료할 수 있습니다. 에이전트는 사람의 개입 없이 5,000줄 이상의 코드베이스를 생성하고, 프론트엔드와 백엔드가 분리된 풀스택 애플리케이션을 제작합니다. 게다가 WebSocket, 실시간 업데이트, 결제 처리와 같은 복잡한 기능을 처리하며, 자체적으로 오류를 수정하여 자동으로 복구합니다.

성과

Claude의 역량에힘입어 마지막에 소비자 시장을 공략한 것은 모든 것을 바꿔놓았습니다. Emergent는 6월 초에 상용화를 시작했습니다. 그리고 4개월 후, 200만 명 이상의 사용자와 플랫폼을 통해 출시된 수천 개의 실제 비즈니스를 기반으로 ARR 2천 5백만 달러를 달성했습니다.

기존에 프리랜서가 2주 걸리던 프로젝트를 이제 2시간 만에 구축합니다. 기술 통합 같은 경우에는 초기 설정에 2일, 프롬프트를 완전 최적화하는 데 1주, Claude의 기능을 중심으로 전체 에이전트 아키텍처를 재구성하는 데 2주가 소요되었습니다.

향후 Emergent는 단기적으로 모바일 및 데스크톱 애플리케이션 기능을 개발할 예정입니다. 중기 프로젝트로는 사용자가 구두로 애플리케이션을 설명하면 Emergent가 실시간으로 개발하는 음성 코딩과, 사용자가 문제를 가리키면 에이전트가 수정하는 화면 공유 기능이 있습니다.

이 회사는 Anthropic과 프로덕션 성능 벤치마킹, 멀티 에이전트 오케스트레이션 패턴, 긴 컨텍스트 최적화, 실제 환경 안정성 지표에 대해 협력하고 있습니다. Emergent의 테스트 및 평가 데이터는 Anthropic이 프로덕션 애플리케이션을 이해하는 데 도움을 주며, 모델 개선은 플랫폼의 기능을 직접적으로 향상시킵니다.

Jha는 "저희의 공동 목표는 기술적 배경과 관계없이 필요한 것을 설명할 수 있는 사람이라면 누구나 소프트웨어를 개발할 수 있도록 하는 것입니다"라고 말했습니다.

‍

"우리는 계속 Claude를 제한하려 했습니다. 그러다 깨달았습니다. Claude는 제약이 적을수록 성능이 뛰어나다는 것을 말이죠."

Mukund Jha

CEO 겸 공동 창업자, Emergent

Video caption