자세히 보기
최신 엔드투엔드 개발자 플랫폼인 Graphite는 Claude를 활용해 버그를 포착하고 수정 사항을 제안하는 AI 코드 리뷰어를 구동하며, Snowflake, Asana, Ramp 등의 기업에서 엔지니어링팀의 소프트웨어 개발 접근 방식을 혁신하고 있습니다.
Claude를 통해 Graphite는 다음과 같은 성과를 달성했습니다:
코드 리뷰는 현대 소프트웨어 개발의 심각한 병목 지점입니다. Google, Facebook 같은 대형 테크 기업은 이를 위한 정교한 사내 도구를 갖추고 있지만, 대부분의 엔지니어링팀에게는 기본적인 GitHub 워크플로우조차 버거운 상황입니다. Graphite의 공동 창업자인 Tomas Reimers는 "개발 도구 업계의 공공연한 비밀은 거의 모든 회사가 팀의 생산성을 높이기 위해 GitHub를 기반으로 자체 도구를 구축한다는 것입니다"라고 말했습니다.
적절한 도구 없이는 개발자의 업무 지연이 눈덩이처럼 불어날 수밖에 없습니다. 개발자들은 피드백을 받기까지 몇 시간에서 며칠을 기다린 뒤, 다시 긴 수정과 재검토의 사이클을 반복합니다. 2023년 초, Graphite는 앞을 내다보는 개발팀들의 거듭된 요청을 받아 AI 기반 코드 리뷰 도입을 모색하기 시작했습니다. 하지만 초기 시도는 실망스러운 결과로 돌아왔습니다. "모델은 환각을 일으켜 풀 리퀘스트에서 존재하지 않는 문제를 자신 있게 주장하곤 했습니다"라고 Reimers는 말했습니다. 봇이 구체적이지만 부정확한 코멘트를 달았을 때, 사용자들의 불만이 컸습니다." 팀에게는 높은 정확도를 유지하면서도 사람 수준으로 코드를 이해할 수 있는 솔루션이 필요했습니다.
주요 AI 모델을 테스트한 결과, Graphite는 Claude만이 자사의 코드 리뷰 기준을 충족하는 유일한 모델임을 확인했습니다. 팀은 500개의 풀 리퀘스트를 기준으로 엄격한 평가를 진행했습니다. 여기에는 실제 사례와 가상 시나리오가 포함되었으며, 숙련된 엔지니어조차 발견하기 어려운 버그도 포함되었습니다. "Claude는 코드 이해력이 특히 뛰어났는데, 이는 코드 리뷰에서 무엇보다 중요한 요소입니다"라고 Graphite의 리드 AI 엔지니어인 Alyssa Baum은 말했습니다.
Claude 3.5 Sonnet의 출시는 결정적인 돌파구가 되었습니다. Baum은 "우리의 평가 성능이 급격히 향상되었을 뿐만 아니라, 인지하지 못했던 테스트 데이터셋의 버그까지 찾아냈습니다"라고 말했습니다. A/B 테스트를 통해 팀은 Claude의 탁월한 성능을 확인했습니다. "Claude 3.5가 출시되었을 때, 우리는 이를 시스템에 연결했고, 사용자를 위한 성능은 놀라웠습니다."
Anthropic과의 파트너십은 이러한 기술적 우위를 더욱 확대시켰습니다. Anthropic의 팀은 Slack 전용 채널을 통해 평가 프레임워크와 구현 전략에 대한 중요한 지침을 제공했습니다. Graphite의 2024년 10월 출시 후 예상을 뛰어넘는 수요가 몰리자, Anthropic은 고객 needs를 충족할 수 있도록 신속하게 요청 한도 확장을 지원했습니다. Reimers는 "Anthropic 팀의 지원이 매우 든든했습니다"라고 말했습니다. "평가 방식과 코드 전반의 구조를 어떻게 잡아야 할지 조언을 구할 수 있다는 것만으로도 큰 도움이 되었습니다."
Graphite의 구현 방식은 Claude의 정교한 추론 능력과 효과적인 코드 리뷰에 대한 깊은 전문성을 결합합니다. 이 아키텍처는 복잡한 코드 분석을 개별 단계로 세분화하여 Claude가 각 작업에서 최적의 성능을 발휘할 수 있도록 합니다. 이 시스템은 투표, 추론 체인, 자체 비판을 포함한 여러 검증 레이어를 활용해 고품질 코멘트만 개발자에게 전달되도록 보장합니다.
이 플랫폼은 주관적인 제안이 아닌 객관적인 버그 식별에 집중합니다. 다음과 같은 문제를 해결합니다:
문제가 감지되면 시스템이 수정 제안을 자동으로 생성하여 개발자가 클릭 한 번으로 적용할 수 있으며, 이를 통해 기존의 수정 및 재검토 사이클을 단축합니다.


Graphite의 AI 기반 접근 방식은 고객사의 개발 워크플로우를 혁신했습니다. The Browser Company의 Brian Michel은 "Graphite Reviewer는 문제를 짚어주면서도 불필요하게 걸리는 것이 없는 적절한 균형을 유지합니다. 실제로 작동한다는 점이 다른 AI 도구와의 차별점입니다. 더 빠르게 개선을 반복하고, 실용적인 결과물을 더 빠르게 만들어낼 수 있습니다. 혼자 작업하는 개발자에게도 큰 힘이 됩니다. 더 이상 혼자가 아니니까요."
그 영향력은 개발자 개인을 넘어 전체 엔지니어링 조직으로 확장됩니다. Ramp의 엔지니어링 책임자인 Nik Koblov는 "Graphite는 Ramp 팀에 있어 게임 체인저였습니다"라고 말했습니다. "AI 리뷰어의 자동 코멘트 덕분에 사소한 오류가 버그로 이어지기 전에 잡아낼 수 있어, 개발 속도를 늦추지 않고도 코드 품질을 유지할 수 있습니다. 전반적으로 Graphite 덕분에 우리의 워크플로우가 한층 원활하고 생산적으로 개선되었습니다."
이처럼 속도와 품질을 동시에 잡는 강점은 Graphite 고객사 전반에서 높은 호응을 얻고 있습니다. Notion의 Ben Kraft는 "Graphite Reviewer는 놀라울 정도로 정확한 인사이트를 제공합니다. 고객에게 전달되기 전에 이미 여러 실제 버그를 잡아냈으며, 개발자 워크플로우에 실질적인 가치를 더해줍니다"라고 말했습니다.
현재 이 시스템은 풀 리퀘스트 5건 중 1건에 실질적인 피드백을 제공하고 있으며, 3건 중 1건에 사람의 코멘트가 달리는 업계 표준에 빠르게 근접하고 있습니다. AI 제안의 67%가 실제 코드 변경으로 이어지고 긍정적 피드백 비율이 96%에 달하는 가운데, Graphite는 AI가 기계의 속도로 인간 수준의 코드 리뷰 품질을 구현할 수 있음을 입증하고 있습니다.
Graphite는 향후 10년간 소프트웨어 개발의 근본적인 변화를 전망하고 있습니다. Reimers는 "Graphite에서 우리의 생각은 이렇습니다. 10년 후에는 개인이 직접 소프트웨어를 작성하는 시대가 끝날 것입니다. LLM이 코드의 대부분을 작성하고, 제품을 외부 세계와 연결하는 인간이 이를 이끌거나 협업하는 방식으로 전환될 것입니다."
Anthropic과의 파트너십을 바탕으로 Graphite는 이러한 변화의 최전선에 서 있습니다. Graphite는 시간이 많이 소요되는 리뷰 자동화, 미묘한 버그 감지, 원클릭 수정 적용을 통해 개발자가 인간만이 할 수 있는 일, 즉 소프트웨어의 미래를 결정짓는 고수준 아키텍처 의사결정에 집중할 수 있도록 합니다. Graphite와 Claude는 코드 리뷰를 개발의 병목 지점에서 인간의 창의성과 엔지니어링 역량을 끌어올리는 가속제로 탈바꿈시키고 있습니다.