자세히 보기
.jpg)
We’re upgrading our smartest model. The new Claude Opus 4.6 improves on its predecessor’s coding skills. It plans more carefully, sustains agentic tasks for longer, and features a 1M token context window.
We’re upgrading our smartest model. The new Claude Opus 4.6 improves on its predecessor’s coding skills. It plans more carefully, sustains agentic tasks for longer, and features a 1M token context window.
We’re upgrading our smartest model. The new Claude Opus 4.6 improves on its predecessor’s coding skills. It plans more carefully, sustains agentic tasks for longer, and features a 1M token context window.
Athena Intelligence는 AI 네이티브 워크스페이스와 자율 에이전트를 연결해 지식 노동에서 반복적이고 시간이 많이 소요되는 부분을 처리하는 스타트업입니다. 이 회사는 Fortune 500 기업, 법률 회사, 금융 서비스 조직, 의료 시스템, 정부 기관을 대상으로 서비스를 제공하고 있습니다. Claude는 플랫폼에서 자율 작업의 대다수를 구동합니다.
규제 업계 전반에서 Athena의 고객은 일련의 공통적인 문제를 공유하고 있습니다. 분석가들은 전략적 분석이 아닌 가치가 낮은 반복적인 업무에 대부분의 시간을 할애하고 있습니다. 엔터프라이즈 데이터는 수십 개의 시스템에 걸쳐 존재하며, 이를 종합하려면 엄청난 수작업이 필요합니다. 또한 이 데이터는 거의 정리되지 않습니다. 제대로 문서화가 되지 않은 시스템, 레거시 형식, 상충되는 출처는 일반적입니다.
기존의 엔터프라이즈 AI 배포는 실제 운영까지 6~12개월이 소요되며, 규제 산업은 모든 단계에서 정확성, 투명성, 감사 가능성을 요구합니다. Athena Intelligence의 창립자 겸 CEO인 Brendon Geils는 말합니다. "우리는 모호한 상황에서 추론하고, 복잡한 지침을 따르며, 긴 워크플로우에서 품질을 유지하며, 엄격한 규정 준수 프레임워크 내에서 추론을 설명할 수 있는 모델이 필요했습니다. "그리고 Claude가 가장 적합했습니다."
Athena는 프로덕션에서 결정적인 역할을 입증한 역량을 바탕으로 핵심 인텔리전스 레이어로 Claude를 선택했습니다.
"Claude는 다른 모델이 이탈하거나 잘못된 정보를 생성하는 상황에서도, 복잡하고 상세한 여러 페이지의 지침을 안정적으로 실행합니다."라고 Geils는 말합니다. "이것이 바로 데모를 잘 수행하는 AI와 프로덕션에서 작동하는 AI의 차이점입니다." Athena 팀에 따르면 Claude가 수십 개의 의사 결정 지점과 수백 페이지의 컨텍스트가 포함된 워크플로우 전반에서 일관된 품질을 유지한 반면, 경쟁사는 복잡성이 증가할수록 성능이 저하되었습니다.
데이터가 완벽하지 않은 엔터프라이즈 환경에서 Claude의 판단이 그만큼 중요하다는 것이 입증된 것입니다. Geils는 Claude가 데이터 소스 충돌, 불완전한 정보, 명확화 요청 시기와 관련해 전문가 수준의 결정을 내리고, 각 단계에서 추론을 설명해 준다고 언급했습니다. 이는 감사, 규정 준수, 법무 업무에 매우 중요합니다. Geils는 말합니다. "책임감 있는 AI를 향한 Anthropic의 노력은 규제 대상 고객의 요구 사항에 부합하는 동시에, 규정 준수팀의 신뢰를 높입니다."
Claude는 모든 주요 Athena 워크플로우에서 핵심 인텔리전스 계층을 강화하며, 플랫폼의 진화는 Claude의 세대별 개선과 직접적으로 연결됩니다. Claude 3 시대에 Athena는 주로 코파일럿 역할을 수행했으며, 데이터 쿼리, 요약 초안 작성과 같은 개별 작업에 유용했지만, 다단계 워크플로우는 여전히 제대로 작동하지 않았습니다. Claude Sonnet 3.5에서는 지침 이행 능력이 충분히 향상되어 Athena는 일반 영어로 설명된 다단계 워크플로우를 안정적으로 실행할 수 있게 되었으며, 맞춤형 모델 훈련의 필요를 없앴습니다. Sonnet 4.5와 Opus 4.5를 통해 이 플랫폼은 엔드투엔드의 전문 워크플로우를 계획, 실행, 조정, 제공하기 시작했습니다. Sonnet 4.5는 자율 워크플로우의 대부분을 처리하는 반면, Opus 4.6은 다중 엔터티의 재무 모델링, 대규모 문서 세트에 대한 심층적인 법률 리서치, 높은 정밀도가 요구되는 규정 준수 워크플로우와 같은 어려운 문제를 맡습니다.
Athena는 모델별 통합 코드 없이 Claude의 API를 기반으로 구축되었습니다. 새 모델 버전은 구성 업데이트입니다. 테스트 스위트와 비교해 검증하고, 모델 포인터를 업데이트하며, 배포합니다. Sonnet 4.6이 출시되었을 때, 재교육, 프롬프팅 수정, 다운타임 없이 30분 이내에 Athena에서 실행 상태가 되었습니다. Geils는 말합니다. "Claude의 기본 지침 준수성이 충분해서 그 위에 취약한 미세 조정 레이어가 필요하지 않았기 때문에 가능했습니다."
Athena의 고객에게는 이전에 며칠이 걸렸던 작업이 이제 몇 시간이면 완료됩니다. 워크플로우는 자연어 시스템 프롬프트를 사용해 구성되므로, 비즈니스 사용자는 개발자 없이도 워크플로우를 설정 및 조정할 수 있습니다. Fortune 500 기업의 법무, HR, 재무팀은 경쟁 플랫폼에 수백만 달러를 투자했지만, 분산된 레거시 시스템에서 인사이트를 도출하지 못했습니다. Athena는 맞춤형 워크플로우 솔루션, 여러 부서 KPI 대시보드, CEO 생산성 에이전트를 4주 만에 배포하며, 구현까지 12개월 이상 소요되었던 경쟁 플랫폼을 대체했습니다. 에이전트는 이메일, 캘린더, CRM, 재무 보고 시스템을 동시에 활용해 경영진 브리핑을 매일 작성하며, 이 모든 것은 맞춤형 코드가 아닌 자연어 프롬프트를 통해 구성됩니다.
AmLaw 100 법률 회사에서 Claude는 이제 400개의 월간 급여 메모를 처음부터 끝까지 모두 생성 및 배포합니다. 이전 프로세스는 Excel 매크로, 개별 PDF, 그리고 2명이 검증 절차를 수행하는 보안 SharePoint 폴더에 수동으로 저장하는 과정이 포함되어, 매달 2~3일이 소요되었습니다. 이제 수작업 없이 야간에 실행됩니다.
한 글로벌 식음료 기업은 Athena를 찾았을 때, 사업부 이름이 바뀌고, 데이터베이스는 통합 중이며, 레거시 시스템에는 상충되는 기록이 가득한 상태였습니다. 이전 AI 플랫폼은 깔끔하고 일관된 데이터가 있어야 작동할 수 있었기 때문에 동일한 환경에서 실패했습니다. "작년에는 '먼저 데이터를 정리해야 합니다'라고 말하곤 했습니다"라고 Geils는 말합니다. "이제 에이전트는 지저분한 데이터를 처리하는 데 사람보다 더 뛰어납니다."
선도적인 글로벌 전문 서비스 기업은 8주 만에 여러 실무 영역에서 실제 운영을 시작했습니다. "Athena는 더 이상 도구가 아닙니다"라고 회사의 기술 리드는 말합니다. 이제 플랫폼 전반에서 Athena의 고객들은 매주 10,000개 이상의 자율 워크플로우를 실행하고 있습니다.
Geils는 AI가 "세계에서 가장 복잡한 조직에서도 강력하고, 신뢰할 수 있으며, 진정으로 유용할 수 있음"을 증명하는 것이 Athena의 목표라고 말합니다. "Claude의 모든 개선은 제품 로드맵을 가속화하고, 고객 성과를 개선하는 데 직접적으로 영향을 미칩니다."