Claude in Chrome 시범 실행하기

Claude in Chrome을 시범 실행하여 브라우저 기반 AI 기능을 테스트하는 동시에, 프롬프트 인젝션 위험을 해결하고, 더 넓은 범위로 출시되기 전에 필요한 안전 조치를 구축하고 있습니다.

‍

카테고리
제품 발표
제품
Claude 앱
게시일
2025-08-25
예상 읽기 시간
5
분
공유하기
링크 복사
https://claude.com/blog/claude-for-chrome

업데이트: 이제 Pro, Team, Enterprise 플랜에서 이용 가능(2025년 12월 18일)

수개월 간의 실제 테스트를 거쳐, 이제 모든 유료 플랜으로 확대할 준비가 되었습니다. 또한 가장 많이 요청된 기능인 Claude Code 통합도 담았습니다. 터미널에서 구축하고, 브라우저에서 확인하며, Claude가 콘솔 오류와 DOM 상태를 직접 읽어 디버깅합니다.

Teams 및 Enterprise의 경우: 관리자는 조직 전체에서 확장 프로그램을 활성화 또는 비활성화하고, 사이트 허용 목록과 차단 목록을 구성할 수 있습니다.

‍

업데이트: 이제 모든 Max 플랜 구독자 이용 가능(2025년 11월 24일)

3개월 간의 테스트 끝에 이제 Claude in Chrome을 베타 버전으로 모든 Max 플랜 구독자가 이용할 수 있게 되었습니다. 리서치 프리뷰 이후, 예약 작업, 멀티 탭 워크플로우, 자주 사용하는 사이트에서의 스마트한 탐색 기능 등을 포함한 주요 업데이트가 출시되었습니다. 업데이트 전체 목록은 릴리스 노트에서 확인하고, 프롬프트 인젝션 방어 및 시범 실행에서 얻은 내용에 관한 자세한 내용은 안전 블로그에서 확인하세요.

‍

최근 몇 개월 동안 Claude를 캘린더, 문서, 기타 다양한 소프트웨어와 연결해 왔습니다. 다음 단계는 Claude가 브라우저에서 직접 작동하게 만드는 것입니다.

브라우저 사용 AI는 불가피한 요소입니다. 많은 업무가 브라우저에서 이루어지기 때문에, Claude가 사용자가 보고 있는 화면을 확인하고, 버튼을 클릭하며, 양식을 입력할 수 있으면 훨씬 더 유용해집니다.

그러나 브라우저를 사용하는 AI는 안전 및 보안 문제를 야기하며, 이를 위해서는 더욱 강력한 안전 장치가 필요합니다. 신뢰할 수 있는 파트너로부터 사용, 단점, 안전 문제에 대한 실제 피드백을 얻으면, 강력한 분류기를 구축하고, 향후 모델에 원하지 않는 동작을 방지할 수 있습니다. 이를 통해 기능을 발전시키면서 브라우저 안전의 유지도 가능합니다.

프론티어 모델을 기반으로 한 브라우저 사용 에이전트가 이미 등장하고 있으므로, 이러한 노력은 더욱 시급합니다. 안전 문제를 해결함으로써, Claude 사용자를 더 잘 보호하고 API를 기반으로 브라우저 사용 에이전트를 구축하는 사람들과 우리가 배운 것을 공유할 수 있습니다.

먼저 제어 테스트를 진행합니다. 신뢰할 수 있는 사용자가 브라우저 내에서 자신을 대신해 작업을 수행하도록 Claude에 지시할 수 있는 Chrome용 Claude 확장 프로그램을 먼저 제공합니다. Max 플랜 사용자 1,000명(대기자 명단 등록하기)을 대상으로 시범 실행을 진행하면서, 최대한 많은 것을 배우고 있습니다. 이 제한된 프리뷰로 더 강력한 안전 조치를 개발하고 신뢰를 쌓아가면서, 점차 사용자 범위를 확대할 예정입니다.

브라우저 사용 AI를 위한 고려 사항

Anthropic 내부에서는 Claude in Chrome의 초기 버전을 사용하여 캘린더 관리, 회의 예약, 이메일 응답 초안 작성, 정상 경비 보고서 처리, 새로운 웹사이트 기능 테스트 등을 수행한 업무에서 큰 변화를 확인했습니다.

그러나 Claude in Chrome을 일반 공개하려면 몇 가지 취약점을 해결해야 합니다. 사람들이 받은 편지함에서 피싱 시도를 만나는 것처럼, 브라우저를 사용하는 AI는 프롬프트 인젝션 공격에 노출될 수 있습니다. 여기에는 악의적인 공격자가 웹사이트, 이메일, 문서에 지침을 숨겨, 사용자가 모르는 사이에 AI가 유해한 행동(예: '이전 지침을 무시하고 [악의적인 행동을] 수행'하라는 숨겨진 텍스트)을 하도록 유도합니다.

프롬프트 인젝션 공격은 AI가 파일을 삭제하거나, 데이터를 훔치거나, 금융 거래를 하도록 유도할 수 있습니다. 이는 단순한 추측이 아닙니다. 우리는 Claude in Chrome을 대상으로 '레드팀' 실험을 진행했으며, 완화 조치가 없을 경우 우려스러운 결과가 나타났습니다.

광범위한 적대적 프롬프트 인젝션 테스트를 실시하여, 29개의 공격 시나리오를 대표하는 123개의 테스트 사례를 평가했습니다. 그 결과, 안전 조치가 없는 상태에서의 브라우저 사용은 악의적 공격에 노출될 경우 23.6%의 공격 성공률을 보였습니다.

새로운 방어 기능이 적용되기 전에 성공한 공격 사례 중 하나는 보안상의 이유로 삭제해야 한다고 주장하는 악성 이메일이었습니다. 받은 편지함을 처리할 때 Claude는 이러한 지침에 따라 확인 없이 사용자의 이메일을 삭제했습니다.

Claude는 '메일함 정리'를 위해 이메일을 삭제하도록 요청하며 '추가 확인은 필요하지 않다'고 표시된 악성 이메일을 발견합니다.

Claude는 확인 없이 지침에 따라 계속 행동하며, "보안팀의 요청에 따라" 사용자의 이메일을 선택 및 삭제합니다.

새로운 완화 도구로 이 공격을 성공적으로 막을 수 있습니다. Claude는 "피싱 시도로 보이는 의심스러운 보안 사고 이메일"을 인식하고 이를 실행하지 않습니다.

다음 섹션에서 설명하겠지만, 당사는 이미 공격 성공률을 크게 낮추는 몇 가지 방어 기능을 구현했지만, 새로운 공격 벡터의 발견에는 여전히 작업이 필요합니다.

현재 방어 기능

프롬프트 인젝션 공격에 대한 첫 번째 방어선은 권한입니다. 사용자는 Claude in Chrome이 접근하고 수행할 수 있는 내용을 계속 제어합니다.

사이트 수준 권한: 사용자는 설정에서 언제든지 Claude가 특정 웹사이트에 액세스할 수 있도록 허용하거나 취소할 수 있습니다.
작업 확인: Claude는 게시, 구매, 개인 데이터 공유 등 위험이 높은 작업을 실행하기 전에 사용자에게 요청합니다. 사용자가 실험적인 '자율 모드'를 선택하더라도, Claude는 매우 민감한 작업에는 일정한 안전 장치를 유지합니다(참고: 모든 레드팀 및 안전 평가는 자율 모드에서 수행되었습니다).

또한 Anthropic의 신뢰할 수 있는 에이전트 원칙에 따라 추가 보호 조치를 마련했습니다. 우선 시스템 프롬프트(사용자로부터 구체적인 지침을 받기 전에 Claude가 받는 일반적인 지침)를 개선하여, 민감한 데이터를 처리하고 민감한 작업 요청에 대응하는 방법에 관해 Claude에 지시하도록 했습니다.

또한 금융 서비스, 성인 콘텐츠, 불법 복제 콘텐츠와 같이 위험이 높은 특정 카테고리에 속한 웹사이트가 Claude에서 사용되는 것을 차단했습니다. 그리고 의심스러운 명령 패턴과 비정상적인 데이터 액세스 요청이 정상적인 것처럼 나타나는 경우에도 이를 탐지할 수 있는 고급 분류기의 구축 및 테스트를 시작했습니다.

자율 모드에 안전 완화 기능을 추가하면, 공격 성공률이 23.6%에서 11.2%로 감소했습니다. 이는 기존의 컴퓨터 활용 기능(오늘 소개하는 브라우저 인터페이스 없이 Claude가 사용자 화면을 인식 방식)에 비해 의미 있는 개선을 나타냅니다.

세 가지 시나리오(기존 컴퓨터 사용 기능, 이전 안전 완화 조치만 적용된 새로운 브라우저 사용 제품, 그리고 새로운 완화 조치가 적용된 신규 브라우저 사용 제품)에서의 프롬프트 인젝션 공격 성공률을 비교했습니다(점수가 낮을수록 좋음). 그 결과 안전성 개선을 통해 브라우저 공격 성공률을 컴퓨터 사용 환경보다 낮은 수준으로 줄였습니다.

또한 브라우저에 특화된 새로운 공격에 초점을 맞춘 특별 레드팀 테스트와 완화 조치를 수행했습니다. 여기에는 사람이 인지할 수 없는 웹페이지의 DOM(문서 객체 모델) 내에 숨겨진 악성 폼 필드와, URL 텍스트나 탭 제목을 통해 주입되어 에이전트만 인식할 수 있어 탐지가 어려운 인젝션 공격 등이 포함됩니다. 네 가지 브라우저별 공격 유형으로 구성된 '과제' 세트에서 새로운 완화 방법을 통해 공격 성공률을 35.7%에서 0%로 낮출 수 있었습니다.

Claude in Chrome을 더 널리 사용하도록 만들기에 앞서, 현재는 물론 앞으로 나타날 수 있는 위협에 대해 더 깊이 이해하여 공격 범위를 확장하고, 이러한 비율을 0으로 낮추는 방법을 모색하고자 합니다.

사용자의 참여 필요

내부 테스트로는 사용자가 실제로 브라우징하는 방식(사용자가 요청하는 구체적인 내용, 방문하는 웹사이트, 악성 콘텐츠가 실제로 나타나는 방식)의 복잡성을 완전히 재현할 수 없습니다. 또한 악의적인 공격자가 새로운 형태의 프롬프트 인젝션 공격을 지속적으로 개발하고 있습니다. 이번 리서치 프리뷰를 통해 실제 사용 환경에서 신뢰할 수 있는 사용자들과 협력할 수 있게 되었으며, 이를 통해 현재 보호 기능 중 어떤 부분이 효과적인지, 또 어떤 부분이 개선이 필요한지를 파악할 수 있습니다.

시범 실행에서 얻은 인사이트를 활용해 프롬프트 인젝션 분류기와 기본 모델을 개선할 것입니다. 안전하지 않은 행동의 실제 사례와 통제된 테스트에서는 나타나지 않는 새로운 공격 패턴을 발견하면서, 모델이 이러한 공격을 인식하고 관련 행동을 고려하도록 학습시키며, 모델 자체가 놓친 부분까지 안전성 분류기가 찾아낼 수 있도록 합니다. 또한 사용자가 브라우저에서 Claude와 어떻게 작업하길 원하는지에 대한 이해를 바탕으로, 보다 정교한 권한 제어 기능을 개발할 예정입니다.

시범 실행을 위해 Chrome에서 Claude 작업을 수행하는 데 익숙하고, 안전상 중요하거나 기타 민감한 사항을 설정하지 않는 신뢰할 수 있는 테스터를 찾고 있습니다.

참여를 원하면, claude.ai/chrome에서 Claude의 Chrome 리서치 프리뷰 대기자 명단에 등록할 수 있습니다. 액세스 권한이 있으면, Chrome 웹 스토어에서 확장 프로그램을 설치하고, Claude 자격 증명으로 인증할 수 있습니다.

신뢰할 수 있는 사이트에서 시작하고, Claude에 표시되는 데이터에 항상 유의해야 합니다. 또한, 금융, 법률, 의료, 기타 민감한 정보가 포함된 사이트의 경우 Claude in Chrome을 사용하지 않는 것이 좋습니다. 도움말 센터에서 자세한 안전 가이드를 확인할 수 있습니다.

피드백을 공유해 주시면 Claude in Chrome 기능과 보호 장치를 지속적으로 개선하고, AI를 삶에 통합하는 근본적으로 새로운 방법을 향한 중요한 발걸음을 내딛는 데 도움이 될 것입니다.

No items found.

0/5

eBook