더 읽어보세요
FutureHouse는 연구 자동화를 추진하는 비영리 기관으로, Claude를 활용하여 과학자들이 복잡한 문헌을 탐색하고, 가설을 세우며, 생물학적 발견의 속도를 가속화할 수 있도록 지원하는 정교한 AI 에이전트 생태계를 구동합니다.
Claude를 통해 FutureHouse가 달성한 성과:
FutureHouse의 창립자 Andrew White와 Sam Rodriques는 생물학 연구에서 정보 과부하 위기를 직접 경험했습니다. 과학자로서 그들은 논문을 읽는 데 몇 시간을 할애하거나, 실험실 작업에 집중하면서 중요한 최신 연구를 놓친다는 어느 쪽도 선택할 수 없는 상황에 직면했습니다. 생물학적 기술이 기하급수적으로 더 많은 데이터를 생성하고 출판량이 급증하면서 이 과제는 더욱 심화되었습니다.
공동 창립자 겸 CEO인 Sam Rodriques는 "과학적 문제에 접근할 때 고려해야 할 문헌의 양은 방대합니다. 설령 생물학이 어떻게 작동하는지 이해하는 데 필요한 모든 정보를 가지고 있더라도, 그 모든 과학 문헌을 읽고 종합할 충분한 시간이 있는 사람은 없기 때문에 그 사실을 알지 못할 수도 있죠"라고 말했습니다.
이러한 병목 현상은 실질적인 결과를 초래합니다. 대학원생들은 수개월간의 문헌 검토로 연구가 지연되고, 신약 개발팀은 자신도 모르는 사이에 이미 실패한 접근법을 반복하며, 학제 간 획기적인 발견은 발견되지 않은 채로 남습니다. White와 Rodriques는 인간의 한계를 넘어 과학 지식 처리 능력을 확장할 수 있는 유일한 길은 AI뿐이라는 것을 인식하고, 이 장벽을 돌파하고자 FutureHouse를 설립했습니다.
FutureHouse는 자체 LAB-Bench 벤치마크 평가를 통해 수많은 AI 모델을 평가한 후, 과학 분야에서 요구하는 세 가지 핵심 역량을 갖춘 Claude를 선택했습니다. 첫째, Claude는 과학의 기본 요건인 불확실성 인식에 뛰어납니다. Skarlinski는 "Claude는 매우 분별력 있는 모델입니다. 증거가 불충분할 때 환각을 일으키는 대신 이를 명확히 밝히며, 이는 분자 메커니즘이나 유전자 상호작용을 설명할 때 매우 중요합니다"라고 설명했습니다.
둘째, Claude의 맥락 이해는 연구의 질을 높입니다. Skarlinski는 "Claude 3.7은 오케스트레이션에 탁월한 모델입니다"라고 말하며, Claude가 인용 횟수와 저널의 권위 같은 중요한 메타데이터를 인지하면서 복잡한 과학 문헌을 처리하는 방식을 강조했습니다. 이러한 맥락적 추론은 다른 접근 방식에 비해 "최종 결과물을 크게 향상시킵니다."
셋째, Claude는 과학자들이 요구하는 투명성을 제공합니다. 연구자들이 FutureHouse의 플랫폼을 사용할 때, 특정 인용이 선택된 이유와 결론 추론 과정을 확인할 수 있어 과학적 연구가 요구하는 출처 신뢰성을 확보할 수 있습니다. 이러한 정밀성, 맥락적 이해, 투명한 추론의 조합 덕분에 Claude는 과학 에이전트를 구동하는 명확한 선택지가 되었습니다.
FutureHouse는 'Aviary'라는 정교한 오픈 소스 AI 에이전트 프레임워크를 개발했습니다. 새를 주제로 한 명명 관례에 따라 붙여진 이 이름은, FutureHouse에 딱 맞는 마스코트인 새에서 영감을 받았습니다. 새는 타고난 지능을 갖추고 있으며, 도구를 사용하는 능력으로 지능을 크게 증폭하는데, 이는 FutureHouse의 에이전트와 매우 흡사하기 때문입니다. 각 에이전트는 과학적 워크플로우의 다양한 측면을 담당하며, Claude가 생태계 전반의 추론 역량을 구동합니다.
현재 플랫폼 구성은 다음이과 같습니다.
Crow: 이 범용 에이전트는 문헌 검색과 정확한 답변에 특화되어 있습니다. 과학적 출처를 수집하고, Claude를 사용하여 증거를 평가하며, 특정 과학적 질문에 대해 학술적이고 인용이 포함된 응답을 생성합니다. 이 에이전트는 정보 수집에서 최종 답변 전달까지 체계적인 워크플로우를 따릅니다.
Falcon: 심층 분석과 보고서 생성을 위해 설계된 Falcon은 OpenTargets와 같은 여러 전문 과학 데이터베이스에 접근할 수 있으며, 포괄적이고 구조화된 문서를 작성할 수 있습니다. 연구자가 철저한 문헌 검토나 고수준 종합 분이 필요할 때, Falcon은 초록과 결론이 포함된 완전한 보고서를 제공하며, 이는 새로운 영역을 탐구하는 연구자들에게 특히 유용합니다.
Phoenix(실험 단4): 이 전문화된 에이전트는 이전 ChemCrow 프로젝트를 기반으로 화학 정보학을 처리합니다. 화학 데이터베이스와 연결되어 분자 예측과 합성을 지원하면서, 분자가 무독성이고 생산 가능한지 확인하는 안전 도구를 통합합니다. 이 역량은 신약 발견과 재료 연구에 필수적입니다.
Owl: 신규성 평가에 초점을 맞춘 Owl(이전 명칭 'Has Anyone')은 연구 아이디어에 선례가 있는지 판단합니다. Skarlinski는 "Owl은 재현율을 강조하여, 여러 분야에 걸쳐 검색하여 사용자의 가설이 진정으로 새로운 것인지 판단합니다"라고 설명했습니다. 이는 연구자가 기존 연구를 중복하는 것을 방지하면서 혁신적인 접근 방식을 식별하는 데 도움을 줍니다.
이러한 에이전트는 과학 도구와의 상호작용을 조정하고 복잡한 연구 워크플로우를 관리하는 FutureHouse의 오픈 소스 'Aviary' 환경 내에서 작동합니다.
FutureHouse의 Claude 기반 에이전트는 과학 연구의 본질적으로 비선형적인 특성을 해결합니다. Skarlinski는 "과학에서 많은 문제, 특히 문헌이나 많은 데이터 소스를 사용하는 작업은 비선형적입니다. 질문에 답하기 위해 하위 가설을 생각하고, 해당 정보의 질을 확인한 다음, 이를 평가하고 다른 검색을 수행해야 할 수도 있습니다. 이 프로세스는 본질적으로 에이전틱합니다. 선형 워크플로우로는 불가능하죠"라고 설명했습니다.
FutureHouse는 통제된 연구를 통해 이러한 이점을 정량화했으며, 에이전틱 단계를 제거하면 전체 에이전트 시스템에 비해 "질문에 대한 답변 정확도가 통계적으로 유의미하게 감소한다"는 것을 입증했습니다. 연구자들에게 이는 실질적인 혜택으로 이어집니다. 수개월 걸리던 문헌 검토를 며칠 만에 완료하고, 신약 발견팀은 전례 없는 효율성으로 유망한 후보 물질을 식별할 수 있게 된 것니다.
에이전트는 추론 과정을 설명하여 투명성을 제공하며, 과학자들이 실험 경로에 대해 정보에 기반한 결정을 내릴 수 있도록 합니다. Skarlinski는 "저희 에이전트는 방대한 양의 데이터를 처리할 뿐만 아니라 추론 과정도 설명하는 차세대 검색 도구처럼 기능합니다"라고 말했습니다. 정보 집약적인 작업을 자동화함으로써 FutureHouse는 연구자들이 창의적인 가설 생성에 집중할 수 있도록 하며, 궁극적으로 생물 과학 전반의 발견을 가속화합니다.
FutureHouse는 이제 문헌 분석을 넘어 통합 과학 워크플로우를 구축하고 있습니다. Skarlinski는 "저희의 다음 과제는 실험 데이터가 생성되는 대로 가져와 에이전틱 루프의 일부로 분석하는 것입니다"라고 설명했습니다. 이 비전에는 실험 결과에 기반해 코드를 생성하고, 데이터를 시각화하며, 가설을 다듬는 과정을 자동화는 것이 포함됩니다.
이러한 확장에는 특히 과학 그래프를 이해하고 실험 데이터를 처리할 고급 멀티모달 AI 역량이 필요합니다. FutureHouse는 개인 연구자를 위해 사용량 제한이 있는 플랫폼을 공개적으로 이용할 수 있게 하여, 전 세계 과학자들가 이러한 강력한 도구를 사용할 수 있도록 민주화할 계획입니다.
Skarlinski는 "AI가 소프트웨어 엔지니어링 생산성을 혁신한 것처럼, 이러한 에이전트는 과학이 수행되는 방식을 근본적으로 변화시킬 것입니다. 일상적인 정보 처리를 자동화함으로써 과학자들이 연구의 창의적인 측면, 즉 새로운 실험 설계와 인류 지식의 발전에 집중할 수 있도록 합니다"라고 결론지었습니다.