コンセプトからコミットまで、Claude Code の動作を 1 つのシームレスなワークフローでご覧ください。


コンセプトからコミットまで、Claude Code の動作を 1 つのシームレスなワークフローでご覧ください。

コンセプトからコミットまで、Claude Code の動作を 1 つのシームレスなワークフローでご覧ください。

コンセプトからコミットまで、Claude Code の動作を 1 つのシームレスなワークフローでご覧ください。
Freedom Forever は、米国最大の住宅用太陽光発電設置業者であり、販売や許可から設計、設置、継続的な監視まで、太陽光発電設備のライフサイクル全体を担当しています。同社には、主に現場作業員と設置作業員を中心に 3,000 人の従業員と、50 人のソフトウェアおよび製品チームが在籍しています。
署名された契約書と屋根のソーラーパネルの間には、許可証の迷路があります。住宅用太陽光発電設備はすべて、電力会社や自治体に提出する必要があります。各自治体には、それぞれ独自の第三者ウェブサイト、フォーム、承認プロセスがあります。Freedom Forever は毎月約 5,000 件の個別の許可を処理しますが、各許可には検査連絡、受領確認、支払い要件、修正要求、承認通知など、複数のタッチポイントがあります。
許可チームはメールに溺れていました。何百もの公益事業会社が 1 日中更新情報を送信していますが、この量を手動で処理していたため、未処理分が増え続けました。メールの中には、顧客が途方に暮れて待っている間、何週間も未処理のままだったものもあり、見えない理由でプロジェクトが行き詰まりました。Freedom Forever の製品担当副社長である Rob Richardson 氏は、「インストールのタイムラインは私たちの最も重要な指標です」と述べています。「すべてのお客様がプロセス全体を通じて一貫した更新とサポートを受けられるように、システムとプロセスを強化しました」
同社は、より迅速な開発に向けた幅広い取り組みの一環として、少数の開発者グループ向けにAIコーディングアシスタントを実験していました。しかし、複雑なエージェントワークフロー、特に Cookie 同意ポップアップ、iframe、シャドー DOM 要素、マルチステップフォームを使用するサードパーティの許可サイトの Web 自動化には、既存のフレームワークが提供できるものよりも堅牢なものが必要でした。
Freedom Forever は、最も難しい問題である、第三者のウェブサイトでの許可申請の自動化を中心に、正式なベンチマークを構築しました。チームは、シンプルな単一ページのフォーム、複数ステップのワークフロー、Cookie の同意やポップアップなどのブロックインターフェイス、iframe、シャドウ DOM 要素など、現実世界の課題を再現した 8 つの内部模擬サイトを作成しました。サイトごとに 5 回反復して、各フレームワークが送信した内容と期待される結果を比較し、ビデオ録画で正確性を検証しました。
Richardson 氏は次のように述べています。「Claude Agent SDK はベンチマークで 97.5% のスコアを記録しました。それを破ることはできませんでした。「唯一の障害は、エージェントそのものではなく、何十ものエージェントを並行して実行したことによるレート制限の問題でした。他のフレームワークでは、コストが高くなると 20 ~ 60% に達しました」
チームは、他のエージェントフレームワークを使用してアプリケーションを構築するなど、代替案を模索していました。それぞれが限られたコンテキストでは有望でしたが、Claude Agent SDK が複雑なウェブ自動化ワークフローをすべて処理してくれました。パフォーマンスを超えて、SDK は最も簡単に構築できることが証明されました。ベンチマークの開発とテストには約 3 週間かかり、2 週間後に最初のプロダクションエージェントを立ち上げました。
Claude Agent SDKは、Freedom Forever のプロダクションワークフローの主要なエージェントフレームワークとして機能するようになりました。このシステムは、サードパーティの公益事業会社や自治体のウェブサイトでの許可申請を処理し、受信した許可メールをリアルタイムで処理し、カスタム CRM に接続してスケジューリング、タスク完了、ファイル分析、人的引き渡しを行います。単一の統一されたフレームワークがビジネス全体の自動化を促進します。
SDK は簡単に構築できました。コアエージェントループはほとんどカスタム作業を必要とせず、根本的な複雑さのほとんどをそのまま処理できました。Freedom Forever は、その上にワークフローを管理するための内部の「エージェントコンソール」を構築しましたが、その基盤はすぐにまとまりました。SDK が改善されるにつれて、自動的にメリットが得られます。Richardson 氏は次のように述べています。「構造化されたアウトプットが公開されたとき、私たちはカスタムの回避策を取り除き、そのまま有効にしました。このようなスピードは重要です」さらに、内部ツール、ベンチマーク、およびレポートインフラストラクチャの多くは、それ自体が Anthropic のエージェントコーディング用コマンドラインツールである Claude Code を使用して構築されました。
この許可メール処理エージェントは、同社で最も大量に導入されており、製造開始から最初の 1 か月で約 19,000 通のメールを処理し、数百の公益事業会社からの通信を処理しました。このシステムは、受信メッセージ (検査通信、受領確認、支払い要件、修正要求など) を分類し、関連データを抽出し、適切な措置を講じます。電子メールの約 71% は人手を介さずに完全に処理されており、引き渡しが必要な場合でも人的作業は大幅に削減されています。各実行のコストは 0.20 ~ 0.35 ドルで、約 2 分で完了します。これは人的処理の 2 ~ 5 倍も少なくて済みます。
しかし、本当の発見は、彼らがバックフィルを実行したときに起こりました。エージェントは、平均 3 週間未処理のまま放置されていたメールを発見しました。つまり、インストールを進めるための許可に関するアクションを待っている顧客が、数十人の顧客が行き詰まっていました。エージェントはこれらのケースを特定してプロジェクトを進め、チームが完全には把握していなかった未処理分を解消しました。Richardson 氏は次のように述べています。「インストールのタイムラインは私たちにとって最も重要な指標であり、これほど短期間で品質が向上したことはありません。Claude と私たちのエージェントシステムがそれに影響していることはわかっています」
「現在の主な制限は、より多くのワークフローを開放し、それぞれのワークフローを十分に深く掘り下げて、チームの負担を大幅に軽減することです」と Richardson 氏は言います。「制限は、私たちがより多くのツールや機能を構築することにあり、エージェントが調整して意思決定を行う能力にあるわけではありません」
Freedom Forever は Claude の役割を拡大し続けています。同社は最近、約 1,500 件の文書を処理するファイル検証エージェントを導入し、公共料金の請求書を社内のシステム要件と照らし合わせて検証しました。これらの文書には、メーター番号や過去の使用状況データがテキストではなくグラフで表示されることがよくあります。これらの情報は、従来の OCR では扱いにくいものです。アップロードされる写真の多くは、文書を手に持っている人の写真ですが、Claude はこれらを問題なく処理します。
「検証ルールにギャップがあるケースも見つかりました」と Richardson 氏は言います。「Web 検索を有効にすることで、エージェントは不足している情報を入力してより深い検証を行い、その学習内容をナレッジベースにコミットして、今後の運用をさらに効率化できるようになりました」
同社は最近、セールスサポートエージェントを別のフレームワークから Claude Agent SDK に移行しました。このシステムはインバウンドサポートラインとして機能し、10,000 人以上の営業担当者が電話やテキストメッセージでパイプラインを理解したり、会社のプロセスをナビゲートしたり、社内システムとやり取りしたりできます。
彼らが SDK の上に構築した内部エージェントコンソールは、チーム全体のプラットフォームとして機能するようになりました。SDK レイヤーで直接作業する開発者はほんの一握りですが、UI を使用してスキルやワークフローを設定する開発者は多くいます。「Claude Agent SDK を真っ先に検討します」と Richardson 氏は言います。「私たちはこれを私たちの多くの仕事の未来と捉えており、深く組み込まれたいと考えています」