Emergent construit des agents de codage autonomes avec Claude

Essayer Claude
Contact commercial
Secteur d'activité :
Logiciels
Taille de l'entreprise :
Petite
Produit :
Claude Platform
Région :
Amérique du Nord
ARR de 25 M$
Atteint dans les 4,5 mois suivant le lancement commercial
2 millions
D’utilisateurs peuvent créer des applications sans avoir de connaissances en codage

Read more
Suivant

Video caption
Suivant

Read more
Suivant

Video caption
Suivant

Précédent
Suivant

Emergent est une plateforme d'intelligence artificielle qui permet de créer des logiciels aussi simplement que d'avoir une conversation. L'entreprise a créé des agents de codage autonomes qui s'exécutent dans des environnements de développement basés sur le cloud, où ils écrivent du code, gèrent des bases de données, gèrent le déploiement et déboguent les problèmes sans intervention humaine.

Avec Claude, Emergent possède :

  • A atteint un ARR de 25 millions de dollars en 4,5 mois de lancement commercial
  • A permis à plus de 2 millions d'utilisateurs de créer des applications sans connaissances en matière de codage
  • Applications complètes générées avec en moyenne plus de 5 000 lignes de code
  • Systèmes multi-agents conçus dans lesquels des instances Claude spécialisées gèrent le frontend, le backend, les tests et le déploiement

Le problème

Emergent a entrepris de démocratiser la création de logiciels en supprimant le codage comme obstacle. Les clients de l'entreprise (fondateurs créant des MVP, chefs de produit créant des outils internes, experts du domaine développant des solutions industrielles et petites entreprises automatisant les opérations) paient généralement 25 à 50 dollars par mois pour créer des applications qui coûteraient traditionnellement plus de 50 000 dollars en frais de développement.

« Nous avons eu trois vies », explique Mukund Jha, PDG et cofondateur d'Emergent. L'entreprise a initialement développé un produit de test d'assurance qualité basé sur l'IA, avec des agents capables de naviguer dans les applications Web, de comprendre les interfaces et de vérifier les fonctionnalités. Puis, le premier jour de Y Combinator, ils ont eu une révélation : si leur IA pouvait comprendre les applications suffisamment bien pour les tester, pourquoi ne pas les créer ?

Ils ont immédiatement pivoté. La version 2 était un agent de codage d'entreprise qui a dépassé les critères de référence SWE et a battu les scores de Devin. Mais le feedback a été ralenti et a pris plusieurs mois en raison des cycles de vente des entreprises. En janvier, ils ont de nouveau pivoté, cette fois en faveur des consommateurs, en regroupant leur agent sur une plateforme Web sur laquelle tout le monde pouvait commencer à créer immédiatement.

Ils ont toutefois dû faire face à trois défis techniques critiques. Les modèles oubliaient les instructions au cours de la même session, spécifiant les exigences de formatage pour les ignorer quelques minutes plus tard. Ils écrivaient du code partiel avec des commentaires tels que « le reste reste le même », rendant la sortie inutilisable pour le développement réel. Plus problématique encore, les agents devaient exécuter des centaines de commandes de terminal, mais les modèles ne parvenaient toujours pas à maintenir une syntaxe et un ordre de paramètres corrects.

Claude permet des flux de développement autonomes complets

Emergent a tout testé — des modèles propriétaires de premier plan, des options open source, etc. Claude s'est révélé nettement supérieur dans les domaines les plus importants.

Les instructions données une fois sont restées cohérentes tout au long des projets. L'exécution des commandes s'est révélée très précise en termes de syntaxe d'appel d'outils et de flux de travail en plusieurs étapes. Le modèle a généré de manière cohérente des fichiers de code complets de plus de 500 lignes sans troncature.

« L'intégration de l'API a été simple : nous l'avons mise en production en deux jours », explique Jha.

Emergent déploie Claude tout au long du cycle de développement

Claude alimente cinq fonctions principales de la plateforme d'Emergent. Pour la génération de code, il produit des applications complètes comptant en moyenne plus de 5 000 lignes sur des backends Python, des frontends JavaScript et des schémas de base de données. Différentes instances de Claude gèrent des tâches spécialisées dans l'orchestration multi-agents : l'une gère le travail frontend, une autre gère la logique du backend, une troisième se concentre sur les tests et une quatrième gère le déploiement.

Pour un débogage autonome, Claude analyse les traces de pile, identifie les causes premières et met en œuvre des correctifs sans intervention humaine. Il utilise des capacités de vision pour vérifier la fonctionnalité de l'interface utilisateur par le biais de tests visuels. Claude prend également des décisions en matière d'architecture, en sélectionnant les piles technologiques appropriées et en mettant en œuvre des modèles de conception.

« Le plus grand défi a été d'apprendre à lui faire confiance », explique Jha. « Nous voulions contraindre Claude, ajouter des limites,  restreindre ses capacités. Puis nous nous sommes rendu compte que Claude est plus performant lorsqu'il a plus de libertés, pas moins. Nous lui avons donc donné un accès complet aux machines virtuelles. C'est là que la magie a opéré. »

Cette approche a permis de débloquer des capacités jusqu'alors impossibles. Les projets peuvent désormais mener à bien des flux de travail de plus de 100 étapes, contre 10 à 15 auparavant. Les agents génèrent des bases de code de plus de 5 000 lignes sans intervention humaine et créent des applications full-stack avec des architectures frontend et backend distinctes. Ils gèrent des fonctionnalités complexes telles que les WebSockets, les mises à jour en temps réel et le traitement des paiements, tout en corrigeant automatiquement leurs propres erreurs.

Le résultat

Le dernier virage vers les consommateurs, alimenté par les capacités de Claude, a tout changé. Emergent a été commercialisé début juin. Quatre mois plus tard, la société a atteint un ARR de 25 millions de dollars, avec plus de 2 millions d'utilisateurs et des milliers de véritables entreprises lancées via la plateforme.

Des projets qui auraient pris deux semaines à un travailleur indépendant sont désormais réalisés en deux heures. L'intégration technique a nécessité deux jours pour la configuration initiale, une semaine pour optimiser pleinement les requêtes et deux semaines pour restructurer l'ensemble de l'architecture de l'agent autour des capacités de Claude.

Pour l'avenir, Emergent développe à court terme des capacités pour les applications mobiles et de bureau. Les projets à moyen terme incluent le codage vocal, qui permet aux utilisateurs de décrire verbalement les applications pendant qu'Emergent les construit en temps réel, et une fonctionnalité de partage d'écran qui permet aux utilisateurs de signaler les problèmes à l'agent afin qu'il les résolve.

La société collabore avec Anthropic sur l'analyse comparative des performances de production, les modèles d'orchestration multi-agents, l'optimisation du contexte à long terme et les mesures de fiabilité réelles. Les données de test et d'évaluation d'Emergent aident Anthropic à comprendre les applications de production, tandis que les améliorations apportées aux modèles améliorent directement les capacités de la plateforme.

« Notre objectif commun est de rendre le développement de logiciels accessible à toute personne capable de décrire ses besoins, quel que soit son niveau technique », a déclaré Jha.

« Nous voulions contraindre Claude, ajouter des limites, restreindre ses capacités. Puis nous nous sommes rendu compte que Claude est plus performant lorsqu'il a plus de libertés, pas moins.»
Mukund Jha
PDG et cofondateur, Emergent

Suivant

Video caption
Suivant

Prev
Suivant