Read more
Matillion est une plateforme d’intégration de données qui aide les équipes data à construire et gérer des pipelines pour l’IA et l’analyse. Des milliers d’entreprises, dont Cisco, London Stock Exchange Group et Slack, utilisent Matillion pour les analyses, l’analyse opérationnelle et les applications de machine learning.
Avec Claude, Matillion :
Matillion a choisi Claude après 18 mois de tests auprès de plusieurs fournisseurs de modèles. Leur cadre d’évaluation mesurait trois capacités critiques : la compréhension de langages propriétaires spécifiques au domaine, le raisonnement multi-étapes pour les opérations de données complexes et les décisions fiables d’appel d’outils. Claude a systématiquement surpassé les autres modèles sur toutes les métriques. Spécifiquement :
• Raisonnement et appel d’outils robustes : Claude a démontré une capacité sophistiquée à sélectionner les bons outils et à séquencer des opérations complexes, essentiel pour la gestion autonome de pipelines de données
• Fiabilité : Des performances stables d’une version de modèle à l’autre signifiaient que Matillion pouvait passer aux nouvelles versions de Claude sans réingénierie de toute leur architecture de prompts
• Aucun entraînement requis : Claude a compris immédiatement le langage propriétaire de pipeline de données (DPL) basé sur YAML de Matillion, malgré l’absence de données d’entraînement publiques
• Comportement cohérent : L’équipe a constaté qu’elle n’avait jamais à « lutter » contre le modèle pour obtenir les résultats souhaités
« La décision de choisir Claude était entièrement basée sur les données », explique Julian Wiffen, Chief of AI and Data Science chez Matillion. « Nous avons testé plusieurs modèles côte à côte, et Claude a systématiquement fourni les meilleurs résultats en termes de précision et de fiabilité. »
Les équipes d’ingénierie data peinent à suivre la demande. Les dirigeants demandant des tableaux de bord et les analystes ayant besoin de nouvelles sources de données attendent souvent des semaines ou des mois pour des requêtes simples. Ce problème est sur le point de s’aggraver ; l’adoption de l’IA générative augmente considérablement la charge sur des équipes data déjà sous tension qui doivent construire des pipelines alimentant les processus d’IA tout en gérant le flux de données que ces systèmes génèrent.
L’ingénierie data était devenue un goulot d’étranglement critique. Même les requêtes simples devaient traverser des backlogs de plusieurs mois, créant de la friction dans l’ensemble des organisations. Matillion a reconnu que les approches traditionnelles ne pouvaient pas s’adapter à la demande explosive de création et de maintenance de pipelines de données.
La transformation a commencé lorsque Matillion a découvert que son langage propriétaire de pipeline de données, conçu pour être lisible par l’homme, était également lisible par la machine. Alors qu’ils pensaient initialement que les LLM ne pourraient pas comprendre un langage sans données d’entraînement publiques, Claude leur a prouvé le contraire. Le modèle a démontré une compréhension sophistiquée de leur format basé sur YAML, respectant les instructions et générant des définitions de pipeline valides de manière cohérente.
Matillion a construit un cadre de test sophistiqué utilisant trois LLM de concert : l’un exécutant Maia, un autre jouant le rôle de testeur, et un troisième agissant comme juge pour vérifier les résultats. Ce cadre leur a permis de mesurer les performances de manière tangible : en suivant le temps écoulé, la précision de sélection des outils et la consommation de jetons à travers des ensembles de scénarios.
L’évolution de la simple auto-documentation aux capacités agentiques complètes a pris deux ans, mais les résultats justifient l’investissement. Maia peut désormais accéder à la quasi-totalité des fonctionnalités du Data Productivity Cloud via des appels d’outils, exécutant des opérations qui défient même les ingénieurs data experts.
« Maia gère tout, des migrations ETL héritées à la construction de pipelines prêts pour la production à la vitesse de la machine, avec une qualité logique à laquelle nous pouvons faire confiance », a déclaré Ammad Baig, Director of Enterprise Data & AI Services chez Precision Medicine Group, l’un des clients de Matillion. « Cela accélère fondamentalement notre flux de travail tout en réduisant les efforts manuels. »
Depuis la disponibilité générale de Maia en juin, les clients constatent des changements significatifs dans leur manière de travailler. Les équipes livrent davantage avec leurs ressources existantes, les analystes pouvant désormais se servir eux-mêmes d’une infrastructure de données qui nécessitait auparavant une expertise d’ingénierie spécialisée. Un client a rationalisé ses opérations data, sa petite équipe étant désormais capable de livrer l’ensemble de sa stratégie data, atteignant une productivité qui aurait autrement nécessité des ressources considérablement élargies.
L’impact s’étend au-delà des clients externes. Quatre-vingts pour cent des développeurs de Matillion ont adopté Claude Code, rapportant une réduction moyenne de 41 % du temps consacré aux pull requests d’après des enquêtes internes. Cela crée un effet multiplicateur : les développeurs juniors traitent des tâches qui revenaient auparavant aux seniors, tandis que les développeurs seniors s’attaquent à des travaux que seuls les leads techniques vétérans pouvaient gérer avant.
Pour l’avenir, Matillion prévoit d’étendre les capacités de Maia pour capturer les informations sémantiques des catalogues de données, des pipelines existants et de la documentation. L’objectif est de donner à Maia une expertise de domaine sur le paysage de données unique et la terminologie métier de chaque client, comprenant non seulement qu’il existe des champs de revenus dans une base de données, mais lesquels représentent la véritable source de référence pour des contextes métier spécifiques.
« Capturer ces types de détails sémantiques et permettre à Maia de les utiliser efficacement est notre prochain défi », explique Julian. « Les modèles d’Anthropic seront essentiels pour cela. »