Matillion reduziert mit Claude-gestütztem KI-Assistenten die Erstellung von Datenpipelines von 40 auf 1 Stunde

Claude ausprobieren
Sales kontaktieren
Branche:
Software
Unternehmensgröße: 
Groß
Produkt:
Claude Code
Standort:
Europa
41 % schnellere Pull-Request-Bearbeitung mit Claude Code
80 % der Entwickler bei Matillion nutzen Claude Code und berichten von einer durchschnittlichen Reduzierung der erforderlichen Zeit für Pull Requests um 41 %
40-mal schnellere Pipeline-Erstellung
Anspruchsvolle Datentransformationen, für die ein Kunde 40 Stunden brauchte, dauern mit Maia jetzt nur 1 Stunde
Wir stellen vor: Claude Code

Erleben Sie Claude Code in Aktion — vom Konzept bis zum Commit in einem nahtlosen Arbeitsablauf.

Weitere Informationen
Wir stellen vor: Claude Code
Next

Erleben Sie Claude Code in Aktion — vom Konzept bis zum Commit in einem nahtlosen Arbeitsablauf.

Video-Untertitel
Next
Wir stellen vor: Claude Code

Erleben Sie Claude Code in Aktion — vom Konzept bis zum Commit in einem nahtlosen Arbeitsablauf.

Weitere Informationen
Next

Video-Untertitel
Next

Vorherige
Next

Die Datenintegrationsplattform Matillion unterstützt Datenteams bei Aufbau und Verwaltung von Pipelines für KI und Analysen. Tausende Unternehmen, darunter Cisco, London Stock Exchange Group und Slack, nutzen Matillion für die Gewinnung von Erkenntnissen, operative Analysen und Anwendungen des maschinellen Lernens.

Mit Claude leistet Matillion Folgendes:


  • Erstellung von Datenpipelines durch natürliche Sprache: Der Nutzer beschreibt in einfachem Englisch, was er braucht, und Maia erstellt produktionsreife Pipelines.
  • Übersetzung alter Codebases: migriert bestehende ETL-Prozesse automatisch ohne manuelle Neuerstellung.
  • Autonome Datenoperationen: übernimmt alles von der Datenstichprobe bis hin zur Optimierung von Transformationen mit der Geschwindigkeit einer Maschine.
  • Self-Service für Nicht-Ingenieure: Business-Analysten können jetzt Dateninfrastrukturen aufbauen, die zuvor spezialisierte Expertise erforderten.
  • Wartung und Optimierung bestehender Pipelines: verbessert kontinuierlich die Leistung und passt sich an veränderte Anforderungen an.

Die Wahl des richtigen Foundation Models

Matillion entschied sich für Claude nach 18 Monate andauernden Tests mehrerer Modellanbieter. Der Evaluierungsrahmen maß drei kritische Fähigkeiten: Verständnis proprietärer, domänenspezifischer Sprachen, mehrstufiges Reasoning für komplexe Datenoperationen und zuverlässige Tool-Calling-Entscheidungen. Claude übertraf andere Modelle durchgehend bei allen Metriken. Die Bewertung im Einzelnen:

• Starkes Reasoning und Tool-Calling: Claude zeigte eine ausgefeilte Fähigkeit, die richtigen Tools auszuwählen und komplexe Operationen zu sequenzieren – entscheidend für das autonome Datenpipeline-Management.
• Zuverlässigkeit: Stabile Leistung über verschiedene Modellversionen hinweg, was bedeutet, dass Matillion auf neuere Claude-Releases upgraden konnte, ohne die gesamte Prompt-Architektur umzugestalten.
• Kein Training erforderlich: Claude verstand Matillions proprietäre, YAML-basierte Data Pipeline Language (DPL) sofort, obwohl keine öffentlichen Trainingsdaten vorhanden waren.
• Konsistentes Verhalten: Das Team stellte fest, dass die Nutzer nie gegen das Modell „ankämpfen“ mussten, um die gewünschten Ergebnisse zu erzielen.

„Die Entscheidung für Claude war vollständig datengetrieben“, erklärt Julian Wiffen, Chief of AI and Data Science bei Matillion. „Wir haben mehrere Modelle nebeneinander getestet, und Claude lieferte durchgängig die besten Ergebnisse sowohl bei Genauigkeit als auch bei Zuverlässigkeit.“

Die Herausforderung: Datenteams werden
von Arbeitsrückständen erdrückt

Data-Engineering-Teams haben Mühe, mit der Nachfrage Schritt zu halten. Führungskräfte, die Dashboards anfordern, und Analysten, die neue Datenquellen benötigen, warten oft Wochen oder Monate auf die Erledigung einfacher Anfragen. Dieses Problem wird sich verschärfen: Die Einführung generativer KI erhöht die Belastung jetzt berts überlasteter Datenteams erheblich, die Pipelines für KI-Prozesse aufbauen und gleichzeitig die Flut von Daten bewältigen müssen, die diese Systeme erzeugen.

Data Engineering war zu einem kritischen Engpass geworden. Selbst einfache Anfragen mussten monatelange Wartezeiten hinnehmen, was Reibung in der gesamten Organisation erzeugte. Matillion erkannte, dass traditionelle Ansätze nicht skalieren konnten, um die explodierende Nachfrage nach Pipeline-Erstellung und -Wartung zu erfüllen.

Die Entwicklung von Maia:
Vom Konzept zur Produktion

Die Transformation begann, als Matillion feststellte, dass seine proprietäre Datenpipeline-Sprache, die für menschliche Lesbarkeit konzipiert war, auch maschinenlesbar war. Während man im Unternehmen zunächst angenommen hatte, LLMs könnten eine Sprache ohne öffentliche Trainingsdaten nicht verstehen, bewies Claude das Gegenteil. Das Modell zeigte ein ausgeprägtes Auffassungsvermögen seines YAML-basierten Formats, befolgte Anweisungen und generierte konsistent gültige Pipeline-Definitionen.

Matillion baute ein ausgefeiltes Testframework mit drei einander zuarbeitenden LLMs – eines führte Maia aus, ein anderes spielte die Rolle des Testers, und ein drittes fungierte als Wertungsrichter zur Ergebnisüberprüfung. Dieses Framework ermöglichte eine konkrete Leistungsmessung: Verfolgung der benötigten Zeit, Genauigkeit der Tool-Auswahl und Token-Verbrauch über Szenarien-Sets hinweg.

Die Entwicklung von einfacher Auto-Dokumentation zu vollen agentischen Fähigkeiten dauerte zwei Jahre, aber die Ergebnisse rechtfertigen die Investition. Maia kann jetzt fast die gesamte Funktionalität der Data Productivity Cloud über Tool-Aufrufe nutzen und Operationen durchführen, die selbst für erfahrene Dateningenieure eine Herausforderung darstellen.

Maia übernimmt alles von Legacy-ETL-Migrationen bis zum Aufbau produktionsreifer Pipelines mit Maschinengeschwindigkeit, und das mit einer Logikqualität, der wir vertrauen können“, sagt Ammad Baig, Director of Enterprise Data & AI Services bei der Precision Medicine Group, einem Kunden von Matillion. „Das Tool beschleunigt unseren Workflow grundlegend und reduziert zugleich den manuellen Aufwand.“

Das Ergebnis: Eine neue Dimension
der Produktivität von Datenteams

Seit der allgemeinen Verfügbarkeit von Maia im Juni verzeichnen die Kunden signifikante Veränderungen in ihrer Arbeitsweise. Ihre Teams leisten mehr mit ihren bestehenden Ressourcen, wobei die Analysten jetzt ihre Dateninfrastruktur eigenständig selbst aufbauen können, was zuvor spezialisierte Ingenieurskompetenz erforderte.

Die Wirkung geht über externe Kunden hinaus. 80 %der Entwickler bei Matillion haben Claude Code übernommen und berichten auf Basis interner Umfragen von einer durchschnittlichen Reduzierung der Zeit für Pull-Anfragen um 41 %. Das erzeugt einen Multiplikatoreffekt: Junior-Entwickler übernehmen Aufgaben, die zuvor Seniors übernehmen mussten, während Senior-Entwickler nun Arbeit bewältigen, die zuvor nur erfahrene technische Leads bewerkstelligen konnten.

Mit Blick in die Zukunft plant Matillion, Maias Fähigkeiten zu erweitern, um semantische Informationen aus Datenkatalogen, bestehenden Pipelines und Dokumentation zu erfassen. Das Ziel ist, Maia Domänenwissen über die einzigartige Datenlandschaft und Geschäftsterminologie eines jeden Kunden zu vermitteln. Das Modell soll nicht nur zu verstehen, dass es Umsatzfelder in einer Datenbank gibt, sondern welche den einzigen Punkt der Wahrheit für spezifische Geschäftskontexte darstellen.

„Diese Art von semantischen Details zu erfassen und Maia dazu zu bringen, sie effizient zu nutzen, ist unsere nächste Herausforderung“, erklärt Julian. „Die Modelle von Anthropic werden dabei entscheidend sein.“

„Wir haben mehrere Modelle im Parallelvergleich getestet, und Claude lieferte durchgehend die besten Ergebnisse bei Genauigkeit und Zuverlässigkeit.“
Julian Wiffen
Chief of AI and Data Science, Matillion

Next

Video-Untertitel
Next

Vorherige
Next