Bonnes pratiques pour l'ingénierie de requêtes
Obtenez de meilleurs résultats d’IA avec les techniques d’ingénierie de requêtes de l’équipe derrière Claude.
Obtenez de meilleurs résultats d’IA avec les techniques d’ingénierie de requêtes de l’équipe derrière Claude.
L'ingénierie contextuelle est devenue un élément de plus en plus important pour les professionnels des LLM. L'ingénierie de requêtes est un élément essentiel de leur travail.
L'ingénierie de requêtes est un métier spécialisé dans la structuration d’instructions pour obtenir de meilleurs résultats à partir des modèles d’IA. Elle consiste à formuler les requêtes, spécifier le style, fournir le contexte et orienter le comportement du modèle pour atteindre vos objectifs.
La différence entre une instruction vague et une requête bien conçue peut représenter un écart entre des résultats génériques et ceux dont vous avez précisément besoin. Une requête mal structurée peut nécessiter plusieurs échanges pour clarifier l’intention, alors qu’une requête bien conçue vous permet d’y parvenir d’un seul coup.
Pour vous aider à démarrer, nous avons rassemblé les meilleures pratiques de notre équipe, ainsi que des méthodes pratiques conçues pour améliorer vos résultats dès le début. Nous commençons par des habitudes simples et faciles à mettre en pratique dès aujourd'hui, puis évoluons vers des méthodes avancées pour les projets complexes.
Au niveau le plus élémentaire, l'ingénierie de requêtes consiste à modifier les requêtes envoyées à votre LLM. Il s'agit souvent de préciser sa demande avant l'envoi de la requête. Il est essentiel de savoir quelles sont les bonnes informations à partager pour créer une requête efficace.
Ces techniques d'ingénierie de requêtes constituent la base d’interactions efficaces avec les IA. Utilisez-les régulièrement pour améliorer immédiatement la qualité des réponses.
Les modèles d'IA modernes répondent exceptionnellement bien aux instructions claires et explicites. Ne partez pas du principe que le modèle va déduire ce que vous voulez, dites-le clairement. Utilisez un langage simple, expliquant exactement ce que vous voulez, sans ambiguïté.
Principe clé : indiquez exactement au modèle ce que vous attendez. Si vous souhaitez un résultat exhaustif, demandez-le. Si vous souhaitez des caractéristiques spécifiques, indiquez-les. Les modèles modernes comme Claude bénéficient particulièrement d’une instruction explicite.
Exemple : création d'un tableau de bord d’analyse
Vague : « Créez un tableau de bord d’analyses »
Explicite : « Créez un tableau de bord d’analyses. Incluez autant de fonctionnalités et d'interactions pertinentes que possible. Allez au-delà des bases pour créer une implémentation complète. »
La deuxième version demande explicitement des fonctionnalités complètes et indique que vous souhaitez que le modèle aille au-delà du minimum.
Bonnes pratiques :
Expliquez pourquoi les modèles d'IA sont importants pour mieux comprendre vos objectifs et fournir des réponses plus ciblées. Cette méthode est particulièrement efficace avec les modèles plus récents capables de raisonner en fonction de vos objectifs.
Exemple : préférences de mise en forme
Moins efficace : « N'utilisez JAMAIS de listes à puces »
Plus efficace : « Je préfère les réponses sous forme de paragraphes naturels plutôt que de listes à puces, car les textes en prose sont plus faciles à lire et à utiliser. Les listes à puces sont trop formelles et simples pour mon style d’apprentissage informel. »
La deuxième version aide le modèle à comprendre le raisonnement derrière la règle, ce qui lui permet de prendre de meilleures décisions concernant les choix de mise en forme.
Quand fournir le contexte :
Spécificité de l’ingénierie de requêtes : structuration de vos instructions, avec directives et exigences explicites. Plus vous précisez ce que vous souhaitez, meilleurs sont les résultats.
Exemple : planification des repas
Vague : « Créez un plan de repas adapté à un régime méditerranéen »
Spécifique : « Concevez un plan de repas méditerranéen pour la prise en charge du prédiabète. 1 800 calories par jour, avec un accent particulier sur les aliments à faible indice glycémique. Listez le petit-déjeuner, le déjeuner, le dîner et une collation avec le détail des apports nutritionnels. »
Qu'est-ce qui rend une requête suffisamment spécifique ?
Incluez :
Les exemples ne sont pas toujours nécessaires, mais ils sont excellents pour expliquer des concepts ou présenter des formats spécifiques. Les requêtes à un ou quelques exemples servent à expliquer des exigences subtiles, difficiles à exprimer uniquement par des descriptions.
Remarque importante pour les modèles modernes : Claude 4.x et les modèles avancés similaires accordent une attention particulière aux détails dans les exemples. Assurez-vous que vos exemples correspondent aux schémas que vous souhaitez encourager, et que les schémas à éviter soient minimisés.
Exemple : résumé de l'article
Sans exemple : « Résumez cet article »
Quand utiliser des exemples :
Conseil de pro : commencez par un exemple (unique). Ajoutez quelques exemples supplémentaires si le résultat ne correspond toujours pas à vos besoins.
Donnez explicitement à l'IA la permission d'exprimer ses incertitudes plutôt que de vous laisser les deviner. Vous réduirez les hallucinations et gagnerez en fiabilité.
Exemple : « Analysez ces données financières et identifiez les tendances. Si les données sont insuffisantes pour tirer des conclusions, dites-le plutôt que de spéculer. »
Cet ajout simple rend les réponses plus fiables, puisque le modèle reconnaît ses limites.
Essayez ces conseils dans Claude.
Ces habitudes de base seront déjà suffisantes pour de nombreuses tâches, mais il se peut que vous soyez confronté à des situations nécessitant des approches plus sophistiquées. Les techniques avancées d’ingénierie de requêtes sont particulièrement utiles pour les solutions agentiques, les structures de données complexes ou la décomposition de problèmes en plusieurs étapes.
Le préremplissage permet d'amorcer la réponse de l'IA, en guidant le format, le ton ou la structure. Cette technique est particulièrement puissante pour appliquer des formats de sortie ou ignorer des préambules.
Quand utiliser le préremplissage :
Exemple : application de la sortie JSON
Sans pré-remplissage, Claude peut indiquer le fichier JSON demandé : {...}.
Avec pré-remplissage (utilisation de l'API) :
L'IA continuera dès la première explication et ne renverra que des fichiers JSON valides.
Remarque : dans les interfaces de chat, vous pouvez donner une approximation très explicite : « JSON valide uniquement, sans préambule. Commencez votre réponse par une accolade. »
Les requêtes par chaînes de pensée impliquent un raisonnement étape par étape avant la réponse. Cette technique permet de réaliser des tâches analytiques complexes qui bénéficient d'une réflexion structurée.
Approche moderne : Claude offre une fonctionnalité de réflexion étendue qui automatise le raisonnement structuré. Lorsqu’elle est disponible, la réflexion étendue est généralement préférable aux requêtes par chaîne de pensée manuelle. Cependant, la compréhension de la chaîne de pensée manuelle reste précieuse dans les situations où la réflexion étendue n'est pas disponible ou lorsque vous avez besoin d’un raisonnement transparent, que vous pourrez réviser.
Quand utiliser la chaîne de pensée :
Il existe trois mises en œuvre courantes de la chaîne de pensée :
Chaîne de pensée de base
Il suffit d'ajouter « Réfléchir étape par étape » à vos instructions.
Chaîne de pensée guidée
Structurez votre requête en donnant des étapes de raisonnement spécifiques.
Chaîne de pensée structurée
Utilisez des balises pour séparer le raisonnement de la réponse finale.
Remarque : même lorsque la réflexion étendue est disponible, les requêtes par chaîne de pensée explicite peuvent être utiles pour les tâches complexes. Les deux approches sont complémentaires, mais ne s’excluent pas.
Les modèles d'IA modernes disposent de plusieurs méthodes efficaces pour contrôler la mise en forme des réponses :
1. Indiquez à l'IA ce qu’elle doit faire et non pas ce qu’elle ne doit PAS faire
Plutôt que : « Ne pas utiliser de markdown dans la réponse », Essayez : « Votre réponse doit être composée de paragraphes fluides en prose »
2. Adaptez le style de votre requête au résultat souhaité
Le style de mise en forme de votre requête peut influencer le style de réponse de l'IA. Si vous souhaitez que la réponse intègre le moins de markdown possible, n'en n'utilisez pas dans votre requête.
3. Précisez vos préférences de mise en forme
Pour un contrôle détaillé de la mise en forme :
Contrairement aux techniques précédentes, la chaîne de requêtes ne peut pas être mise en œuvre dans une seule requête. Les chaînes décomposent les tâches complexes en étapes séquentielles plus petites, grâce à des requêtes distinctes. Chaque requête gère une étape, et les résultats sont pris en compte dans l'instruction suivante.
Cette approche sacrifie la latence au profit d’une meilleure précision, en rendant chaque tâche individuelle plus simple. Généralement, cette technique est implémentée à l'aide de flux de travail ou de manière programmatique, mais vous pouvez fournir les requêtes manuellement après avoir reçu les réponses.
Exemple : résumé de recherche
Chaque étape permet de mieux cibler les instructions.
Quand utiliser les chaînes de requêtes :
Compromis : le chaînage augmente la latence (appels API multiples), mais améliore souvent considérablement la précision et la fiabilité pour les tâches complexes.
Certaines techniques d'ingénierie de requêtes déjà populaires auprès des modèles d'IA sont moins nécessaires avec des modèles comme Claude. Elles peuvent toutefois être utilisées dans d'anciennes documentations ou être utiles dans des situations spécifiques.
Les balises XML étaient autrefois recommandées pour structurer et clarifier les requêtes, notamment pour l’intégration de grandes quantités de données. Les modèles modernes comprennent mieux les structures sans balises XML, mais ils peuvent néanmoins être utiles dans des situations spécifiques.
Exemple :
Quand des balises XML peuvent toujours être utiles :
Alternative moderne : dans la plupart des cas d'usage, des titres clairs, des espaces blancs et un langage explicite (« Utilisation des informations sur l'athlète ci-dessous…) fonctionnent aussi bien, tout en évitant la surcharge.
Les requêtes basées sur des rôles permettent de cadrer la requête en assignant à l'IA un rôle d’expert et une perspective précise. Même si elles peuvent être efficaces, les modèles modernes sont suffisamment sophistiqués pour rendre inutiles ces requêtes lourdes à rédiger.
Exemple : « Vous êtes conseiller financier. Analysez ce portefeuille de placements… »
Mise en garde importante : ne pas surcharger le rôle. « Vous êtes un assistant serviable » est souvent préférable à « Vous êtes un expert de renommée mondiale, qui s'exprime toujours en jargon technique, vous ne faites jamais d’erreurs » Des rôles trop spécifiques peuvent limiter l'utilité de l'IA.
Situations dans lesquelles les requêtes basées sur des rôles peuvent être utiles :
Alternative moderne : il est souvent plus efficace de préciser sa perspective : « Analysez ce portefeuille d’investissements, en vous concentrant sur la tolérance au risque et le potentiel de croissance à long terme » plutôt que de lui attribuer un rôle.
Essayez Claude.
Nous avons passé en revue les différentes techniques, mais leur véritable puissance émerge quand elles sont combinées stratégiquement. L'ingénierie de requêtes ne fait pas appel à toutes les techniques disponibles : il sélectionne la combinaison adaptée à vos besoins spécifiques.
Exemple combinant plusieurs techniques :
Cette requête combine les éléments suivants :
Toutes les techniques ne sont pas nécessaires dans toutes les requêtes. Voici un cadre de décision :
Commencez ici :
Guide pour choisir la technique :
| Si vous avez besoin... | Utilisez.. |
|---|---|
| Format de sortie spécifique | Exemples, instructions de pré-remplissage ou mises en forme explicites |
| Raisonnement étape par étape | Réflexion étendue (Claude 4.x) ou chaîne de pensée |
| Tâche complexe en plusieurs étapes | Chaîne de requêtes |
| Raisonnement transparent | Chaîne de pensée avec résultats structurés |
| Pour prévenir les hallucinations | Autorisation d'indiquer « Je ne sais pas » |
Même les requêtes bien intentionnées peuvent produire des résultats inattendus. Problèmes courants et mode de résolution :
Conseil pro : commencez simplement et ajoutez de la complexité si nécessaire. Testez chaque ajout pour voir s'il améliore les résultats.
Ces pièges courants vous aideront à gagner du temps et à améliorer vos requêtes :
L'une des difficultés de la mise en œuvre de l'ingénierie de requêtes avancée est qu'elle ajoute une surcharge de contexte grâce à l'utilisation de jetons supplémentaires. Exemples, requêtes multiples, instructions détaillées : tous utilisent des jetons, tandis la gestion du contexte est un outil autonome.
N’oubliez pas : les techniques d’ingénierie de requêtes utilisées doivent toujours être justifiées. Pour obtenir des conseils complets sur la gestion efficace du contexte, consultez notre article de blog sur l'ingénierie contextuelle.
Amélioration de la sensibilisation au contexte : les modèles d'IA modernes, dont Claude 4.x, ont considérablement amélioré leurs capacités de sensibilisation au contexte, permettant de résoudre les problèmes historiques de perte de temps : les modèles avaient du mal à gérer toutes les parties de contextes longs.
Pourquoi le fractionnement des tâches reste utile : même avec ces améliorations, la décomposition de grandes tâches en parties distinctes reste une technique précieuse, non pas en raison de limites contextuelles, mais parce qu'elle aide le modèle à se concentrer sur le meilleur travail possible, selon des exigences et un champ d’application très spécifiques. Une tâche ciblée, avec des limites claires; produit des résultats de meilleure qualité que si on essayait d’atteindre plusieurs objectifs en une seule requête.
Stratégie : lorsque vous travaillez avec des contextes longs, structurez clairement vos informations, avec les détails les plus critiques au début ou à la fin. Pour les tâches complexes, demandez-vous si leur division en sous-tâches ciblées améliorerait la qualité et la fiabilité de chaque composant.
L'ingénierie de requêtes est une compétence qui s'acquiert au terme d'une longue pratique. La seule façon de savoir si votre requête est correcte, c’est de la tester. La première étape consiste à l’essayer vous-même. Vous verrez immédiatement les différences entre les requêtes, qu'elles reprennent ou non les techniques de requêtes présentées ici.
Pour affiner vos compétences en ingénierie de requêtes, vous devez mesurer objectivement l'efficacité de vos requêtes. Bonne nouvelle, c'est exactement ce que couvre notre cours d’ingénierie de requêtes sur anthropic.skilljar.com.
Conseils pour une évaluation rapide :
L'ingénierie de requêtes est avant tout une question de communication : utilisez un langage qui permet à l'IA de comprendre plus clairement vos intentions. Commencez par les techniques de base présentées au début de ce guide. Utilisez-les de manière constante jusqu'à ce qu'elles deviennent naturelles. Introduisez des techniques avancées uniquement pour résoudre un problème spécifique.
N’oubliez pas : les meilleures requêtes ne sont pas nécessairement longues ni complexes. Une bonne requête atteint vos objectifs de manière fiable, avec la structure minimale. La pratique vous aidera à développer une intuition pour identifier les techniques les plus adaptées à chaque situation.
Ce passage à l'ingénierie contextuelle ne diminue pas l'importance de l’ingénierie de requêtes. En fait, l'ingénierie de requêtes est un élément fondamental de l’ingénierie contextuelle. Une requête bien conçue s'intègre dans le contexte plus large, qui façonne le comportement de l'IA, combinant l'historique des conversations, les pièces jointes et les instructions système pour obtenir de meilleurs résultats.
Commencez à utiliser Claude dès aujourd'hui.
Recevez la newsletter des développeurs
Informations sur les produits, tutoriels,
présentations de la communauté, et plus encore. Envoyée mensuellement dans votre boîte de réception.