À une époque où l'intelligence artificielle s'intègre parfaitement à nos tâches quotidiennes, l'efficacité de nos interactions avec ces systèmes avancés est devenue primordiale. Le pont entre l'intention humaine et la compréhension de la machine se construit à travers un processus à la fois subtil et crucial - c'est là que nous entrons dans le monde de l'ingénierie prompte à l'IA. C'est un domaine qui combine les compétences linguistiques et les connaissances techniques pour parvenir à une communication plus efficace avec l'IA. Explorons plus avant ce concept et comprenons son importance dans le paysage technologique moderne.
TL;DR
- L'intégration de l'IA dans les tâches quotidiennes souligne la nécessité d'interactions efficaces avec les systèmes avancés.
- L'ingénierie rapide en matière d'IA fusionne les compétences linguistiques et les connaissances techniques pour une communication efficace en matière d'IA.
- En IA, une invite est une instruction textuelle qui aide à produire des résultats spécifiques à partir de modèles linguistiques.
- L'ingénierie rapide consiste à élaborer des entrées pour optimiser les réponses de l'IA.
- L'évolution des modèles linguistiques complets tels que GPT-3 et GPT-4 a souligné l'importance de l'ingénierie rapide.
- L'ingénierie rapide a conduit à l'émergence d'"ingénieurs rapides" ou de "chuchoteurs d'IA".
- Les techniques essentielles d'ingénierie de l'invite comprennent le zéro-coup, le peu de coups, la chaîne de pensée, l'incitation à la connaissance générée et la génération augmentée par la récupération.
- Les applications de l'ingénierie des messages-guides vont des messages-guides simples aux messages-guides pédagogiques complexes et aux messages-guides créatifs.
- L'ingénierie des invites implique également des invites contextuelles qui assurent la continuité de l'expansion du texte.
- Les invites de génération d'images dans l'IA convertissent les descriptions textuelles détaillées en images.
- Différents types d'invites de génération d'images s'adressent à la visualisation de paysages, à la conception de personnages, aux maquettes de conception de produits et à la conception d'œuvres de fiction.
- Tu peux commencer à apprendre l'ingénierie rapide grâce à notre chaîne YouTube.
Qu'est-ce que l'ingénierie rapide dans l'IA ?
Le concept d'ingénierie de l'invite apparaît dans le domaine de l'IA, où les entrées textuelles données par le biais de lignes de commande sont soigneusement élaborées et ajustées de manière à ce que l'IA produise les résultats les plus efficaces. Elle s'applique tout particulièrement aux plateformes d'IA générative qui nécessitent des données textuelles, telles que les modèles de langage étendus, les chatbots engageants et les modèles imaginatifs de conversion de texte en image. C'est pourquoi le rôle d'un ingénieur d'aide est né de la nécessité de disposer d'une ingénierie d'aide compétente.
Qu'est-ce qu'une invite à l'IA ?
Une invite d'IA établit un canal de communication entre un utilisateur et un modèle de langage sophistiqué, guidant le modèle pour qu'il produise un type de sortie spécifique. Cette interface peut se manifester sous forme de requêtes, d'entrées textuelles, d'extraits de codage ou de cas illustratifs.
Comment fonctionne l'ingénierie d'incitation ?
L'ingénierie des invites se concentre sur le développement et le perfectionnement des directives émises à une IA sous forme de texte et de contexte, en veillant à ce que les résultats de l'IA soient optimaux. La terminologie "prompt" fait particulièrement référence aux instructions textuelles qui alimentent les systèmes d'IA génératifs tels que les modèles de langage extensifs (LLM), les chatbots interactifs ou les modèles créatifs texte-image tels que Midjourney.
À la lumière de l'introduction de modèles linguistiques complets tels que GPT-3 ou GPT-4, et de la création de systèmes de chatbot tels que ChatGPT basés sur ces modèles, ainsi que de modèles texte-image robustes tels que DALL-E, Stable Diffusion ou Midjourney, l'importance de l'ingénierie de la promptitude est devenue de plus en plus primordiale. Par conséquent, une nouvelle nomenclature professionnelle a vu le jour sous la forme d'un " ingénieur de l'invite ", parfois appelé sur un ton plus détendu " chuchoteur de l'IA " ou " interprète de l'IA ".
L'ingénierie des prompts a pris de l'ampleur car l'essence du résultat généré par l'IA est intimement liée aux directives textuelles de la tâche et aux lignes directrices fournies par les interfaces de ligne de commande. Pour que l'IA saisisse correctement la mission et fournisse des informations et un contexte suffisants pour accomplir la tâche, il est impératif qu'elle s'aligne sur les attentes de l'utilisateur et qu'elle soit d'une réelle utilité. L'ingénierie rapide évolue rapidement dans ce domaine dynamique et en plein essor.
Comment apprendre l'ingénierie rapide ?
Les compétences ou l'expérience en apprentissage automatique peuvent être bénéfiques pour ton travail en tant qu'ingénieur prompteur. Par exemple, l'apprentissage automatique peut être utilisé pour prédire le comportement des utilisateurs en fonction de la façon dont ils ont interagi avec un système dans le passé. Les ingénieurs d'invite peuvent alors affiner la façon dont ils invitent un LLM à générer du matériel pour les expériences utilisateur.
Sinon, tu peux commencer à apprendre l'ingénierie des prompts grâce à notre chaîne YouTube. Nous proposons plusieurs vidéos qui t'apprennent à concevoir des messages-guides efficaces pour les LLM.
Meilleures pratiques d'ingénierie rapide
Crée des instructions directes et compréhensibles
Veille à ce que tes conseils soient précis et intelligibles. Plus tu exprimeras clairement tes besoins, mieux le modèle pourra te servir. Pour des réponses succinctes, demande la concision. Pour un discours plus avancé, spécifie l'exigence d'un contenu de niveau expert. Si tu trouves que le format ne convient pas, donne un exemple préféré que le modèle pourra imiter. Des instructions directes augmentent les chances d'obtenir le résultat souhaité.
Fournir des références suffisantes
Sache que les modèles de langage d'IA ont la capacité de produire des informations inexactes, en particulier avec des sujets obscurs ou lorsqu'on leur demande des sources. Tout comme les notes peuvent améliorer les performances d'un élève à un examen, équiper le modèle de textes de référence, d'URL ou de documents peut réduire considérablement les risques d'informations incorrectes.
Décompose les tâches complexes
Aborde les questions complexes de façon stratégique en les divisant en parties plus petites et plus faciles à gérer. Cela reflète les meilleures pratiques en matière d'ingénierie logicielle, où les systèmes sont construits de façon modulaire. La simplification de la tâche augmente la précision du modèle et permet de créer un flux de travail étape par étape, chaque étape s'appuyant sur la précédente.
Teste systématiquement tes messages-guides
Pour une amélioration constante des performances, il est impératif de tester les invites de façon systématique. Parfois, une modification peut améliorer un seul cas, mais peut être préjudiciable lorsqu'elle est appliquée à grande échelle. Il est recommandé d'évaluer continuellement les messages-guides dans divers scénarios et d'établir templates pour les messages-guides qui donnent systématiquement les réponses les plus précises et les plus utiles.
Exemple d'un message de qualité :
Crée un résumé concis rédigé sur un ton professionnel sur le thème des solutions énergétiques durables. Le résumé ne doit pas dépasser 300 mots. N'oublie pas d'inclure les dernières tendances en matière d'énergie solaire et éolienne, et veille à citer les statistiques récentes du rapport 2023 de l'AIE (Agence internationale de l'énergie). Le format de sortie doit être une liste à puces.
Analyse de cette invite :
Créer un résumé concis rédigé sur un ton professionnel sur le thème des solutions énergétiques durables. (Instructions claires définissant le ton et le sujet). Le résumé ne doit pas dépasser 300 mots (Définit une exigence de longueur spécifique). Merci d'inclure les dernières tendances en matière d'énergie solaire et éolienne, et de veiller à citer les statistiques récentes du rapport 2023 de l'AIE (Agence internationale de l'énergie). (Guide le modèle pour qu'il inclue un contenu spécifique et qu'il utilise des références factuelles pour améliorer la précision). Le format de sortie doit être une liste à puces (Indique clairement le format préféré)
Techniques d'ingénierie rapide
Maintenant que tu as une bonne compréhension de l'ingénierie des messages-guides et du projet pratique sur lequel tu vas travailler, il est temps de se plonger dans les techniques courantes d'ingénierie des messages-guides. Dans cette section, tu apprendras à appliquer les techniques suivantes à tes messages-guides pour obtenir le résultat souhaité du modèle linguistique.
Prompt à l'action
Poser au modèle de langage une question normale sans aucun contexte supplémentaire. Remarque que dans l'invite ci-dessus, nous n'avons pas fourni au modèle des exemples de texte avec leurs classifications, le LLM comprend déjà le "sentiment" - c'est la capacité zéro-shot qui est à l'œuvre. Lorsque la fonction zéro ne fonctionne pas, il est recommandé de fournir des démonstrations ou des exemples dans l'invite, ce qui conduit à l'utilisation de l'invite à quelques reprises. Dans la section suivante, nous présentons une démonstration de l'utilisation de l'invite à quelques reprises.
Exemple de saisie : "Quel est le sentiment du texte suivant : "J'ai envie de danser chaque fois que j'entends cette chanson !".
Exemple de sortie : "Le sentiment du texte est positif".
Prompt à l'action
Conditionne le modèle sur quelques exemples pour booster ses performances. Bien que les modèles de grandes langues démontrent des capacités remarquables en matière de zéro-coup, ils restent insuffisants pour les tâches plus complexes lorsqu'ils utilisent le paramètre zéro-coup. L'incitation par quelques exemples peut être utilisée comme technique pour permettre l'apprentissage en contexte où nous fournissons des démonstrations dans l'incitation afin d'orienter le modèle vers de meilleures performances. Les démonstrations servent de conditionnement pour les exemples suivants dans lesquels nous aimerions que le modèle génère une réponse.
Exemple de saisie : "Génère une critique de produit pour ce nouveau téléphone en te basant sur ces exemples positifs et négatifs : Positif : J'ai vraiment aimé l'appareil photo du téléphone, il prend des photos incroyables ! Négatif : L'autonomie de la batterie de ce téléphone est terrible, elle ne dure pas assez longtemps."
Exemple de sortie :"L'appareil photo de ce téléphone est fantastique ! Les photos sont toujours claires comme de l'eau de roche et les couleurs sont éclatantes. Cependant, l'autonomie de la batterie n'est pas terrible et ne dure que quelques heures."

L'incitation à la chaîne de pensée
Introduite dans Wei et al. (2022), la chaîne de pensée (CoT) permet d'obtenir des capacités de raisonnement complexes par le biais d'étapes de raisonnement intermédiaires. Tu peux l'associer à l'incitation à quelques coups pour obtenir de meilleurs résultats sur des tâches plus complexes qui nécessitent un raisonnement avant de répondre.

Connaissances générées Invitation
L'incitation par les connaissances générées consiste à exploiter des bases de connaissances externes ou du contenu généré pour améliorer les réponses du modèle. En incorporant des informations pertinentes dans les invites, les modèles peuvent fournir des réponses détaillées et précises ou générer du contenu sur la base des connaissances acquises.

Voyons comment cela fonctionne en pratique dans le contexte suivant :
Contexte :
La psychologie de l'éducation étudie depuis longtemps l'impact des moyens mnémotechniques sur l'apprentissage et la mémoire. Une question se pose : L'utilisation de moyens mnémotechniques peut-elle améliorer la rétention des informations chez les élèves ?
Invitation à commencer :
L'utilisation de moyens mnémotechniques dans l'enseignement aide-t-elle les élèves à mieux retenir les informations ?
Invitations à la connaissance générées :
Entrée : Les moyens mnémotechniques sont des outils qui aident les gens à se souvenir des informations.
Connaissances : Les moyens mnémotechniques exploitent des modèles de lettres, d'idées ou d'associations qui facilitent le processus de mémorisation. Les stratégies mnémotechniques efficaces comprennent la création d'acrostiches, le regroupement d'informations et la méthode des loci. Ces techniques font appel aux systèmes de mémoire linguistique et spatiale, ce qui permet de mieux retenir les informations.
Intrant : La psychologie de l'éducation étudie comment les gens apprennent.
Connaissances : La psychologie de l'éducation est un domaine interdisciplinaire qui combine des théories et des méthodologies issues de la psychologie, de la sociologie et de la philosophie afin de comprendre les processus cognitifs et affectifs impliqués dans l'apprentissage. Elle applique cette compréhension à la conception pédagogique, à l'élaboration des programmes et à la gestion des classes, dans le but d'optimiser les résultats de l'apprentissage.
Maintenant, nous pouvons combiner ces connaissances générées pour répondre à l'invite initiale avec une sortie plus informée.
Invitation intégrée basée sur les connaissances :
"Question : L'utilisation de moyens mnémotechniques dans l'enseignement aide-t-elle les élèves à mieux retenir les informations ?
Connaissance 1 : Les moyens mnémotechniques utilisent des modèles de lettres, d'idées ou d'associations pour faciliter la mémorisation. Des techniques telles que l'acrostiche, le chunking et la méthode des loci font appel à plusieurs systèmes de mémoire.
Connaissance 2 : La psychologie de l'éducation cherche à optimiser les résultats de l'apprentissage en comprenant les processus cognitifs et affectifs de l'apprentissage et en les appliquant aux stratégies pédagogiques.
Explique et réponds."
Réponse :
"Oui, l'utilisation de moyens mnémotechniques dans l'éducation favorise une meilleure rétention des informations. Ces outils font appel aux systèmes de mémoire linguistique et spatiale, que la psychologie de l'éducation identifie comme des processus cognitifs clés dans l'apprentissage. En utilisant des méthodes comme l'acrostiche ou la méthode des loci, les éducateurs peuvent fournir aux élèves des stratégies pour se souvenir plus efficacement des informations, ce qui conduit à des résultats d'apprentissage plus élevés, comme le montre la recherche et le soutien dans le domaine de la psychologie de l'éducation."
Cet exemple montre comment le fait de générer des connaissances à partir d'informations pertinentes peut apporter une réponse complète et nuancée à des questions éducatives complexes.
Génération Augmentée de Récupération (GAR)
Les modèles de langage standard sont adaptables et peuvent être perfectionnés pour toute une série de tâches typiques telles que l'analyse des sentiments ou l'identification des entités nommées. Ces opérations ne nécessitent généralement pas l'incorporation d'informations factuelles supplémentaires.

Cependant, pour les tâches plus complexes et exigeant des connaissances approfondies, il est possible de construire un système utilisant des modèles de langage qui font appel à des sources d'information supplémentaires et externes. Cette approche améliore l'exactitude des faits, renforce la fiabilité des réponses fournies par le modèle et permet de réduire les cas d'"hallucination" dans les résultats. Voici un petit exemple de mise en œuvre d'un RAG sur ZenoChat qui fonctionne avec un fichier CSV externe :
Exemples d'ingénierie rapide
L'ingénierie des messages-guides est appliquée dans une diversité de scénarios pour guider les performances de l'IA. Ici, nous passerons en revue quelques exemples concrets qui éclairent l'art et la science de la structuration efficace des messages-guides.
Directives simples
Pour les tâches simples, comme demander au modèle de générer une liste ou de répondre à une requête directe, des invites directives simples suffisent. Ces messages sont clairs, concis et précis.
Entrée : "Fais la liste des sept merveilles du monde moderne".
Sortie : "Les sept merveilles du monde moderne comprennent : 1. Chichén Itzá au Mexique, 2. la statue du Christ Rédempteur au Brésil, 3. la Grande Muraille de Chine en Chine, 4. le Machu Picchu au Pérou, 5. Petra en Jordanie, 6. le Colisée romain en Italie, et 7. Le Taj Mahal en Inde."
Invitations complexes à l'enseignement
Lorsqu'il s'agit de demandes plus complexes, telles que la rédaction d'un essai complet ou la conception d'un algorithme à plusieurs étapes, des invites d'instruction complexes entrent en jeu. Ces invites fournissent des informations détaillées et définissent les attentes que l'IA doit suivre.
Intrant : "Rédige un essai complet sur l'impact du changement climatique sur la biodiversité marine, comprenant au moins trois effets clés, des solutions potentielles et une conclusion."
Résultat : "Le changement climatique a eu un impact profond sur la biodiversité marine, la hausse des températures, l'acidification des océans et l'élévation du niveau de la mer altérant la santé et la distribution des espèces marines. Parmi les principaux effets, on peut citer le blanchiment des coraux, les changements dans la répartition des espèces et les modifications des périodes de reproduction..."
Suggestions de conceptualisation créative
Parfois, l'objectif est de pousser l'IA à créer un contenu original, comme des histoires, des poèmes ou des œuvres d'art visuelles. Les invites de conceptualisation créative s'appuient sur un langage évocateur et des descriptions vivantes pour stimuler l'ingéniosité du modèle.
Entrée : "Crée une histoire sur un détective qui peut communiquer avec les animaux pour résoudre des mystères. Commence par le détective qui reçoit un message énigmatique d'un perroquet au sujet de la disparition d'un cheval de course de grande valeur."
Sortie : "La matinée de l'inspecteur Eliza Thornberry a été interrompue par les piaillements frénétiques de son informateur, un perroquet écarlate nommé Pascal. 'Le rapide destrier a disparu avant l'aube', a-t-il crié. Connue pour sa capacité unique à communiquer avec le règne animal, Eliza savait que ce message ne pouvait signifier qu'une chose : le célèbre cheval de course, Lightning Hoof, avait été volé..."
Invitations à poursuivre en contexte
Pour poursuivre un texte dans le même style ou pour développer un sujet avec continuité, on utilise des invites de continuation contextuelles. Elles permettent à l'IA de reconnaître le contenu précédent et de maintenir le fil conducteur dans les contributions suivantes.
Entrée : "Continue le texte suivant dans le style d'un roman à suspense : 'Alors que l'horloge sonnait minuit, une ombre s'est glissée par la fenêtre fissurée. Le coffre-fort, que l'on croyait protéger le secret centenaire de la famille, était maintenant grand ouvert.'"
Sortie : "La pièce autrefois silencieuse vibrait de la tension de la nouvelle brèche découverte. Le cœur battant, les yeux de l'intrus balayaient l'intérieur faiblement éclairé, le clair de lune scintillant sur le contenu exposé du coffre-fort en métal. L'histoire interdite de la famille étant à portée de main, le mystère est sur le point d'être révélé. Ils étaient loin de se douter qu'une autre paire d'yeux les observait depuis l'obscurité, témoin de la conspiration en cours."
Ce ne sont là que quelques illustrations de la façon dont l'ingénierie prompte façonne le dialogue entre les humains et l'IA, influençant en fin de compte l'efficacité du résultat de l'algorithme.
En tant qu'ingénieur prompt, maîtriser ces techniques et reconnaître quand les appliquer peut améliorer considérablement l'interactivité et l'utilité du contenu généré par l'IA.
Invitations à la création d'images
Les invites pour la génération d'images guident l'IA pour qu'elle convertisse les descriptions textuelles en visuels convaincants. L'essentiel est de fournir suffisamment de détails pour aider le modèle à envisager et à restituer le concept avec précision.
Suggestions de visualisation illustratives
Entrée : "Conçois une image d'un paysage serein présentant un petit chalet au bord d'un lac, avec des montagnes en arrière-plan enveloppées de brume, pendant l'heure dorée du coucher du soleil."
Suggestions d'illustrations de personnages
Entrée : "Crée une image d'un concept de personnage pour un inventeur steampunk, avec des vêtements de l'époque victorienne ornés de gadgets en laiton, tenant une clé à molette fabriquée sur mesure, avec des lunettes de protection posées sur leur chapeau."
Suggestions pour la conception de maquettes de produits
Entrée : "Génère une image d'un smartphone au design élégant et moderne avec un écran en verre incurvé, un écran sans cadre et un assistant IA interactif sur l'écran."
Dessin conceptuel pour les promesses de fiction
Entrée : "Représente une image d'un marché extraterrestre animé situé sur une station spatiale, avec diverses espèces intergalactiques qui échangent des marchandises exotiques sous des enseignes au néon dans un éventail d'écritures extraterrestres."