I en tid där artificiell intelligens integreras sömlöst i våra dagliga uppgifter har effektiviteten i vår interaktion med dessa avancerade system blivit av största vikt. Bron mellan människans avsikt och maskinens förståelse byggs genom en process som är både subtil och avgörande - det är här vi kommer in i världen av prompt engineering inom AI. Det är ett område som kombinerar språklig skicklighet med teknisk kunskap för att uppnå effektivare kommunikation med AI. Låt oss utforska detta koncept ytterligare och förstå dess betydelse i det moderna tekniska landskapet.

TL;DR

  • AI-integrering i dagliga arbetsuppgifter understryker behovet av effektiva interaktioner med avancerade system.
  • Prompt engineering inom AI kombinerar språklig skicklighet med teknisk kunskap för effektiv AI-kommunikation.
  • En prompt inom AI är en textbaserad instruktion som hjälper till att producera specifika resultat från språkmodeller.
  • Prompt engineering innebär att man utformar indata för att optimera AI:s svar.
  • Utvecklingen av omfattande språkmodeller som GPT-3 och GPT-4 har understrukit vikten av prompt engineering.
  • Prompt teknik har lett till uppkomsten av "Prompt Engineers" eller "AI whisperers".
  • Viktiga tekniker för prompt engineering inkluderar zero-shot, few-shot, chain-of-thought, generated knowledge prompting och retrieval-augmented generation.
  • Prompttekniska tillämpningar varierar från enkla direktivprompter till komplexa instruktionsprompter och kreativa prompter.
  • Prompt engineering innefattar även kontextuella prompts som säkerställer kontinuitet i den expanderande texten.
  • Bildgenerering i AI omvandlar detaljerade textbeskrivningar till visuella bilder.
  • Olika typer av bildgenereringsuppmaningar tillgodoser landskapsvisualisering, karaktärskoncept, produktdesignmodeller och konceptkoncept för fiktion.
  • Du kan börja lära dig snabbteknik via vår YouTube-kanal.

Vad är prompt engineering inom AI?

Begreppet prompt engineering uppstår inom AI, där textbaserad input som ges via kommandorader är noggrant utformad och finjusterad på ett sådant sätt att AI ger de mest kompetenta resultaten. Det har en särskild tillämpning i generativa AI-plattformar som kräver textinmatning, till exempel expansiva språkmodeller, engagerande chatbots och fantasifulla text-till-bild-modeller. Rollen som prompt engineer har alltså vuxit fram ur behovet av kompetent prompt engineering.

Vad är en AI-prompt?

En AI-prompt upprättar en kommunikationskanal mellan en användare och en sofistikerad språkmodell, som vägleder modellen att producera en viss typ av output. Detta gränssnitt kan utgöras av frågor, textinmatningar, kodningsutdrag eller illustrativa fall.

Hur fungerar prompt engineering?

Prompt engineering fokuserar på att utveckla och finslipa de direktiv som ges till en AI i form av text och sammanhang, för att säkerställa att AI:ns resultat är optimala. Terminologin "prompt" syftar särskilt på de textbaserade instruktioner som matas in i generativa AI-system, t.ex. omfattande språkmodeller (LLM), interaktiva chatbots eller kreativa text-till-bild-modeller som Midjourney.

Mot bakgrund av införandet av omfattande språkmodeller som GPT-3 eller GPT-4, och skapandet av chatbot-system som ChatGPT baserade på dem, tillsammans med robusta text-till-bild-modeller som DALL-E, Stable Diffusion eller Midjourney, har betydelsen av prompt engineering blivit allt viktigare. Följaktligen har en ny professionell nomenklatur uppstått i form av "Prompt Engineer", ibland kallad i en mer avslappnad ton som en "AI whisperer" eller "AI interpreter".

Prompt engineering har tagit fart eftersom kärnan i den output som genereras av AI är intimt kopplad till de textuella uppgiftsdirektiv och riktlinjer som tillhandahålls via kommandoradsgränssnitt. För att AI ska kunna förstå uppgiften korrekt och tillhandahålla information och sammanhang som är tillräckliga för att utföra uppgiften, är det absolut nödvändigt att den gör det för att anpassa sig till användarens förväntningar och för att vara till verklig nytta. Prompt teknik utvecklas snabbt inom detta dynamiska och växande område.

Hur lär man sig prompt engineering?

Kompetens eller erfarenhet av maskininlärning kan vara till nytta i ditt arbete som promptingenjör. Maskininlärning kan till exempel användas för att förutsäga användarbeteende baserat på hur användare har interagerat med ett system tidigare. Promptingenjörer kan sedan finjustera hur de promptar en LLM för att generera material för användarupplevelser.

Alternativt kan du börja lära dig hur du skapar prompts via vår YouTube-kanal. Vi erbjuder flera videor som lär dig hur du skapar effektiva uppmaningar för LLM.

Bästa praxis för snabb teknikutveckling

Skapa direkta och begripliga instruktioner

Se till att din vägledning är exakt och begriplig. Ju tydligare du formulerar dina behov, desto bättre kan modellen hjälpa dig. För kortfattade svar, begär kortfattad information. För mer avancerad diskurs, specificera kravet på innehåll på expertnivå. Om du tycker att formatet är olämpligt, ange ett önskat exempel som modellen ska efterlikna. Direkta instruktioner ökar sannolikheten för att du får det resultat du önskar.

Tillhandahålla tillräckliga referenser

Var medveten om att AI-språkmodeller har kapacitet att producera felaktig information, särskilt med obskyra ämnen eller när de uppmanas att ange källor. Precis som anteckningar kan förbättra en students resultat på ett prov, kan man genom att utrusta modellen med referenstexter, webbadresser eller dokument avsevärt minska risken för felaktig information.

Dela upp komplexa uppgifter

Närma dig komplexa frågor strategiskt genom att dela upp dem i mindre, mer hanterbara delar. Detta speglar bästa praxis inom programvaruteknik, där system byggs upp modulärt. Genom att förenkla uppgiften blir modellen mer exakt och det går att skapa ett steg-för-steg-arbetsflöde där varje steg bygger på det föregående.

Testa dina uppmaningar systematiskt

För att uppnå en konsekvent förbättring av prestanda är det absolut nödvändigt att testa prompter systematiskt. Ibland kan en ändring förbättra ett enskilt fall men vara skadlig när den tillämpas generellt. Det rekommenderas att kontinuerligt utvärdera uppmaningar i olika scenarier och skapa templates för de uppmaningar som konsekvent ger de mest korrekta och användbara svaren.

Exempel på en kvalitetsprompt: 

Skapa en kortfattad sammanfattning skriven i professionell ton om ämnet hållbara energilösningar. Sammanfattningen bör inte vara längre än 300 ord. Inkludera de senaste trenderna inom sol- och vindkraft, och se till att citera aktuell statistik från IEA:s (International Energy Agency) 2023-rapport. Utdataformatet ska vara en punktlista.

Analys av denna prompt:

Skapa en kortfattad sammanfattning skriven i professionell ton om ämnet hållbara energilösningar (Tydliga instruktioner som definierar tonen och ämnet). Sammanfattningen får inte vara längre än 300 ord (Ställer ett specifikt krav på längd). Inkludera de senaste trenderna inom sol- och vindkraft, och se till att citera aktuell statistik från IEA:s (International Energy Agency) 2023-rapport (Vägleder modellen att inkludera specifikt innehåll och att använda faktareferenser för att förbättra noggrannheten). Utdataformatet bör vara en punktlista (Anger tydligt vilket format som föredras)

Snabba tekniska lösningar

Nu när du har en förståelse för prompt engineering och det praktiska projekt som du kommer att arbeta med, är det dags att dyka in i några vanliga tekniker för prompt engineering. I det här avsnittet får du lära dig hur du tillämpar följande tekniker på dina prompts för att få önskad output från språkmodellen.

Noll-shot Prompting

Att ställa en normal fråga till språkmodellen utan någon ytterligare kontext. Observera att vi i frågan ovan inte gav modellen några exempel på text tillsammans med deras klassificeringar, LLM förstår redan "sentiment" - det är zero-shot-funktionerna som fungerar. När zero-shot inte fungerar rekommenderas det att ge demonstrationer eller exempel i prompten, vilket leder till few-shot prompting. I nästa avsnitt demonstrerar vi "few-shot prompting".

Exempel på indata: "Vad är känslan i följande text: 'Jag känner för att dansa när jag hör den här låten!'"

Exempel på utdata: "Känslan i texten är positiv."

Prompting med få skott

Konditionera modellen på några exempel för att öka dess prestanda. Även om modeller för stora språk har en anmärkningsvärd förmåga när det gäller zero-shot, klarar de fortfarande inte av mer komplexa uppgifter när zero-shot används. Few-shot prompting kan användas som en teknik för att möjliggöra inlärning i kontext där vi tillhandahåller demonstrationer i prompten för att styra modellen till bättre prestanda. Demonstrationerna fungerar som förberedelser för efterföljande exempel där vi vill att modellen ska generera ett svar.

Exempel på inmatning: "Skapa en produktrecension för denna nya telefon baserat på dessa positiva och negativa exempel: Positivt: Jag gillade verkligen telefonens kamera, den tog fantastiska bilder! Negativt: Batteritiden på den här telefonen är fruktansvärd, den räcker inte tillräckligt länge."

Exempel:"Den här telefonens kamera är fantastisk! Bilderna är alltid kristallklara och har livfulla färger. Batteritiden är dock inte så bra och räcker bara i några timmar."

Tankekedja Prompting

Prompting med tankekedjor (CoT) introducerades i Wei et al. (2022) och möjliggör komplexa resonemang genom mellanliggande resonemangssteg. Du kan kombinera det med få-shot-prompting för att få bättre resultat på mer komplexa uppgifter som kräver resonemang innan du svarar.

Kedja av tankegångar

Skapad kunskap Prompting

Generering av kunskap innebär att man utnyttjar externa kunskapsbaser eller genererat innehåll för att förbättra modellens svar. Genom att införliva relevant information i uppmaningarna kan modellerna ge detaljerade och korrekta svar eller generera innehåll baserat på förvärvad kunskap.

genererad kunskap uppmaning

Låt oss se hur det fungerar i praktiken i följande sammanhang:

Bakgrund:
Utbildningspsykologi har länge undersökt effekten av mnemotekniska hjälpmedel på inlärning och minne. En fråga uppstår: Kan användning av mnemotekniska hjälpmedel förbättra studenters förmåga att lagra information?

Startprompt:
Hjälper användningen av mnemotekniska hjälpmedel inom utbildning studenter att behålla information bättre?

Generering av kunskapsprompter:

Inmatning: Mnemotekniska hjälpmedel är verktyg som hjälper människor att komma ihåg information.

Kunskap: Mnemotekniska hjälpmedel utnyttjar mönster av bokstäver, idéer eller associationer som underlättar minnesprocessen. Effektiva mnemotekniska strategier inkluderar skapandet av akrostikon, information i bitar och loci-metoden. Dessa tekniker engagerar både språkliga och spatiala minnessystem, vilket kan leda till förbättrad lagring av information.

Input: Pedagogisk psykologi studerar hur människor lär sig.‍

Kunskap: Utbildningspsykologi är ett tvärvetenskapligt område som kombinerar teorier och metoder från psykologi, sociologi och filosofi för att förstå de kognitiva och affektiva processer som är involverade i inlärning. Denna förståelse tillämpas på undervisningsplanering, utveckling av läroplaner och klassrumshantering i syfte att optimera inlärningsresultaten.

Nu kan vi kombinera denna genererade kunskap för att ta itu med den ursprungliga frågan med en mer informerad utgång.

Integrerad kunskapsbaserad uppmaning:

"Frågeställning: Hjälper användningen av mnemotekniska hjälpmedel i undervisningen studenter att bättre behålla information?

Kunskap 1: Mnemotekniska hjälpmedel använder mönster av bokstäver, idéer eller associationer för att underlätta minnet. Tekniker som akrostik, chunking och loci-metoden engagerar flera minnessystem.

Kunskap 2: Utbildningspsykologi syftar till att optimera inlärningsresultaten genom att förstå kognitiva och affektiva inlärningsprocesser och tillämpa detta på pedagogiska strategier.

Förklara och svara."

Svara på frågan:

"Ja, användningen av mnemotekniska hjälpmedel i undervisningen bidrar till att man lättare kan lagra information. Dessa verktyg engagerar både språkliga och spatiala minnessystem, vilka inom pedagogisk psykologi identifieras som viktiga kognitiva processer vid inlärning. Genom att använda metoder som akrostik eller loci-metoden kan lärare ge eleverna strategier för att återkalla information mer effektivt, vilket leder till högre inlärningsresultat enligt forskning och stöd inom området utbildningspsykologi."

Detta exempel visar hur kunskapsgenerering baserad på relevant information kan ge ett heltäckande och nyanserat svar på komplexa utbildningsfrågor.

Förstärkt generation för hämtning (RAG)

Standardspråkmodeller är anpassningsbara och kan finslipas för en rad typiska uppgifter som sentimentanalys eller identifiering av namngivna enheter. Dessa uppgifter kräver vanligtvis inte att extra faktainformation införlivas.

Men för uppgifter som är mer komplicerade och kräver omfattande kunskap kan man konstruera ett system med språkmodeller som bygger på ytterligare, externa informationskällor. Detta tillvägagångssätt förbättrar den faktiska noggrannheten, stärker tillförlitligheten hos de svar som modellen ger och minskar förekomsten av "hallucinationer" i utdata. Här är ett litet exempel på en RAG-implementering på ZenoChat som arbetar med en extern CSV-fil:

Prompt Engineering Exempel

Prompt engineering används i en mängd olika scenarier för att vägleda AI-prestanda. Här kommer vi att gå igenom några konkreta exempel som belyser konsten och vetenskapen att strukturera uppmaningar effektivt.

Enkla direktiv uppmaningar

För okomplicerade uppgifter, som att be modellen generera en lista eller svara på en direkt fråga, räcker det med enkla direktiv. Dessa uppmaningar är tydliga, koncisa och rakt på sak.

Inmatning: "Lista de sju underverken i den moderna världen."

Utgång: "De sju underverken i den moderna världen inkluderar: 1. Chichén Itzá i Mexiko, 2. Kristus Frälsaren i Brasilien, 3. Kinesiska muren i Kina, 4. Machu Picchu i Peru, 5. Petra i Jordanien, 6. Det romerska Colosseum i Italien, och 7. Taj Mahal i Indien."

Komplexa uppmaningar till instruktioner

När det gäller mer komplicerade förfrågningar, som att skriva en omfattande uppsats eller utveckla en algoritm i flera steg, kommer komplexa instruktionsmeddelanden in i bilden. Dessa uppmaningar ger detaljerad information och skapar förväntningar för AI:n att följa.

Inmatning: "Skriv en omfattande uppsats om klimatförändringarnas inverkan på marin biologisk mångfald, inklusive minst tre viktiga effekter, potentiella lösningar och en slutsats."

Resultat: "Klimatförändringarna har haft en djupgående inverkan på den marina biologiska mångfalden, med stigande temperaturer, havsförsurning och stigande havsnivåer som förändrar de marina arternas hälsa och utbredning. Viktiga effekter är korallblekning, förändringar i arters utbredning och förändringar i häckningstider..."

Uppmaningar till kreativ konceptualisering

Ibland är målet att knuffa AI:n mot att skapa originellt innehåll, som berättelser, dikter eller visuella konstverk. Uppmaningar till kreativ konceptualisering förlitar sig på suggestivt språk och levande beskrivningar för att väcka modellens uppfinningsrikedom.

Inmatning: "Skapa en berättelse om en detektiv som kan kommunicera med djur för att lösa mysterier. Börja med att detektiven får ett kryptiskt meddelande från en papegoja om en försvunnen värdefull kapplöpningshäst."

Produktion: "Detektiv Eliza Thornberrys morgon avbröts av de frenetiska skriken från hennes informatör, en scharlakansröd papegoja vid namn Pascal. 'Den snabba ryttaren har försvunnit före gryningen', skrek han. Eliza var känd för sin unika förmåga att kommunicera med djurriket och visste att detta meddelande bara kunde betyda en sak: den berömda tävlingshästen Lightning Hoof hade blivit stulen ..."

Kontextuell fortsättning uppmaningar

För att fortsätta ett textstycke i samma stil eller för att utveckla ett ämne med kontinuitet används kontextuella fortsättningsuppmaningar. De säkerställer att AI:n känner igen det föregående innehållet och behåller tråden i efterföljande bidrag.

Inmatning: "Fortsätt med följande text i stil med en spänningsroman: 'När klockan slog midnatt gled en skugga in genom det spruckna fönstret. Kassaskåpet, som skulle skydda familjens hundraåriga hemlighet, var nu vidöppet."

Output: "Det en gång så tysta rummet vibrerade av spänningen från det nyfunna intrånget. Med hjärtat i halsgropen skannade inkräktarens ögon den svagt upplysta interiören, månskenet glittrade i metallkassaskåpets exponerade innehåll. Med familjens förbjudna historia inom räckhåll balanserade mysteriet på gränsen till avslöjande. Vad de inte visste var att ett annat par ögon såg på från mörkret, vittnen till den konspiration som höll på att utvecklas."

Detta är bara några exempel på hur prompt engineering formar dialogen mellan människor och AI, vilket i slutändan påverkar effektiviteten hos algoritmens resultat.

Om du som promptingenjör behärskar dessa tekniker och vet när du ska använda dem kan du avsevärt förbättra interaktiviteten och användbarheten hos AI-genererat innehåll.

Uppmaningar för bildgenerering

Uppmaningar för bildgenerering vägleder AI att omvandla textbeskrivningar till övertygande visuella bilder. Nyckeln är att ge tillräckligt med detaljer för att hjälpa modellen att föreställa sig och återge konceptet korrekt.

Illustrativa uppmaningar till visualisering

Inmatning: "Skapa en bild av ett lugnt landskap med en liten stuga vid en sjö, med berg i bakgrunden som är höljda i dimma, under den gyllene timmen av solnedgången."

Uppmaningar för konceptkonst av karaktärer

Inmatning: "Skapa en bild av ett karaktärskoncept för en steampunk-uppfinnare, komplett med kläder från den viktorianska eran prydda med mässingsprylar, med en specialgjord skiftnyckel i handen och glasögon vilande på hatten."

Mockup-förslag för produktdesign

Inmatning: "Skapa en bild av en elegant, modern smartphone-design med en böjd glasskärm, en skärm utan kanter och en interaktiv AI-assistent på skärmen."

Konceptkonst för fiktiva uppmaningar

Inmatning: "Visa en bild av en livlig utomjordisk marknad på en rymdstation, med olika intergalaktiska arter som handlar med exotiska varor under neonskyltar i en rad olika utomjordiska skript."