Numa era em que a inteligência artificial se integra perfeitamente nas nossas tarefas diárias, a eficiência das nossas interacções com estes sistemas avançados tornou-se fundamental. A ponte entre a intenção humana e a compreensão da máquina é construída através de um processo simultaneamente subtil e crucial - é aqui que entramos no mundo da engenharia de prontidão em IA. É um campo que combina competências linguísticas com conhecimentos técnicos para conseguir uma comunicação mais eficaz com a IA. Vamos explorar mais este conceito e compreender o seu significado no panorama tecnológico moderno.

TL;DR

  • A integração da IA nas tarefas diárias realça a necessidade de interacções eficientes com sistemas avançados.
  • A engenharia imediata em IA combina a competência linguística com o conhecimento técnico para uma comunicação eficaz da IA.
  • Um prompt em IA é uma instrução baseada em texto que ajuda a produzir resultados específicos a partir de modelos de linguagem.
  • A engenharia imediata envolve a criação de entradas para otimizar as respostas da IA.
  • A evolução de modelos linguísticos abrangentes, como o GPT-3 e o GPT-4, sublinhou a importância da engenharia de prontidão.
  • A engenharia imediata conduziu ao aparecimento de "engenheiros imediatos" ou "sussurradores de IA".
  • As técnicas essenciais de engenharia de estímulos incluem o estímulo zero, o estímulo de poucos estímulos, a cadeia de pensamento, o estímulo de conhecimento gerado e a geração aumentada por recuperação.
  • As aplicações de engenharia de prompts variam desde simples prompts de diretiva a prompts de instrução complexos e prompts criativos.
  • A engenharia de prompts também envolve prompts contextuais que asseguram a continuidade na expansão do texto.
  • Os avisos de geração de imagens na IA convertem descrições textuais detalhadas em imagens.
  • Diferentes tipos de sugestões de geração de imagens destinam-se à visualização de paisagens, arte concetual de personagens, maquetas de design de produtos e arte concetual para ficção.
  • Podes começar a aprender engenharia rápida através do nosso canal do YouTube.

O que é a engenharia rápida na IA?

O conceito de engenharia de prontidão surge no domínio da IA, em que a entrada de texto fornecida através de linhas de comando é cuidadosamente elaborada e afinada de forma a que a IA produza os resultados mais proficientes. Tem uma aplicação especial em plataformas de IA generativas que requerem entradas textuais, tais como modelos de linguagem expansivos, chatbots envolventes e modelos imaginativos de texto para imagem. Assim, o papel de um engenheiro de prontidão tomou forma a partir da necessidade de uma engenharia de prontidão competente.

O que é um prompt de IA?

Um prompt de IA estabelece um canal de comunicação entre um utilizador e um modelo linguístico sofisticado, orientando o modelo para produzir um tipo específico de resultados. Esta interface pode manifestar-se sob a forma de consultas, entradas textuais, excertos de codificação ou casos ilustrativos.

Como funciona a engenharia rápida?

A engenharia de instruções centra-se no desenvolvimento e aperfeiçoamento das directivas dadas a uma IA sob a forma de texto e contexto, garantindo que os resultados da IA são óptimos. A terminologia "prompt" refere-se especialmente às instruções baseadas em texto que alimentam os sistemas de IA generativa, como os modelos de linguagem extensiva (LLM), os chatbots interactivos ou os modelos criativos de texto para imagem, como o Midjourney.

À luz da introdução de modelos linguísticos abrangentes, como o GPT-3 ou o GPT-4, e da criação de sistemas de chatbot, como o ChatGPT, com base neles, juntamente com modelos robustos de texto-imagem, como o DALL-E, o Stable Diffusion ou o Midjourney, a importância da engenharia de prontidão tornou-se cada vez mais importante. Consequentemente, surgiu uma nova nomenclatura profissional sob a forma de "Engenheiro de prontidão", ocasionalmente referido num tom mais descontraído como "sussurrador de IA" ou "intérprete de IA".

A engenharia de prompts ganhou força, uma vez que a essência do resultado gerado pela IA está intimamente ligada às directivas e orientações textuais da tarefa fornecidas através de interfaces de linha de comandos. Para que a IA compreenda corretamente a tarefa e forneça informações e contexto suficientemente adequados para a realizar, é imperativo que o faça de forma a corresponder às expectativas do utilizador e a ter uma utilidade genuína. A engenharia imediata está a evoluir rapidamente neste domínio dinâmico e em expansão.

Como aprender a fazer engenharia de prontidão?

As competências ou a experiência em aprendizagem automática podem beneficiar o teu trabalho como engenheiro de prontidão. Por exemplo, a aprendizagem automática pode ser utilizada para prever o comportamento do utilizador com base na forma como os utilizadores interagiram com um sistema no passado. Os engenheiros de mensagens podem então aperfeiçoar a forma como apresentam um LLM para gerar material para experiências do utilizador.

Em alternativa, podes começar a aprender engenharia de prompts através do nosso canal do YouTube. Temos vários vídeos que te ensinam a criar prompts eficientes para LLMs.

Melhores práticas de engenharia rápida

Cria instruções directas e compreensíveis

Assegura-te de que as tuas orientações são precisas e inteligíveis. Quanto mais claramente articulares as tuas necessidades, melhor o modelo te poderá servir. Para respostas sucintas, pede brevidade. Para um discurso mais avançado, especifica o requisito de um conteúdo de nível especializado. Se achares que o formato não é adequado, dá um exemplo preferido para o modelo imitar. As instruções directas aumentam a probabilidade de obteres o resultado pretendido.

Fornece referências suficientes

Tem em atenção que os modelos linguísticos de IA têm a capacidade de produzir informações incorrectas, especialmente no caso de assuntos obscuros ou quando são solicitadas fontes. Tal como as notas podem melhorar o desempenho de um aluno nos exames, equipar o modelo com textos de referência, URLs ou documentos pode reduzir significativamente as hipóteses de informações incorrectas.

Divide as tarefas complexas

Aborda os inquéritos complexos de forma estratégica, dividindo-os em partes mais pequenas e mais fáceis de gerir. Isto reflecte as melhores práticas da engenharia de software, em que os sistemas são construídos de forma modular. Simplificar a tarefa aumenta a precisão do modelo e permite a criação de um fluxo de trabalho passo a passo, em que cada fase se baseia na anterior.

Testa os teus avisos sistematicamente

Para uma melhoria consistente do desempenho, é imperativo testar sistematicamente os prompts. Por vezes, uma alteração pode melhorar um único caso, mas pode ser prejudicial quando aplicada de forma generalizada. Recomenda-se que avalies continuamente os prompts em vários cenários, estabelecendo templates para os prompts que produzem consistentemente as respostas mais precisas e úteis.

Exemplo de um pedido de qualidade: 

Cria um resumo conciso, escrito em tom profissional, sobre o tema das soluções de energia sustentável. O resumo não deve ter mais de 300 palavras. Inclui as últimas tendências em energia solar e eólica e certifica-te de que citas estatísticas recentes do relatório 2023 da AIE (Agência Internacional de Energia). O formato de saída deve ser uma lista de pontos.

Analisa este aviso:

Cria um resumo conciso, escrito em tom profissional, sobre o tema das soluções de energia sustentável (Instruções claras que definem o tom e o tema). O resumo não deve ter mais de 300 palavras (Estabelece um requisito específico de comprimento). Inclui as últimas tendências em energia solar e eólica e certifica-te de que citas estatísticas recentes do relatório 2023 da AIE (Agência Internacional de Energia) (Orienta o modelo no sentido de incluir conteúdos específicos e de utilizar referências factuais para aumentar a exatidão). O formato de saída deve ser uma lista de pontos (Indica claramente o formato preferido)

Técnicas de Engenharia Rápidas

Agora que já sabes o que é a engenharia de prompts e o projeto prático com que vais trabalhar, está na altura de mergulhar em algumas técnicas comuns de engenharia de prompts. Nesta secção, vais aprender a aplicar as seguintes técnicas aos teus prompts para obteres o resultado desejado do modelo de linguagem.

Prompting de disparo zero

Faz uma pergunta normal ao modelo de linguagem sem qualquer contexto adicional. Repara que, na pergunta acima, não fornecemos ao modelo quaisquer exemplos de texto juntamente com as suas classificações, o LLM já compreende o "sentimento" - são as capacidades de "zero-shot" a funcionar. Quando a opção "zero-shot" não funciona, recomenda-se que forneças demonstrações ou exemplos na pergunta, o que leva a uma pergunta de poucas tentativas. Na próxima secção, demonstramos a solicitação de poucos disparos.

Exemplo de entrada: "Qual é o sentimento do seguinte texto: 'Apetece-me dançar sempre que ouço esta música!'"

Exemplo de saída: "O sentimento do texto é positivo."

Prompting de poucos disparos

Condiciona o modelo a alguns exemplos para melhorar o seu desempenho. Apesar de os modelos de línguas grandes demonstrarem capacidades notáveis em tarefas com zero exemplos, continuam a ser insuficientes em tarefas mais complexas quando utilizam a definição de zero exemplos. O prompting de poucos exemplos pode ser utilizado como uma técnica para permitir a aprendizagem em contexto, em que fornecemos demonstrações no prompt para orientar o modelo para um melhor desempenho. As demonstrações servem como condicionamento para exemplos subsequentes em que gostaríamos que o modelo gerasse uma resposta.

Exemplo de entrada: "Cria uma análise do produto para este novo telemóvel com base nestes exemplos positivos e negativos: Positivo: Gostei muito da câmara do telemóvel, tira fotografias fantásticas! Negativo: A duração da bateria deste telemóvel é terrível, não dura o suficiente.

Exemplo de resposta:"A câmara deste telemóvel é fantástica! As fotografias são sempre nítidas e têm cores vibrantes. No entanto, a duração da bateria não é muito boa e só dura algumas horas."

Prompting de cadeia de pensamento

Introduzido em Wei et al. (2022), o estímulo de cadeia de raciocínio (CoT) permite capacidades de raciocínio complexas através de passos de raciocínio intermédios. Podes combiná-lo com a solicitação de poucos disparos para obteres melhores resultados em tarefas mais complexas que requerem raciocínio antes de responder.

Cadeia de pensamento

Conhecimento gerado Prompting

A solicitação de conhecimento gerado envolve a utilização de bases de conhecimento externas ou conteúdo gerado para melhorar as respostas do modelo. Ao incorporar informações relevantes nos avisos, os modelos podem fornecer respostas detalhadas e precisas ou gerar conteúdo com base no conhecimento adquirido.

conhecimentos gerados, incitando

Vamos ver como funciona na prática no seguinte contexto:

Contexto:
A psicologia da educação há muito que analisa o impacto dos dispositivos mnemónicos na aprendizagem e na memória. Coloca-se uma questão: Poderá a utilização de dispositivos mnemónicos melhorar a retenção de informação dos alunos?

Pergunta inicial:
A utilização de dispositivos mnemónicos no ensino ajuda os alunos a reter melhor a informação?

Prompts de conhecimento gerados:

Introduzir: Os dispositivos mnemónicos são ferramentas que ajudam as pessoas a recordar informações.

Conhece: Os dispositivos mnemónicos utilizam padrões de letras, ideias ou associações que ajudam no processo de memorização. As estratégias mnemónicas eficazes incluem a criação de acrósticos, a fragmentação da informação e o método dos loci. Estas técnicas envolvem os sistemas de memória linguística e espacial, o que pode levar a uma melhor retenção da informação.

Introduz: A psicologia educacional estuda como as pessoas aprendem.

Conhecimentos: A psicologia educacional é um campo interdisciplinar que combina teorias e metodologias da psicologia, sociologia e filosofia para compreender os processos cognitivos e afectivos envolvidos na aprendizagem. Aplica esta compreensão à conceção pedagógica, ao desenvolvimento curricular e à gestão da sala de aula, com o objetivo de otimizar os resultados da aprendizagem.

Agora, podemos combinar este conhecimento gerado para responder à pergunta inicial com um resultado mais informado.

Prompt integrado baseado no conhecimento:

"Pergunta: A utilização de dispositivos mnemónicos na educação ajuda os alunos a reter melhor a informação?

Conhecimento 1: Os dispositivos mnemónicos utilizam padrões de letras, ideias ou associações para ajudar a memória. Técnicas como o acróstico, o chunking e o método de loci envolvem múltiplos sistemas de memória.

Conhecimento 2: A psicologia da educação procura otimizar os resultados da aprendizagem através da compreensão dos processos de aprendizagem cognitivos e afectivos e da sua aplicação a estratégias pedagógicas.

Explica e responde".

Responde:

"Sim, a utilização de dispositivos mnemónicos na educação contribui para uma melhor retenção da informação. Estas ferramentas envolvem os sistemas de memória linguística e espacial, que a psicologia da educação identifica como processos cognitivos fundamentais para a aprendizagem. Ao utilizar métodos como o acróstico ou o método de loci, os educadores podem fornecer aos alunos estratégias para recordar a informação de forma mais eficaz, conduzindo a resultados de aprendizagem mais elevados, tal como investigado e apoiado no campo da psicologia educacional."

Este exemplo mostra como a geração de conhecimentos com base em informações relevantes pode dar uma resposta abrangente e diferenciada a questões educativas complexas.

Geração Aumentada de Recuperação (RAG)

Os modelos linguísticos padrão são adaptáveis e podem ser aperfeiçoados para uma série de tarefas típicas, como a análise de sentimentos ou a identificação de entidades nomeadas. Estas operações não necessitam normalmente da incorporação de informação factual adicional.

No entanto, para tarefas mais complexas e que exijam conhecimentos alargados, é possível construir um sistema que utilize modelos linguísticos que recorram a fontes de informação adicionais e externas. Esta abordagem aumenta a precisão factual, reforça a fiabilidade das respostas fornecidas pelo modelo e serve para reduzir as instâncias de "alucinação" na saída. Aqui está um pequeno exemplo de uma implementação RAG no ZenoChat a trabalhar com um ficheiro CSV externo:

Exemplos de Engenharia Rápida

A engenharia de prompts é aplicada numa diversidade de cenários para orientar o desempenho da IA. Aqui, vamos analisar alguns exemplos tangíveis que ilustram a arte e a ciência de estruturar prompts de forma eficaz.

Instruções de diretiva simples

Para tarefas simples, como pedir ao modelo para gerar uma lista ou responder a uma pergunta direta, são suficientes instruções simples. Estes avisos são claros, concisos e directos.

Introduz: "Enumera as sete maravilhas do mundo moderno."

Sai: "As sete maravilhas do mundo moderno incluem: 1. Chichén Itzá no México, 2. Cristo Redentor no Brasil, 3. A Grande Muralha da China na China, 4. Machu Picchu no Peru, 5. Petra na Jordânia, 6. O Coliseu Romano na Itália, e 7. O Taj Mahal, na Índia".

Instruções complexas

Quando lida com pedidos mais complexos, como a redação de um ensaio abrangente ou a conceção de um algoritmo de várias etapas, entram em jogo prompts de instrução complexos. Estes avisos fornecem informações detalhadas, definindo as expectativas que a IA deve seguir.

Introduz: "Escreve um ensaio completo sobre o impacto das alterações climáticas na biodiversidade marinha, incluindo pelo menos três efeitos principais, potenciais soluções e uma conclusão."

Apresenta os resultados: "As alterações climáticas têm tido um impacto profundo na biodiversidade marinha, com o aumento das temperaturas, a acidificação dos oceanos e a subida do nível do mar a alterar a saúde e a distribuição das espécies marinhas. Os principais efeitos incluem o branqueamento dos corais, mudanças na distribuição das espécies e alterações nos períodos de reprodução..."

Sugestões de concetualização criativa

Por vezes, o objetivo é incentivar a IA a criar conteúdo original, como histórias, poemas ou obras de arte visuais. Os pedidos de concetualização criativa baseiam-se numa linguagem evocativa e em descrições vívidas para estimular o engenho do modelo.

Introduz: "Cria uma história sobre um detetive que consegue comunicar com animais para resolver mistérios. Começa com o detetive a receber uma mensagem enigmática de um papagaio sobre o desaparecimento de um cavalo de corrida premiado."

Sai: "A manhã da detetive Eliza Thornberry foi interrompida pelos gritos frenéticos do seu informador, um papagaio escarlate chamado Pascal. 'O veloz corcel desapareceu antes do amanhecer', gritou ele. Conhecida pela sua capacidade única de comunicar com o reino animal, Eliza sabia que esta mensagem só podia significar uma coisa: o famoso cavalo de corrida, Lightning Hoof, tinha sido roubado..."

Prompts de continuação contextual

Para continuar um texto no mesmo estilo ou para desenvolver um tópico com continuidade, são utilizados avisos de continuação contextual. Assegura que a IA reconhece o conteúdo anterior e mantém o fio condutor nas contribuições subsequentes.

Introduz: "Continua o seguinte texto ao estilo de um romance de suspense: 'Quando o relógio bateu a meia-noite, uma sombra deslizou pela janela rachada. O cofre, que se pensava guardar o segredo centenário da família, estava agora escancarado.'"

Sai: "A sala, outrora silenciosa, vibrava com a tensão da nova brecha. Com o coração acelerado, os olhos do intruso examinaram o interior pouco iluminado, a luz da lua brilhando no conteúdo exposto do cofre de metal. Com a história proibida da família ao alcance da mão, o mistério estava à beira da revelação. Mal sabiam eles que outro par de olhos observava da escuridão, testemunha da conspiração que se desenrolava."

Estas são apenas algumas ilustrações de como a engenharia rápida molda o diálogo entre os humanos e a IA, influenciando, em última análise, a eficácia do resultado do algoritmo.

Como engenheiro de prontidão, o domínio destas técnicas e o reconhecimento de quando as aplicar pode melhorar significativamente a interatividade e a utilidade do conteúdo gerado pela IA.

Geração de imagens

As instruções para a criação de imagens orientam a IA para converter descrições textuais em imagens atraentes. A chave é fornecer pormenores suficientes para ajudar o modelo a visualizar e a representar o conceito com precisão.

Sugestões de visualização ilustrativas

Introduzir: "Desenha uma imagem de uma paisagem serena com uma pequena casa de campo junto a um lago, com montanhas ao fundo envoltas em nevoeiro, durante a hora dourada do pôr do sol."

Sugestões de arte concetual de personagens

Introduz: "Cria uma imagem de um conceito de personagem para um inventor steampunk, completo com roupas da era vitoriana adornadas com engenhocas de latão, segurando uma chave inglesa feita à medida, com óculos de proteção apoiados no chapéu."

Sugestões para maquetas de design de produtos

Introduz: "Gera uma imagem de um smartphone com um design elegante e moderno, com um ecrã de vidro curvo, um ecrã sem moldura e um assistente de IA interativo no ecrã."

Conceito de arte para propostas de ficção

Introduz: "Descreve uma imagem de um mercado alienígena movimentado numa estação espacial, com várias espécies intergalácticas a comercializar bens exóticos sob letreiros de néon numa série de escritas alienígenas."