En una era en la que la inteligencia artificial se integra perfectamente en nuestras tareas cotidianas, la eficacia de nuestras interacciones con estos sistemas avanzados se ha convertido en algo primordial. El puente entre la intención humana y la comprensión de la máquina se construye mediante un proceso a la vez sutil y crucial: aquí es donde entramos en el mundo de la ingeniería rápida en IA. Es un campo que combina la habilidad lingüística con los conocimientos técnicos para lograr una comunicación más eficaz con la IA. Exploremos más a fondo este concepto y comprendamos su importancia en el panorama tecnológico moderno.

TL;DR

  • La integración de la IA en las tareas cotidianas pone de relieve la necesidad de interacciones eficientes con sistemas avanzados.
  • La ingeniería pronta en IA fusiona la habilidad lingüística con el conocimiento técnico para una comunicación eficaz en IA.
  • Una instrucción en IA es una instrucción basada en texto que ayuda a producir resultados específicos a partir de modelos lingüísticos.
  • La ingeniería pronta consiste en elaborar entradas para optimizar las respuestas de la IA.
  • La evolución de modelos lingüísticos integrales como GPT-3 y GPT-4 ha puesto de relieve la importancia de la ingeniería de prontitud.
  • La ingeniería pronta ha dado lugar a la aparición de "ingenieros prontos" o "susurradores de IA".
  • Entre las técnicas esenciales de ingeniería de avisos se incluyen el disparo cero, los pocos disparos, la cadena de pensamiento, el aviso de conocimiento generado y la generación aumentada por recuperación.
  • Las aplicaciones de la ingeniería de instrucciones varían desde instrucciones sencillas hasta instrucciones complejas e instrucciones creativas.
  • La ingeniería de indicaciones también implica indicaciones contextuales que garanticen la continuidad en la expansión del texto.
  • Las indicaciones de generación de imágenes en IA convierten descripciones textuales detalladas en visuales.
  • Los distintos tipos de mensajes de generación de imágenes se adaptan a la visualización de paisajes, al arte conceptual de personajes, a las maquetas de diseño de productos y al arte conceptual para la ficción.
  • Puedes empezar a aprender ingeniería rápida a través de nuestro canal de YouTube.

¿Qué es la ingeniería rápida en IA?

El concepto de ingeniería de instrucciones surge en el ámbito de la IA, donde la entrada basada en texto que se da a través de líneas de comandos se elabora cuidadosamente y se ajusta de tal manera que la IA produzca los resultados más competentes. Tiene una aplicación especial en las plataformas de IA generativa que requieren entradas textuales, como los modelos lingüísticos expansivos, los chatbots atractivos y los modelos imaginativos de texto a imagen. De ahí que el papel de un ingeniero de prontitud haya tomado forma a partir de la necesidad de una ingeniería de prontitud competente.

¿Qué es un aviso de IA?

Una consulta de IA establece un canal comunicativo entre un usuario y un modelo lingüístico sofisticado, guiando al modelo para que produzca un tipo específico de salida. Esta interfaz puede manifestarse como consultas, entradas textuales, extractos de codificación o casos ilustrativos.

¿Cómo funciona la ingeniería rápida?

La ingeniería de instrucciones se centra en desarrollar y perfeccionar las directrices que se dan a una IA en forma de texto y contexto, garantizando que los resultados de la IA sean óptimos. La terminología "prompt" se refiere especialmente a las instrucciones basadas en texto que reciben los sistemas generativos de IA, como los modelos extensivos de lenguaje (LLM), los chatbots interactivos o los modelos creativos de texto a imagen, como Midjourney.

A la luz de la introducción de modelos lingüísticos completos como GPT-3 o GPT-4, y de la creación de sistemas de chatbot como ChatGPT basados en ellos, junto con modelos robustos de conversión de texto en imagen como DALL-E, Stable Diffusion o Midjourney, la importancia de la ingeniería de prontos es cada vez mayor. En consecuencia, ha surgido una nueva nomenclatura profesional en forma de "ingeniero de prontos", a la que en ocasiones se hace referencia en un tono más relajado como "susurrador de IA" o "intérprete de IA".

La ingeniería de instrucciones ha cobrado impulso, ya que la esencia de la salida generada por la IA está íntimamente ligada a las directivas y directrices textuales de la tarea proporcionadas a través de las interfaces de línea de comandos. Para que la IA comprenda correctamente la tarea y proporcione la información y el contexto adecuados para llevarla a cabo, es imprescindible que lo haga de forma que se ajuste a las expectativas del usuario y sea de auténtica utilidad. La ingeniería pronta evoluciona rápidamente en este campo dinámico y floreciente.

¿Cómo aprender ingeniería rápida?

Las habilidades o la experiencia en aprendizaje automático pueden beneficiar tu trabajo como ingeniero rápido. Por ejemplo, el aprendizaje automático puede utilizarse para predecir el comportamiento de los usuarios basándose en cómo han interactuado con un sistema en el pasado. Los ingenieros de avisos pueden entonces perfeccionar la forma en que avisan a un LLM para que genere material para las experiencias de los usuarios.

Alternativamente, puedes empezar a aprender ingeniería de avisos a través de nuestro canal de YouTube. Te ofrecemos varios vídeos para que aprendas a crear avisos eficaces para los LLM.

Buenas prácticas de ingeniería rápida

Crea instrucciones directas y comprensibles

Asegúrate de que tus orientaciones sean precisas e inteligibles. Cuanto más claramente articules tus necesidades, mejor podrá servirte el modelo. Para respuestas sucintas, solicita brevedad. Para un discurso más avanzado, especifica la exigencia de un contenido de nivel experto. Si el formato te parece inadecuado, proporciona un ejemplo preferido para que el modelo lo emule. Las instrucciones directas aumentan la probabilidad de recibir el resultado deseado.

Suministra Referencias Suficientes

Ten en cuenta que los modelos lingüísticos de IA tienen la capacidad de producir información inexacta, sobre todo con temas oscuros o cuando se les piden fuentes. Del mismo modo que los apuntes pueden mejorar el rendimiento de un alumno en un examen, dotar al modelo de textos de referencia, URL o documentos puede reducir significativamente las posibilidades de obtener información incorrecta.

Desglosa las tareas complejas

Aborda las cuestiones complejas de forma estratégica, dividiéndolas en partes más pequeñas y manejables. Esto refleja las mejores prácticas en ingeniería de software, donde los sistemas se construyen modularmente. Simplificar la tarea aumenta la precisión del modelo y permite crear un flujo de trabajo paso a paso, en el que cada etapa se basa en la anterior.

Prueba sistemáticamente tus indicaciones

Para conseguir una mejora coherente del rendimiento, es imprescindible probar las indicaciones sistemáticamente. A veces, una modificación puede mejorar un solo caso, pero podría ser perjudicial si se aplica de forma generalizada. Se recomienda evaluar continuamente los avisos en varios escenarios, estableciendo templates para los avisos que produzcan sistemáticamente las respuestas más precisas y útiles.

Ejemplo de un aviso de calidad: 

Elabora un resumen conciso escrito en tono profesional sobre el tema de las soluciones energéticas sostenibles. El resumen no debe superar las 300 palabras. Por favor, incluye las últimas tendencias en energía solar y eólica, y asegúrate de citar estadísticas recientes del informe 2023 de la AIE (Agencia Internacional de la Energía). El formato de salida debe ser una lista de viñetas.

Análisis de este aviso:

Crea un resumen conciso escrito en tono profesional sobre el tema de las soluciones energéticas sostenibles (Instrucciones claras que definan el tono y el tema). El resumen no debe superar las 300 palabras (Establece un requisito específico de longitud). Incluye las últimas tendencias en energía solar y eólica, y asegúrate de citar estadísticas recientes del informe 2023 de la AIE (Agencia Internacional de la Energía). (Orienta al modelo para que incluya contenidos específicos y utilice referencias factuales para aumentar la precisión). El formato de salida debe ser una lista de viñetas (Establece claramente el formato preferido)

Técnicas de ingeniería rápidas

Ahora que ya conoces la ingeniería de instrucciones y el proyecto práctico con el que vas a trabajar, es hora de que te sumerjas en algunas técnicas comunes de ingeniería de instrucciones. En esta sección, aprenderás a aplicar las siguientes técnicas a tus avisos para obtener el resultado deseado del modelo lingüístico.

Aviso de disparo cero

Hacer al modelo lingüístico una pregunta normal sin ningún contexto adicional. Observa que en la pregunta anterior no proporcionamos al modelo ningún ejemplo de texto junto con sus clasificaciones, el LLM ya entiende el "sentimiento": esa es la capacidad de disparo cero en funcionamiento. Cuando no funciona la función de "disparo cero", se recomienda proporcionar demostraciones o ejemplos en la pregunta, lo que conduce a la función de "pocos disparos". En la siguiente sección, te mostraremos cómo hacerlo.

Ejemplo de entrada: "¿Cuál es el sentimiento del siguiente texto: 'Tengo ganas de bailar cada vez que oigo esta canción'?"

Ejemplo de salida: "El sentimiento del texto es positivo".

Pocos disparos

Condicionar el modelo a unos pocos ejemplos para aumentar su rendimiento. Aunque los modelos de gran lenguaje demuestran notables capacidades en cero disparos, siguen quedándose cortos en tareas más complejas cuando se utiliza el condicionamiento en cero disparos. Los avisos de pocos disparos pueden utilizarse como técnica para permitir el aprendizaje en contexto, en el que proporcionamos demostraciones en el aviso para dirigir el modelo hacia un mejor rendimiento. Las demostraciones sirven de condicionamiento para los ejemplos posteriores en los que queremos que el modelo genere una respuesta.

Ejemplo de entrada: "Genera una reseña del producto para este nuevo teléfono basándote en estos ejemplos positivos y negativos: Positivos: Me gustó mucho la cámara del teléfono, ¡hace unas fotos increíbles! Negativo: La duración de la batería de este teléfono es terrible, no dura lo suficiente".

Ejemplo de salida:"¡La cámara de este teléfono es fantástica! Las fotos son siempre nítidas y tienen colores vibrantes. Sin embargo, la duración de la batería no es muy buena y sólo dura unas horas".

Estimulación de la cadena de pensamiento

Introducido en Wei et al. (2022), el estímulo de cadena de pensamiento (CoT) permite capacidades de razonamiento complejas mediante pasos de razonamiento intermedios. Puedes combinarlo con el guiado de pocos pasos para obtener mejores resultados en tareas más complejas que requieran razonar antes de responder.

Encadenamiento de ideas

Prompting de conocimiento generado

Las indicaciones de conocimiento generado implican aprovechar bases de conocimiento externas o contenido generado para mejorar las respuestas del modelo. Al incorporar información relevante a las indicaciones, los modelos pueden proporcionar respuestas detalladas y precisas o generar contenido basado en el conocimiento adquirido.

conocimiento generado incitación

Veamos cómo funciona en la práctica en el siguiente contexto:

Contexto:
La psicología de la educación ha examinado durante mucho tiempo el impacto de los dispositivos mnemotécnicos en el aprendizaje y la memoria. Se plantea una pregunta: ¿Puede la utilización de dispositivos mnemotécnicos mejorar la retención de información en los alumnos?

Starting Prompt:
¿El uso de dispositivos mnemotécnicos en la educación ayuda a los alumnos a retener mejor la información?

Sugerencias de conocimiento generadas:

Entrada: Los dispositivos mnemotécnicos son herramientas que ayudan a las personas a recordar información.

Conocimiento: Los dispositivos mnemotécnicos aprovechan patrones de letras, ideas o asociaciones que ayudan en el proceso de memorización. Las estrategias mnemotécnicas eficaces incluyen la creación de acrósticos, la fragmentación de la información y el método de los loci. Estas técnicas implican a los sistemas de memoria lingüística y espacial, lo que puede mejorar la retención de la información.

Aportación: La psicología de la educación estudia cómo aprenden las personas.

Conocimientos: La psicología educativa es un campo interdisciplinar que combina teorías y metodologías de la psicología, la sociología y la filosofía para comprender los procesos cognitivos y afectivos implicados en el aprendizaje. Aplica esta comprensión al diseño instructivo, el desarrollo curricular y la gestión del aula, con el objetivo de optimizar los resultados del aprendizaje.

Ahora, podemos combinar este conocimiento generado para abordar la pregunta inicial con una salida más informada.

Aviso integrado basado en el conocimiento:

"Pregunta: ¿El uso de dispositivos mnemotécnicos en la educación ayuda a los alumnos a retener mejor la información?

Conocimiento 1: Los dispositivos mnemotécnicos utilizan patrones de letras, ideas o asociaciones para ayudar a la memoria. Técnicas como los acrósticos, el chunking y el método de los loci implican múltiples sistemas de memoria.

Conocimiento 2: La psicología de la educación trata de optimizar los resultados del aprendizaje mediante la comprensión de los procesos cognitivos y afectivos del aprendizaje y su aplicación a las estrategias pedagógicas.

Explícate y responde".

Contesta:

"Sí, el uso de dispositivos mnemotécnicos en la educación favorece una mejor retención de la información. Estas herramientas activan los sistemas de memoria lingüística y espacial, que la psicología educativa identifica como procesos cognitivos clave en el aprendizaje. Mediante el uso de métodos como el acróstico o el método de loci, los educadores pueden proporcionar a los alumnos estrategias para recordar la información de forma más eficaz, lo que conduce a resultados de aprendizaje más elevados, tal y como se ha investigado y apoyado en el campo de la psicología educativa."

Este ejemplo muestra cómo la generación de conocimientos basados en información relevante puede dar una respuesta completa y matizada a cuestiones educativas complejas.

Generación Aumentada de Recuperación (RAG)

Los modelos lingüísticos estándar son adaptables y pueden perfeccionarse para una serie de tareas típicas, como el análisis de sentimientos o la identificación de entidades con nombre. Estas operaciones no suelen requerir la incorporación de información factual adicional.

Sin embargo, para tareas más complejas y que exigen amplios conocimientos, se puede construir un sistema que utilice modelos lingüísticos que recurran a fuentes de información externas adicionales. Este enfoque mejora la precisión de los hechos, refuerza la fiabilidad de las respuestas proporcionadas por el modelo y sirve para reducir los casos de "alucinación" en el resultado. Aquí tienes un pequeño ejemplo de una implementación de RAG en ZenoChat trabajando con un archivo CSV externo:

Ejemplos de Ingeniería Prompt

La ingeniería de instrucciones se aplica en diversos escenarios para guiar el rendimiento de la IA. Aquí repasaremos algunos ejemplos tangibles que ilustran el arte y la ciencia de estructurar instrucciones de forma eficaz.

Instrucciones sencillas

Para tareas sencillas, como pedirle al modelo que genere una lista o que responda a una consulta directa, basta con instrucciones sencillas. Estas indicaciones son claras, concisas y directas.

Entrada: "Enumera las siete maravillas del mundo moderno".

Salida: "Las siete maravillas del mundo moderno incluyen: 1. Chichén Itzá en México, 2. La Estatua del Cristo Redentor en Brasil, 3. La Gran Muralla China en China, 4. Machu Picchu en Perú, 5. Petra en Jordania, 6. El Coliseo Romano en Italia, y 7. El Taj Mahal en India. El Taj Mahal en la India".

Instrucciones complejas

Cuando se trata de solicitudes más complejas, como redactar un ensayo exhaustivo o idear un algoritmo de varios pasos, entran en juego las instrucciones complejas. Estas instrucciones proporcionan información detallada, estableciendo las expectativas que debe seguir la IA.

Entrada: "Escribe un ensayo completo sobre el impacto del cambio climático en la biodiversidad marina, incluyendo al menos tres efectos clave, posibles soluciones y una conclusión."

Resultados: "El cambio climático ha tenido un profundo impacto en la biodiversidad marina, ya que el aumento de las temperaturas, la acidificación de los océanos y la subida del nivel del mar han alterado la salud y la distribución de las especies marinas. Los efectos clave incluyen la decoloración de los corales, los cambios en la distribución de las especies y los cambios en los tiempos de reproducción..."

Sugerencias para la conceptualización creativa

A veces, el objetivo es empujar a la IA a crear contenido original, como historias, poemas u obras de arte visuales. Las indicaciones de conceptualización creativa se basan en un lenguaje evocador y descripciones vívidas para despertar el ingenio del modelo.

Entrada: "Crea una historia sobre un detective que puede comunicarse con los animales para resolver misterios. Empieza con el detective recibiendo un mensaje críptico de un loro sobre un preciado caballo de carreras desaparecido".

Salida: "La mañana de la detective Eliza Thornberry se vio interrumpida por los frenéticos graznidos de su informador, un loro escarlata llamado Pascal. 'El veloz corcel ha desaparecido antes del amanecer', graznó. Conocida por su capacidad única para comunicarse con el reino animal, Eliza sabía que este mensaje sólo podía significar una cosa: el famoso caballo de carreras, Pezuña de Rayo, había sido robado..."

Indicaciones contextuales de continuación

Para continuar un texto en el mismo estilo o ampliar un tema con continuidad, se utilizan las indicaciones contextuales de continuación. Garantizan que la IA reconozca el contenido precedente y mantenga el hilo en las contribuciones posteriores.

Entrada: "Continúa el siguiente texto al estilo de una novela de suspense: 'Cuando el reloj dio la medianoche, una sombra se deslizó por la ventana agrietada. La caja fuerte, que se creía que protegía el secreto centenario de la familia, estaba ahora abierta de par en par'".

Salida: "La habitación, antes silenciosa, vibraba con la tensión de la nueva brecha. Con el corazón acelerado, los ojos del intruso escudriñaron el interior poco iluminado, la luz de la luna brillando en el contenido metálico de la caja fuerte. Con la historia prohibida de la familia al alcance de la mano, el misterio estaba al borde de la revelación. Poco sabían que otro par de ojos observaban desde la oscuridad, testigos de la conspiración que se estaba desarrollando".

Éstos son sólo algunos ejemplos de cómo la ingeniería de prontitud da forma al diálogo entre los humanos y la IA, influyendo en última instancia en la eficacia del resultado del algoritmo.

Como ingeniero de avisos, dominar estas técnicas y saber cuándo aplicarlas puede mejorar significativamente la interactividad y la utilidad de los contenidos generados por IA.

Sugerencias para generar imágenes

Las indicaciones para la generación de imágenes guían a la IA para convertir las descripciones textuales en visuales convincentes. La clave es proporcionar suficientes detalles para ayudar al modelo a visualizar y representar el concepto con precisión.

Sugerencias de visualización ilustrativas

Entrada: "Diseña una imagen de un paisaje sereno en el que aparezca una pequeña cabaña junto a un lago, con las montañas al fondo envueltas en bruma, durante la hora dorada del atardecer".

Concepto de personaje

Entrada: "Crea una imagen de un concepto de personaje para un inventor steampunk, con ropa de la época victoriana adornada con artilugios de latón, sosteniendo una llave inglesa hecha a medida, con gafas de protección apoyadas en su sombrero".

Sugerencias para el diseño de maquetas de productos

Entrada: "Genera una imagen de un smartphone de diseño elegante y moderno con pantalla de cristal curvado, pantalla sin biseles y un asistente interactivo de IA en la pantalla".

Arte conceptual para Ficción

Entrada: "Representa una imagen de una bulliciosa escena de mercado alienígena ambientada en una estación espacial, con varias especies intergalácticas comerciando con productos exóticos bajo carteles de neón en una variedad de escrituras alienígenas".