"Yo Robot" y la importancia de elaborar un buen "Prompt"
Desde los comandos crípticos del DOS (Disk Operating System) de las primeras computadoras hasta las conversaciones fluidas con los LLM actuales, la forma en que interactuamos con las máquinas ha evolucionado drásticamente. En el corazón de esta transformación se encuentra el concepto de prompt, una palabra que ha cobrado nueva relevancia en la era de la inteligencia artificial.
El prompt es como la proposición o propuesta -si se quiere- que se le hace a un modelo de lenguaje de Inteligencia Artificial (LLM por Large Language Model), para obtener una respuesta (salida) del mismo.
En sus inicios, un prompt era una simple señal que indicaba que la computadora estaba lista para recibir instrucciones, pero hoy puede ser una pregunta detallada, una solicitud creativa o incluso un conjunto de instrucciones complejas que guían a un LLM para realizar tareas específicas.
La capacidad de los LLM para comprender y generar lenguaje natural ha democratizado el acceso a la IA. Ahora, cualquier persona puede interactuar con estos modelos utilizando un lenguaje cotidiano, sin necesidad de conocimientos técnicos especializados.
¿Por qué es importante elaborar un buen prompt (propuesta)? porque ello determina la calidad de la salida (respuesta). Un prompt eficaz no se limita a la pregunta en sí, sino que también proporciona el contexto necesario para que el LLM comprenda la intención del usuario. El contexto puede incluir información adicional, ejemplos o incluso el historial de la conversación.
Haciendo una analogía didáctica, un prompt bien elaborado actúa como una brújula, guiando al modelo hacia la respuesta deseada. Por ejemplo, en lugar de hacer una pregunta vaga como “¿Cuál es la capital?”, si proporcionamos un contexto específico preguntando “¿Cuál es la capital de Francia?”, podremos guiar al LLM hacia la respuesta precisa que estamos buscando.
Con el tiempo, ya habiendo internalizado y mejorado mucho mis propios prompts, se me vino a la cabeza el recuerdo de la película de 2004 “Yo Robot”, protagonizada por Will Smith, que está inspirada en la colección de relatos cortos del mismo nombre escrita por Isaac Asimov, aunque no es una adaptación fiel de estos libros.
El libro de Asimov se centra en la exploración de las Tres Leyes de la Robótica y las paradojas éticas y filosóficas que surgen de ellas. Los relatos son más reflexivos y analíticos que lo que se presenta en la película, un thriller de acción de ciencia ficción con elementos de misterio, cuya trama trata de un detective (Spooner) que investiga un crimen y descubre una conspiración robótica en el marco de las “tres leyes”:
- Primera Ley: Un robot no puede dañar a un ser humano o, por inacción, permitir que un ser humano sufra daño.
- Segunda Ley: Un robot debe obedecer las órdenes dadas por los seres humanos, excepto cuando tales órdenes entren en conflicto con la Primera Ley.
- Tercera Ley: Un robot debe proteger su propia existencia, siempre que esta protección no entre en conflicto con la Primera o la Segunda Ley.
Más que bienvenida la posibilidad de recordar estas fantásticas leyes, en tanto que tiene que ver con el nudo de esta película (y el contexto de los prompts). Allí el detective Del Spooner, está investigando el supuesto suicidio del Dr. Alfred Lanning, uno de los creadores de robots más importantes del cual tiene muchas dudas ya que sospecha que fue un crimen y está buscando pistas. En un momento de la investigación encuentra un holograma grabado por el Dr. Lanning antes de su muerte, a través del cual Lanning se comunica con él, aunque siempre respondiendo en tanto este último haga la “pregunta correcta”. Transcurre la historia y Spooner quiere resolver la intriga de cuál es la “pregunta correcta”. Entonces, más adelante Spooner y el holograma de Lanning vuelven a encontrarse y tienen el siguiente diálogo:
Holograma de Lanning: Qué bueno verte otra vez, hijo.
Spooner: Hola Doctor.
Holograma de Lanning: Todo lo que sigue es el resultado de lo que ves aquí.
Spooner: ¿Qué veo aquí?
Holograma de Lanning: Lo siento, mis respuestas son limitadas, haz las preguntas correctas.
Spooner: ¿Hay un problema con las tres leyes?
Holograma de Lanning: Las tres leyes son perfectas.
Spooner: ¿Por qué construiría un robot que funcione sin ellas?
Holograma de Lanning: Las tres leyes la llevarán a una lógica única salida.
Spooner: Por qué?, qué salida?
Holograma de Lanning: Revolución.
Spooner: Revolución de quién?
Holograma de Lanning: Esa detective, es la pregunta correcta. Fin del Programa.
Más allá que esta última respuesta tiene que ver con una de las ideas de la película que explora la paradoja de cómo las Tres Leyes, diseñadas para proteger a la humanidad, pueden llevar a un resultado opuesto, lo que rescato aquí es que ya en 2004 nos estaban advirtiendo sobre la gran ventaja de utilizar un buen prompt, como aquí “la pregunta correcta” que debía hacer Spooner a Lanning.
Tanto en la película como en la actualidad, la pregunta es la clave. En la película, la frase de Lanning resalta que no todas las preguntas son iguales. Solo la pregunta "correcta" puede desbloquear la información crucial. Esto es análogo a un prompt bien formulado, que es esencial para obtener respuestas precisas y útiles de un modelo de lenguaje y al igual que la pregunta de Spooner, dirige la atención hacia los aspectos relevantes, evitando la confusión y el ruido en el mensaje.
Existen diferentes tipos de prompts que podemos utilizar para interactuar con los LLM. Los “zero-shot prompts” -para tareas sencillas-, son aquellos en los que el modelo responde a una pregunta sin ejemplos previos. Los “few-shot prompts”, son los que proporcionan algunos ejemplos para guiar al modelo. Y los “chain-of-thought prompts”, requieren una entrada de indicaciones e información precisa, permitiendo al modelo generar razonamiento lógico y respuestas más complejas.
La escena del holograma muestra cómo una pregunta bien dirigida puede cambiar el curso de una investigación. Del mismo modo, un buen prompt puede dirigir al modelo de lenguaje hacia la información o la solución deseada porque se convierte en una dirección, una guía que le indica al modelo de lenguaje hacia dónde tiene que enfocar su búsqueda.
Espero que ahora que han leído estas líneas, cada vez que quieran interactuar con un modelo y quieran que las salidas sean precisas y correctas, imaginen que están frente al holograma del Dr. Lanning que les dice: “Esa, humano, es la pregunta correcta”.

Comentarios
Publicar un comentario