Por qué la IA no puede hacerse cargo de la escritura creativa

Crédito: dominio público CC0
En 1948, el fundador de la teoría de la información, Claude Shannon, propuso el lenguaje de modelado en términos de la probabilidad de la siguiente palabra en una oración dadas las palabras anteriores. Estos tipos de modelos de lenguaje probabilístico fueron ridiculizados, más famoso por el lingüista Noam Chomsky: “La noción de ‘probabilidad de una oración’ es completamente inútil”.
En 2022, 74 años después de la propuesta de Shannon, apareció Chatgpt, lo que llamó la atención del público, y algunos sugirieron que era una puerta de entrada a la inteligencia superhumana. Pasar de la propuesta de Shannon a ChatGPT tardó tanto porque la cantidad de datos y el tiempo de computación utilizado era inimaginable incluso unos años antes.
ChatGPT es un modelo de lenguaje grande (LLM) aprendido de un gran corpus de texto de Internet. Predice la probabilidad de la siguiente palabra dado el contexto: un aviso y las palabras previamente generadas.
ChatGPT utiliza este modelo para generar lenguaje eligiendo la siguiente palabra de acuerdo con la predicción probabilística. Piense en dibujar palabras de un sombrero, donde las palabras predichas para tener una mayor probabilidad tienen más copias en el sombrero. ChatGPT produce texto que parece inteligente.
Existe mucha controversia sobre cómo estas herramientas pueden ayudar o obstaculizar el aprendizaje y practicar la escritura creativa. Como profesor de ciencias de la computación que ha escrito cientos de obras sobre inteligencia artificial (IA), incluidos los libros de texto de IA que cubren el impacto social de los modelos de idiomas grandes, creo que comprender cómo funcionan los modelos pueden ayudar a los escritores y educadores a considerar las limitaciones y los usos potenciales de la IA para lo que podría llamarse escritura “creativa”.
LLMS como loros o plagiarios
Es importante distinguir entre “creatividad” por el LLM y la creatividad por un humano. Para las personas que tenían bajas expectativas de lo que una computadora podría generar, ha sido fácil asignar creatividad a la computadora. Otros eran más escépticos. El científico cognitivo Douglas Hofstadter vio “una hollowness alucinante escondida justo debajo de su superficie llamativa”.
La lingüista Emily Bender y sus colegas describieron los modelos de idiomas como loros estocásticos, lo que significa que repiten lo que hay en los datos en los que fueron entrenados con aleatoriedad. Para comprender esto, considere por qué se generó una palabra en particular. Es porque tiene una probabilidad relativamente alta, y tiene una alta probabilidad porque mucho texto en el corpus de entrenamiento usó esa palabra en contextos similares.
Seleccionar una palabra de acuerdo con la distribución de probabilidad es como seleccionar texto con un contexto similar y usar su siguiente palabra. Generar texto a partir de LLM puede verse como plagio, una palabra a la vez.
La creatividad de un humano
Considere la creatividad de un humano que tiene ideas que quiere transmitir. Con la IA generativa, ponen sus ideas en un aviso y la IA producirá texto (o imágenes o sonidos). Si a alguien no le importa lo que se genera, realmente no importa lo que use como un aviso. Pero, ¿qué pasa si les importa lo que se genera?
Un LLM intenta generar lo que produciría una persona al azar que había escrito el texto anterior. La mayoría de los escritores creativos no quieren lo que escribiría una persona al azar. Quieren usar su creatividad, y pueden querer una herramienta para producir lo que escribirían si tuvieran tiempo para producirla.
Los LLM generalmente no tienen un gran corpus de lo que un autor en particular ha escrito para aprender. El autor indudablemente querrá producir algo diferente. Si se espera que la salida sea más detallada que la entrada, el LLM tiene que inventar detalles. Estos pueden o no ser lo que el escritor pretendía.
Algunos usos positivos de los LLM para la escritura creativa
La escritura es como el desarrollo de software: dada una idea de lo que se quiere, los desarrolladores de software producen código (texto en un lenguaje de computadora) de forma análoga de cómo los escritores producen texto en un lenguaje natural. LLMS tratan el código de escritura y la redacción del texto del lenguaje natural de la misma manera; El corpus de cada LLM está entrenado contiene tanto lenguaje natural como código. Lo que se produce depende del contexto.
Los escritores pueden aprender de la experiencia de los desarrolladores de software. Los LLM son buenos para pequeños proyectos que han realizado anteriormente muchas otras personas, como consultas de bases de datos o escribiendo cartas estándar. También son útiles para partes de proyectos más grandes, como un cuadro emergente en una interfaz gráfica de usuario.
Si los programadores quieren usarlos para proyectos más grandes, deben estar preparados para generar múltiples salidas y editar la más cercana a lo que se pretende. El problema en el desarrollo de software siempre ha estado especificando exactamente lo que se quiere; La codificación es la parte fácil.
Generando buenas indicaciones
Cómo generar buenas indicaciones se ha recomendado como una forma de arte llamada “Ingeniería rápida”. Los proponentes de la ingeniería rápida han sugerido múltiples técnicas que mejoran la salida de los LLM actuales, como pedir un esquema y luego solicitar el texto basado en el aviso original aumentado con el esquema.
Otro es pedirle al LLM que muestre sus pasos de razonamiento, como en la llamada cadena de pensamiento. Las salidas de LLM no solo responden una pregunta, sino que explican los pasos que se pueden tomar para responderla. El LLM usa esos pasos como parte de su aviso para obtener su respuesta final.
Tal consejo seguramente será efímero. Si alguna técnica de ingeniería rápida funciona, se incorporará a una versión futura de la LLM, de modo que el efecto ocurra sin la necesidad de el uso explícito de la técnica. Los modelos recientes que afirman que la razón ha incorporado tales indicaciones paso a paso.
La gente quiere creer
El científico informático Joseph Weizenbaum, que describe su programa Eliza escrito en 1964–66, dijo: “Me sorprendió ver qué tan rápido y cuán profundamente las personas conversaron (el programa) se involucraron emocionalmente con la computadora y cuán inequívocamente lo antropomorfizaron”. Las herramientas han cambiado, pero la gente todavía quiere creer.
En esta era de desinformación, es importante que todos tengan una forma de juzgar la exageración a menudo egoísta.
No hay magia en la IA generativa, pero hay muchos datos para predecir lo que alguien podría escribir. Espero que la creatividad sea más que regurgitar lo que otros han escrito.
Proporcionado por la conversación
Este artículo se vuelve a publicar de la conversación bajo una licencia Creative Commons. Lea el artículo original.
Cita: Por qué la IA no puede hacerse cargo de la escritura creativa (2025, 2 de abril) recuperado el 2 de abril de 2025 de https://techxplore.com/news/2025-04-ai-creative.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.