Estas palabras pueden descomponer a ChatGPT y nadie sabe por qué

Ante la popularidad del bot generador de textos, cientos de usuarios se han dedicado a poner a prueba sus límites

Aunque las tecnologías capaces de generar contenidos de forma automática a través de modelos de Inteligencia Artificial estén viviendo una implosión en la industria, éstas continúan siendo imperfectas, por lo que muchos internautas se han lanzado a la tarea de poner a prueba sus capacidades y evidenciar los defectos de estos sistemas. 

En el caso de ChatGPT, algunas personas en Reddit han comenzado a mostrar cómo el exitoso bot de OpenAI refleja comportamientos erráticos al recibir instrucciones con ciertas frases o palabras determinadas.

Estas frases clave o "tokens", como han sido bautizadas, varían desde nombres de usuarios de Reddit, así como el apodo del participante de un juego de Twitch basado en Pokémon.

Según evidencias recopiladas por VICE, cuando se pide a ChatGPT que repita estas palabras o frase el bot es incapaz de hacerlo correctamente, ofreciendo en su lugar respuestas que varían en extrañeza, como evasivas, insultos, humor espontáneo y burdo, así como palabras completamente diferentes a las expresadas. 

 Los modelos de Inteligencia Artificial podrían haber sido entrenados de forma apresurada, no procesando correctamente palabras y frases bastante singulares de portales como los de Reddit. Foto ilustrativa/Unsplash.

Te puede interesar: Noam Chomsky critica a ChatGPT como un "plagio" con tecnología avanzada y una forma de evitar el aprendizaje

Desconocen la causa

En una investigación hecha por los expertos Jessica Rumbelow y Matthew Watkins del grupo independiente SERI-MATS, se detectó que ChatGPT cuenta con alrededor de 100 palabras en su base de datos que están entremezcladas, provocando que el bot se comporte de manera defectuosa.

Algunas de estas palabras (en inglés, hasta el momento) son "SolidGoldMagicarkp", "StreamerBot" y "TheNitromeFan". Cuando se le preguntó al mismo bot por qué se le dificultaban estas  palabras, este simplemente fue incapaz de ofrecer textos coherentes.

Los fallos se han detectado incluso en versiones tempranas de GPT. Los investigadores destacaron que estos imperfectos evidencian cómo los modelos basados en IA pueden llegar a ser programas cuyo comportamiento es difícil de entender, mostrando limitaciones y errores que impedirán que estas tecnologías se vuelvan en herramientas infalibles a favor de la automatización de tareas básicas.

Teorías y reflexiones

Una de las teorías ofrecidas por Rumbelow al sitio Motherboard sobre por qué ChatGPT se comportaba de este modo ante las palabras es que OpenAI se ahorró algunos términos de la web al momento de llenar la base de datos con la que entrenaron al modelo de IA del programa.

"Lo que creemos que sucedió fue que la tokenización, esta clase de frecuencia de análisis que generaba los términos para el modelo, fue entrenada con datos en bruto, en donde se incluyó muchas palabras extrañas de Reddit y otros respaldos del sitio web que no son normalmente visibles", explicó Rumbelow, "Cuando el modelo es entrenado, los datos son escogidos con mayor cuidado, por lo que no se obtiene gran parte de estos términos únicos. Así que el modelo puede que nunca haya visto estos tokens, por lo que no sabe qué hacer con ellos. Pero eso no explica el tamaño de la singularidad que obtuvimos".

Los investigadores publicaron sus hallazgos en una publicación que puedes visitar en este enlace seguro, además de haber publciado el códio que usaron para hallar los tokens en GitHub. De momento, los expertos fueron incapaces de encontrar la conexión entre los términos y las respuestas inusuales de ChatGPT.

Cabe señalar que incluso aunque OpenAI fuera capaz de arreglar estos desperfectos con las palabras denunciadas, eso no atendería la raíz central del problema. "Descubrí que nos estamos adelantando y no tenemos la sabiduría para lidiar con esta tecnología", expresó Watkins. 

Te puede interesar: Bard, la Inteligencia Artificial de Google, cometió un error en su primer día que le costó 100 MDD a la compañía

Noticias Relacionadas

TE PUEDE INTERESAR

MÁS NOTICIAS

MÁS NOTICIAS