ChatGPT no conoce el 20% del vocabulario español y se equivoca en el 80% restante

Madrid -- Desde su lanzamiento al mercado hace un año, la inteligencia artificial ChatGPT, capaz de crear contenidos originales y tareas relacionadas con los idiomas, se ha convertido en una herrami.

Madrid — Desde su lanzamiento al mercado hace un año, la inteligencia artificial ChatGPT, capaz de crear contenidos originales y tareas relacionadas con los idiomas, se ha convertido en una herramienta muy popular.

Un estudio ha demostrado que ChatGPT desconoce el 20% del vocabulario español y comete errores en el 80% restante.

Según datos de OpenAI, desarrollador de la herramienta, 100 millones de personas utilizan este chatbot cada semana para realizar tareas relacionadas con el lenguaje. Sin embargo, aunque la herramienta está entrenada para mantener conversaciones y generar textos, se sabe que da respuestas que pueden parecer plausibles pero que son completamente erróneas.

También te puede interesar: Sin saberlo, todo el mundo puede contribuir al desarrollo de la IA.

Para ello, se consultaron palabras del diccionario de la Real Academia de la Lengua y palabras del Quijote de Miguel de Cervantes. El estudio reveló que, de las más de 90 000 palabras del diccionario de la Real Academia de la Lengua, el modelo ChatGPT3.5turbo desconocía un 20%, es decir, 18 000 palabras.

Además, del 80% restante de palabras del diccionario y del 90% de palabras del Quijote, ChatGPT cometió errores en aproximadamente el 5% de las palabras.

Conocimientos muy pobres

Este estudio nos recuerda que los hispanohablantes reconocen una media de 30 000 palabras, es decir, casi un tercio del vocabulario español.

Sin embargo, como suele ocurrir con los sistemas de inteligencia artificial, no es oro todo lo que reluce: un análisis de los significados de las palabras mostradas por ChatGPT muestra que una pequeña proporción de ellas son incorrectas, explica Javier Conde, coautor del estudio.

Quizá ChatGPT no sea hoy tan inteligente como parece. Además, el estudio recuerda que los modelos lingüísticos a gran escala (LLM) basados en inteligencia artificial como ChatGPT y diseñados para procesar y comprender el lenguaje natural a gran escala no utilizan palabras que no conocen.

Sin embargo, Pedro Revilliego, coautor del estudio, afirma que estos datos son alarmantes porque si estos sistemas sólo utilizan las palabras que conocen, entonces el escenario de reducción del número de palabras en los nuevos contenidos generados y de reducción de la riqueza léxica es muy real Advertencia.

La aplicación ChatWords es un sistema a disposición del público, diseñado para ser fácil de usar y ampliar.

Los investigadores quieren evaluar otros idiomas y LLM para comprender mejor el conocimiento léxico que poseen las herramientas de inteligencia artificial y cómo evoluciona con la aparición de nuevas versiones y herramientas.

Sobre el Autor

TRA Noticias

Te interesara ver

Sobre el Autor

TRA Noticias