El chatbot ChatGPT de OpenAI, basado en inteligencia artificial, parece empeorar con el paso del tiempo, y los investigadores no consiguen averiguar por qué.
En un estudio publicado el 18 de julio, investigadores de Stanford y la Universidad de Berkeley descubrieron que los modelos más recientes de ChatGPT eran mucho menos capaces de dar respuestas precisas a una serie idéntica de preguntas en el plazo de unos pocos meses.
Los autores del estudio no pudieron dar una respuesta clara a por qué se habían deteriorado las capacidades del chatbot de IA.
Para comprobar la fiabilidad de los distintos modelos de ChatGPT, los investigadores Lingjiao Chen, Matei Zaharia y James Zou pidieron a los modelos ChatGPT-3.5 y ChatGPT-4 que resolvieran una serie de problemas matemáticos, respondieran a preguntas delicadas, escribieran nuevas líneas de código y realizaran razonamientos espaciales a partir de indicaciones.
Según la investigación, en marzo ChatGPT-4 fue capaz de identificar números primos con una tasa de precisión del 97.6%. En la misma prueba realizada en junio, la precisión de GPT-4 se había desplomado a sólo el 2.4%.



