OpenAI lanza una IA que "critica" los errores de GPT-4: así funciona CriticGPT

Los comentarios de los usuarios se clasifican como positivos, negativos o neutrales.

ChatGPT no es perfecto y como el mismo avisa puede cometer errores en sus respuestas, por ello, desde OpenAI han desarrollado CriticGPT, un modelo basado en GPT-4 que va a ayudar a identificar errores en el código generado por el chatbot de la compañía. El objetivo será actuar como asistente para los entrenadores humanos que revisan el código generado por la tecnología de IA.

Así funciona CriticGPT, el modelo que corregirá a ChatGPT

Lo que este modelo hace es analizar el código y señalar los posibles errores que pueden pasar desapercibidos para los humanos. Para que pueda detectarlos, los investigadores lo han entrenado con muestras de código con errores introducidos a propósito para que los reconozca y señale los fallos de codificación.

Tras realizar varias pruebas internas, los investigadores explican que CriticGPT ha logrado ser muy efectivo para las personas en el proceso de identificar errores en las respuestas de ChatGPT. De hecho, las personas que recibieron su ayuda han superado en un 60% a las que realizaron el trabajo en solitario y el modelo está listo para seguir evolucionando.

We’ve trained a model, CriticGPT, to catch bugs in GPT-4’s code. We’re starting to integrate such models into our RLHF alignment pipeline to help humans supervise AI on difficult tasks: https://t.co/5oQYfrpVBu
— OpenAI (@OpenAI) June 27, 2024

Ya puedes probar gratis la aplicación de ChatGPT con GPT-4o para Mac: estas son sus ventajas

Eso sí, los investigadores también han creado una técnica denominada Búsqueda por Haz de Muestreo Forzado (FSBS) que ha ayudado a CirticGPT a redactar reseñas con mayor detalle y lo bueno es que se puede ajustar según necesidades. Además, la compañía de Altman planea integrar modelos parecidos a CriticGPT basados en el refuerzo a partir de la retroalimentación humana (respuestas creadas por humanos) RLHF para ofrecer a los entrenadores asistencia de IA.

Hay que decir que, aunque los resultados sean alentadores, este modelo basado en GPT-4 también tiene sus limitaciones, ya que su entrenamiento se ha llevado a cabo con respuestas relativamente cortas del chatbot. Esto quiere decir que igual no está preparado para evaluar tareas largas y con mayor dificultad.