TECNOLOGÍA: OpenAI lanza o1, el nuevo ChatGPT de las matemáticas capaz de razonar como un humano

Este nuevo modelo de inteligencia artificial dedica «más tiempo a pensar antes de responder» para resolver tareas complejas en materias de ciencia, programación y matemáticas

En estos momentos está disponible para suscriptores de pago, pero la empresa de Sam Altman promete que próximamente se habilitará para los usuarios gratuitos.


Imagine por un segundo poder tener al alcance de su bolsillo a un experto matemático, científico o programador. Alguien disponible para usted las 24 horas del día, con capacidad de razonar y con experiencia doctoral en los ámbitos más complejos para el ser humano. Todo esto es lo que, en palabras de OpenAI, consigue lograr su primer modelo de inteligencia artificial (IA) con capacidad de razonamiento en tareas complejas, llamado o1.

Se trata de un modelo que puede razonar como una persona y, por tanto, puede resolver problemas de mayor dificultad que los modelos lanzados anteriormente en distintas áreas, ya sea ciencia, programación o matemáticas, tal y como ha subrayado la tecnológica en un comunicado en su página web. La gran novedad es que o1 dedica «más tiempo a pensar antes de responder». «Con modelos anteriores como ChatGPT, les hacías una pregunta y ellos comenzaban a responder inmediatamente», ha explicado Jakub Pachocki, científico jefe de OpenAI. «Este modelo puede tomarse su tiempo. Puede analizar el problema (en inglés) e intentar descomponerlo y buscar ángulos en un esfuerzo por brindar la mejor respuesta».

Se trata de un modelo que puede razonar como una persona y, por tanto, puede resolver problemas de mayor dificultad que los modelos lanzados anteriormente en distintas áreas, ya sea ciencia, programación o matemáticas, tal y como ha subrayado la tecnológica en un comunicado en su página web. La gran novedad es que o1 dedica «más tiempo a pensar antes de responder». «Con modelos anteriores como ChatGPT, les hacías una pregunta y ellos comenzaban a responder inmediatamente», ha explicado Jakub Pachocki, científico jefe de OpenAI. «Este modelo puede tomarse su tiempo. Puede analizar el problema (en inglés) e intentar descomponerlo y buscar ángulos en un esfuerzo por brindar la mejor respuesta».


Para lograr estas capacidades, la compañía ha señalado que ha entrenado a o1 para actuar más lento, es decir, para que emplee más tiempo para pensar antes de ofrecer una respuesta. Así, a través de este entrenamiento, el modelo es capaz de aprender a refinar su proceso de pensamiento, así como a probar distintas estrategias para resolver un problema, de cara a escoger la mejor respuesta. Todo un entrenamiento «único y diseñado específicamente para él», en palabras de Jerry Tworek, director de investigación de OpenAi.

Se ha utilizado un sistema de recompensas y penalizaciones, que ha enseñado al modelo a pensar por sí solo, en lugar de imitar patrones de datos como hacen el resto de inteligencias artificiales. De esta forma, Tworek ha indicado que han conseguido que el modelo «alucine menos» en sus respuestas, aunque ha reconocido que no se ha resuelto el problema del todo.

Comentarios

Entradas populares