OpenAI lanza o1, su primera inteligencia artificial capaz de razonar

Comparta este Artículo en:

OpenAI ha presentado o1 y o1-mini, sus primeros modelos de inteligencia artificial con capacidades de razonamiento, y los integra a ChatGPT.

Estos sacan provecho de la tecnología conocida internamente como Strawberry y se han pensado para resolver tareas complejas vinculadas con campos como la ciencia, las matemáticas y la programación.

Se encuentran disponibles en las versiones de pago de ChatGPT, y próximamente se incorporará la variante mini a la gratuita.

“En nuestras pruebas, la próxima actualización del modelo se desempeña de manera similar a la de los estudiantes de doctorado en tareas de referencia desafiantes en física, química y biología.

También descubrimos que se destaca en matemáticas y programación.

En un examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO), GPT-4o resolvió correctamente solo el 13 % de los problemas, mientras que el modelo de razonamiento obtuvo una puntuación del 83 %“, dice OpenAI sobre o1.

OpenAI ha lanzado o1 a modo de preview, de modo que aún no integra el 100 % de sus características a ChatGPT.

Esto significa que todavía no puede lidiar con imágenes, ni tampoco buscar información en la web.

De todos modos, los de Sam Altman consideran que esta nueva inteligencia artificial representa un salto bestial en cuando a capacidades, y por eso han decidido darle el nombre o1.

La startup ha publicado algunos vídeos con ejemplos que muestran a la nueva IA resolviendo problemas o instrucciones complejas, o incluso respondiendo a preguntas simples con las que otros modelos de lenguaje fallaban.

A continuación, pueden ver a OpenAI o1 creando un videojuego desde cero a partir de un prompt de texto, y también acertando cuando se le pregunta cuántas R tiene la palabra Strawberry, que GPT-4o no podía contestar de forma acertada.

OpenAI o1 codes a video game from a prompt. pic.twitter.com/aBEcehP0j8
— OpenAI (@OpenAI) September 12, 2024

Al usar o1 en ChatGPT, se aprecia una demora en el tiempo de respuesta en comparación con GPT-4o y otros modelos de OpenAI.

OpenAI o1 answers a famously tricky question for large language models. pic.twitter.com/5ZlQIOBWEd
— OpenAI (@OpenAI) September 12, 2024

Esto se debe, justamente, a que la inteligencia artificial está usando sus capacidades de razonamiento para resolver lo que se pide o consulta, en lugar de disparar una contestación rápida.

El objetivo de la nueva tecnología no solo es brindar respuestas más certeras, sino también acabar con las alucinaciones.

Esto no quiere decir que la IA no vaya a equivocarse o a inventarse a una respuesta, pero sus desarrolladores dicen que es menos frecuente que en versiones anteriores de GPT.

“Los investigadores del ámbito de la sanidad pueden utilizar o1 para anotar datos de secuenciación celular, los físicos para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica y los desarrolladores de todos los campos para crear y ejecutar flujos de trabajo de varios pasos“, afirma OpenAI.

Desde OpenAI le comentaron que el entrenamiento de o1 y o1-mini se ha realizado utilizando un set de datos hecho a medida y un nuevo algoritmo de optimización.

Y a diferencia de GPT-4o y modelos previos, esta IA no imita los patrones de la información que se usó para adiestrarla, sino que se ha entrenado usando aprendizaje por refuerzo para resolver por su cuenta los problemas que se le presentan.

La empresa ha hecho especial hincapié en su seguridad.

OpenAI indica que el desarrollo de o1 ha sido acompañado por la implementación de medidas de seguridad más robustas, pruebas rigurosas y la colaboración con autoridades y entes reguladores de diferentes países.

Asimismo, OpenAI argumenta que o1 es mucho menos susceptible al jailbreak, es decir, a los intentos de los usuarios de evadir sus salvaguardias.

“En una de nuestras pruebas de jailbreak más difíciles, GPT-4o obtuvo una puntuación de 22 (en una escala de 0 a 100), mientras que nuestro modelo o1-preview obtuvo una puntuación de 84“, indican los responsables de la IA.

Fuente: OpenAI