OpenAI ha presentado o1 y o1-mini, sus primeros modelos de inteligencia artificial con capacidades de razonamiento, y los integra a ChatGPT.
Estos sacan provecho de la tecnología conocida internamente como Strawberry y se han pensado para resolver tareas complejas vinculadas con campos como la ciencia, las matemáticas y la programación.
Se encuentran disponibles en las versiones de pago de ChatGPT, y próximamente se incorporará la variante mini a la gratuita.
“En nuestras pruebas, la próxima actualización del modelo se desempeña de manera similar a la de los estudiantes de doctorado en tareas de referencia desafiantes en física, química y biología.
También descubrimos que se destaca en matemáticas y programación.
En un examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO), GPT-4o resolvió correctamente solo el 13 % de los problemas, mientras que el modelo de razonamiento obtuvo una puntuación del 83 %“, dice OpenAI sobre o1.
OpenAI ha lanzado o1 a modo de preview, de modo que aún no integra el 100 % de sus características a ChatGPT.
Esto significa que todavía no puede lidiar con imágenes, ni tampoco buscar información en la web.
De todos modos, los de Sam Altman consideran que esta nueva inteligencia artificial representa un salto bestial en cuando a capacidades, y por eso han decidido darle el nombre o1.
La startup ha publicado algunos vídeos con ejemplos que muestran a la nueva IA resolviendo problemas o instrucciones complejas, o incluso respondiendo a preguntas simples con las que otros modelos de lenguaje fallaban.
A continuación, pueden ver a OpenAI o1 creando un videojuego desde cero a partir de un prompt de texto, y también acertando cuando se le pregunta cuántas R tiene la palabra Strawberry, que GPT-4o no podía contestar de forma acertada.
Al usar o1 en ChatGPT, se aprecia una demora en el tiempo de respuesta en comparación con GPT-4o y otros modelos de OpenAI.
Esto se debe, justamente, a que la inteligencia artificial está usando sus capacidades de razonamiento para resolver lo que se pide o consulta, en lugar de disparar una contestación rápida.
El objetivo de la nueva tecnología no solo es brindar respuestas más certeras, sino también acabar con las alucinaciones.
Esto no quiere decir que la IA no vaya a equivocarse o a inventarse a una respuesta, pero sus desarrolladores dicen que es menos frecuente que en versiones anteriores de GPT.
“Los investigadores del ámbito de la sanidad pueden utilizar o1 para anotar datos de secuenciación celular, los físicos para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica y los desarrolladores de todos los campos para crear y ejecutar flujos de trabajo de varios pasos“, afirma OpenAI.
Desde OpenAI le comentaron que el entrenamiento de o1 y o1-mini se ha realizado utilizando un set de datos hecho a medida y un nuevo algoritmo de optimización.
Y a diferencia de GPT-4o y modelos previos, esta IA no imita los patrones de la información que se usó para adiestrarla, sino que se ha entrenado usando aprendizaje por refuerzo para resolver por su cuenta los problemas que se le presentan.
La empresa ha hecho especial hincapié en su seguridad.
OpenAI indica que el desarrollo de o1 ha sido acompañado por la implementación de medidas de seguridad más robustas, pruebas rigurosas y la colaboración con autoridades y entes reguladores de diferentes países.
Asimismo, OpenAI argumenta que o1 es mucho menos susceptible al jailbreak, es decir, a los intentos de los usuarios de evadir sus salvaguardias.
“En una de nuestras pruebas de jailbreak más difíciles, GPT-4o obtuvo una puntuación de 22 (en una escala de 0 a 100), mientras que nuestro modelo o1-preview obtuvo una puntuación de 84“, indican los responsables de la IA.
Fuente: OpenAI
Un tratamiento basado en vidrios bioactivos dopados con galio podría ser eficaz contra el cáncer…
El cemento contamina. Bastante. El plástico también, mucho. Para el australiano Keagan Howell, estudiante del…
Crear un nuevo podcast suele llevar mucho tiempo, pero NotebookLM lo hace en apenas unos…
Las iniciativas de ciencia ciudadana son cada vez más populares y logran resultados cada vez…
Investigadores finlandeses han llevado la búsqueda del amor a un nivel completamente nuevo, al revelar…
Esta reinvención de las salas inmersivas de los planetarios plantea la próxima evolución de las…