El nuevo modelo de lenguaje es más ligero y barato que GPT-3.5 y se integrará en todas las versiones de ChatGPT.
OpenAI presentó un nuevo modelo de lenguaje que impulsará a ChatGPT.
Conocido como GPT-4o mini, este modelo es una versión reducida de GPT-4o, su LLM más potente a la fecha que lanzó hace unos meses.
La compañía de IA mencionó que GPT-4o mini es mucho más pequeño y barato que otros modelos de tamaño completo, al tiempo que no sacrifica su rendimiento.
De acuerdo con OpenAI, GPT-4o mini es mejor que otros modelos pequeños en tareas de razonamiento que involucran visión y texto.
La tecnológica afirma que su nueva IA supera a Gemini 1.5 Flash y Claude 3 Haiku en las pruebas de MMLU.
Por otro lado, el nuevo modelo aventaja a GPT-4 en las preferencias de chat del LMSYS Chatbot Arena.
En términos de especificaciones, GPT-4o mini tiene una ventana de contexto de 128.000 tokens.
El conjunto de datos de entrenamiento abarca hasta octubre de 2023, por lo que desplegará información más reciente que GPT-3.5.
OpenAI menciona que su modelo admite texto y visión en la API y que ofrecerá soporte multimodal en un futuro.
OpenAI reveló que GPT-4o mini reemplazará a GPT-3.5 Turbo en todas las versiones de ChatGPT, incluyendo la gratuita.
El cambio está justificado, puesto que el nuevo modelo no solo es más ligero sino también más poderoso que su predecesor.
La tecnológica menciona que GPT-4o mini supera al GPT-3.5 Turbo en razonamiento multimodal.
OpenAI ha puesto a prueba a su nueva IA frente a otros modelos pequeños en diversos benchmarks.
Estos lo favorecen en tareas de razonamiento que involucran texto, imágenes, código y matemáticas.
Por otro lado, la IA incluye las mismas medidas de seguridad que su hermano mayor.
OpenAI menciona que GPT-4o mini es el primer modelo que aplica un método de jerarquía de instrucciones para evitar hackeos.
Este mejorará la capacidad para resistir un jailbreak o extracción de prompts de sistema.
OpenAI reveló que GPT-4o mini ya está disponible en ChatGPT como reemplazo de GPT-3.5 Turbo.
La compañía lo ofrecerá como modelo de texto y visión en la API, por lo que los desarrolladores deberán pagar 0,15 USD por 1 millón de tokens (2.500 páginas de texto).
Esto representa una reducción del 60 %, comparado con GPT-3.5 Turbo.
“Esperamos que GPT-4o mini amplíe significativamente la gama de aplicaciones creadas con IA al hacer que la inteligencia sea mucho más asequible”, dijo OpenAI.
Fuente: OpenAI