Alibaba lanza su inteligencia artificial Qwen2.5-Max
Ahora la competencia por superar a DeepSeek también se libra en la propia China: Alibaba acaba de anunciar Qwen2.5-Max.
DeepSeek causó un auténtico terremoto. El excelente desempeño de los últimos modelos de lenguaje de la compañía china se tradujo en una amenaza directa para las firmas de Silicon Valley, que en cuestión de horas perdieron miles de millones de dólares de valor de mercado.
El éxito de DeepSeek V3 y DeepSeek-R1 radica en una clave muy sencilla de entender.
Son propuestas que, en muchos aspectos, están a la altura de lo más avanzado del mundo, como GPT-4 y o1.
No solo funcionan muy bien, sino que los costos de entrenamiento y funcionamiento son varias veces más bajos que los de OpenAI.
Mientras Occidente se alista para lanzar modelos “mucho mejores”, como mencionaba Sam Altman, la competencia para superar a DeepSeek también se juega en China.
Las cosas se están moviendo muy rápidamente en el campo de la IA.
Alibaba, el gigante del comercio electrónico conocido “el Amazon chino”, acaba de lanzar su modelo de lenguaje más avanzado: Qwen2.5-Max.
Estamos ante una alternativa preentrenada con 20 billones de tokens y mejorada mediante técnicas de fine-tuning supervisado (SFT) y aprendizaje por refuerzo a partir de comentarios humanos (RLHF).
Al igual que GPT-4 y DeepSeek, Qwen2.5-Max utiliza una arquitectura Mixture of Experts (MoE), optimizando los recursos al activar únicamente las partes necesarias del modelo, los llamados “expertos”.
Está diseñado para destacar en tareas como la programación y conversaciones, pero lo más interesante es que supera en varios benchmarks a rivales como DeepSeek V3 y Llama 3.1.
Qwen2.5-Max ha logrado una puntuación del 87,9 % en MMLU, una de las pruebas más exigentes para evaluar el conocimiento general de un modelo, frente al 87,1% de DeepSeek V3 y del 85,2% de Llama 3.1.
En BBH, una prueba diseñada para evaluar el razonamiento complejo, Qwen2.5-Max ha alcanzado un 89,3%, situándose por delante de DeepSeek V3 (87,5 %) y Llama 3.1 (85,9 %).
Si nos fijamos en MATH, el benchmark que evalúa el desempeño en matemáticas a nivel olímpico, el modelo de Alibaba alcanza un 68,5%, mientras que sus rivales DeepSeek V3 y Llama 3.1 alcanzan los 61,6% y 53,8% respectivamente.
La diferencia no es abrumadora, pero sigue siendo un dato interesante, sobre todo porque muestra que sus competidores, tanto dentro como fuera de China, no están tan lejos.
Alibaba ha puesto a disposición los usuarios su nuevo modelo, así que tenemos varias vías para poder acceder a él:
Mediante la API de pago, a través de Hugging Face o utilizando el Qwen Chat, el chatbot de la compañía equivalente a ChatGPT.
Comenzar a utilizar Qwen Chat es tan sencillo como registrarse.
El paso siguiente es comenzar a chatear. Este chatbot tiene seleccionado por defecto el modelo Qwen2.5-Plus, pero podemos cambiar a Qwen2.5-Max utilizando el selector de modelos de la esquina superior izquierda.
Incluso podemos utilizar dos modelos en simultáneo.
El chatbot de Alibaba tiene un montón de otras funciones, como búsqueda web, artifacts, y generación de imágenes y videos.
También es capaz de analizar imágenes y documentos.
Y si bien estamos hablando de una solución que tiene origen en el gigante asiático, hemos podido comprobar que también funciona en español.
Fuente: GitHub
Microsoft anunció el Majorana 1, el primer chip cuántico impulsado por un topoconductor que produce…
Los motores de combustión de los automóviles a gasolina pueden producir mucha energía quemando dinosaurios…
Investigadores de Meta utilizaron un escáner cerebral de última generación y un modelo de inteligencia…
Científicos han conseguido reconectar, en una rata a modo de prueba de lo que quizá…
Ingenieros logran un avance revolucionario en microelectrónica, inspirado en principios cuánticos: desarrollan un método para…
El nuevo modelo de lenguaje es capaz de generar imágenes, simular entradas y producir secuencias…