Categorías: Tecnología

Microsoft presenta inteligencia artificial capaz de superar a Llama 2 y Gemini

Comparta este Artículo en:

Los investigadores de Redmond lanzaron un modelo de lenguaje pequeño entrenado con datos de calidad.

Microsoft anunció el lanzamiento de Phi-2, un modelo de lenguaje pequeño (SML, por sus siglas en inglés) capaz de superar a Llama 2 y otros competidores.

Desarrollado por Microsoft Research, el modelo demostró excelentes capacidades de razonamiento y comprensión de lenguaje.

Los investigadores realizaron múltiples pruebas y encontraron que se desempeña mejor que la inteligencia artificial de Meta y Google en algunas tareas.

Phi-2 forma parte de una familia de modelos basados en transformadores que tienen una cantidad menor de parámetros.

De acuerdo con Microsoft, la idea detrás de su desarrollo se basa en la premisa de que es posible lograr un rendimiento cercano a los modelos más extensos, como Llama o Mistral.

Para tener una idea de la escala, Phi-2 cuenta con 2.700 millones de parámetros, mientras que GPT-4 tendría unos 1.700 billones.

Pese a esta limitante, la inteligencia artificial de Microsoft iguala o supera a modelos hasta 25 veces más grandes.

En una serie de pruebas de matemáticas y programación, Phi-2 logró un mejor rendimiento que Llama 2, la IA de Meta.

Los desarrolladores fueron más lejos y lo pusieron frente a Gemini Nano 2, en donde consiguió resolver problemas de física de un modo parecido a la inteligencia artificial de Google.

“Con solo 2,7 mil millones de parámetros, Phi-2 supera el rendimiento de los modelos Mistral y Llama-2 en los parámetros 7B y 13B en varios puntos de referencia agregados”, mencionaron los desarrolladores.

“En particular, logra un mejor rendimiento en comparación con el modelo Llama-2-70B 25 veces más grande en tareas de razonamiento de varios pasos, es decir, codificación y matemáticas.

¿Cómo fue posible conseguir estos resultados con menos parámetros?

El secreto está en el entrenamiento.

Phi-2 se entrenó con un conjunto que incluye textos sintéticos de PNL, subconjuntos de código obtenidos de Stack Overflow, competencias de programación y más.

Microsoft mencionó que la calidad de los datos de entrenamiento juega un papel fundamental en el rendimiento del modelo.

A diferencia de GPT-4, Microsoft realiza una curación de datos web que se filtran según su valor educativo.

El equipo de investigadores utilizó un conjunto “con calidad de libros de texto”, una estrategia que se aplica desde la primera versión de Phi.

Nuestra combinación de datos de entrenamiento contiene conjuntos de datos sintéticos creados específicamente para enseñar al modelo razonamiento con sentido común y conocimientos generales, incluida la ciencia, las actividades diarias y la teoría de la mente, entre otros”.

El entrenamiento de Phi-2 tomó 14 días y se utilizaron 96 tarjetas gráficas A100 de NVIDIA.

Pese a que no se hizo un refinamiento adicional, el SML ofrece menos toxicidad y sesgo en sus respuestas, comparado con Llama 2.

Microsoft Research comentó que efectuaron pruebas exhaustivas con benchmarks académicos, así como también herramientas internas.

Lamentablemente, Phi-2 solo estará disponible para proyectos de investigación.

El SML se ofrecerá como parte de Azure AI Studio para fomentar el desarrollo de modelos de lenguaje.

La licencia actual no permite utilizarlo en aplicaciones comerciales, como ChatGPT.

Fuente: Microsoft

Editor PDM

Entradas recientes

Inteligencia artificial puede visualizar un mundo entero a partir de una sola imagen

Científicos informáticos de Johns Hopkins han creado un sistema de inteligencia artificial capaz de "imaginar"…

2 hours hace

OpenAI anuncia o3 y o3-mini: sus nuevos modelos de razonamiento avanzan a pasos de gigante

Estos son los sucesores directos de o1 y o1-mini, que se anunciaron en septiembre a…

2 hours hace

LG presenta televisor OLED transparente de 77 pulgadas

LG Electronics ha lanzado en Estados Unidos el LG SIGNATURE OLED T de 77 pulgadas,…

2 hours hace

Microsoft lanza IA para Windows que traduce y agrega subtítulos a sus videos en tiempo real

Microsoft ha lanzado una función para Windows 11 que ofrece subtítulos y traducción en tiempo…

2 hours hace

Seagate presenta el Exos M, un monstruoso disco duro de 32 TB

Seagate ha presentado el Exos M, su primer disco duro con grabación magnética asistida por…

2 hours hace

Demuestran la existencia de una nueva clase de magnetismo: “altermagnetismo”

Los materiales magnéticos son esenciales para nuestra tecnología, desde discos duros hasta microchips. (more…)

2 days hace
Click to listen highlighted text!