Categorías: Tecnología

LIMA es la apuesta de Meta (Facebook) para desafiar a ChatGPT y Bard

LIMA es la apuesta de Meta para desafiar a ChatGPT y Bard

Comparta este Artículo en:

La carrera por lograr el modelo de lenguaje más preciso y con mejor comportamiento continúa, y aunque OpenAI parece llevar la delantera con GPT-4, las alternativas —y no solo las Open Source— avanzan.

Lo demuestran el modelo PaLM 2 de Google, pero también el modelo LLaMa de Meta (Facebook) que ahora tiene una variante prometedora llamada LIMA.

Como explica un reciente estudio de Meta, los grandes modelos de lenguaje se entrenan en dos fases.

En la primera se realiza un entrenamiento no supervisado que parte de texto en crudo y que permite aprender en un escenario de propósito general.

En la segunda se realiza una depuración de esos modelos y se aplica aprendizaje por refuerzo para alinear el modelo a ciertas tareas o preferencias de usuario.

Esto último es precisamente lo que ha hecho Meta al entrenar y lanzar LIMA (Less Is More for Alingment), un modelo de lenguaje basado en LLaMa con 65 millones de parámentros y que se ha afinado con tan solo 1.000 prompts y respuestas especialmente preparadas para que se comporte de la forma adecuada.

No ha sido necesario aprendizaje por refuerzo ni modelado basado en preferencias humanas, pero aún así su comportamiento ha acabado siendo sobresaliente.

El modelo ha sido desarrollado por Meta en colaboración con la Universidad Carnegie Mellon, la Universidad del Sur de California y la Universidad de Tel Aviv.

Según las pruebas de los investigadores, el rendimiento de LIMA es fantástico y aprende a seguir formatos de respuesta específicos con tan solo un puñado de ejemplos en sus datos de entrenamiento.

Es incluso capaz de generalizar bien en tareas novedosas para él que no aparecían en el conjunto de datos de entrenamiento.

En un estudio controlado por estos investigadores las respuestas de LIMA demostraron ser equivalentes o preferibles a las que arrojaba GPT-4 en el 43% de los casos.

La cosa mejora cuando se le comparaba con Bard (58%) e iba más allá al compararlo con DaVinci0003 (de OpenAI) con u 65%.

Todo ello “sugiere que casi todo el conocimiento de los grandes modelos lingüísticos se aprende durante el preentrenamiento, y que sólo es necesario un limitado conjunto de datos de afinado para enseñar a los modelos a producir resultados de alta calidad“, aseguraron los responsables del estudio.

Una de las conclusiones importantes del estudio es que el uso de la técnica Reinforcement Learning from Human Feedback (RLHF) no aporta tantas mejoras como se creía.

En este sistema una serie de usuarios humanos recompensan al modelo para optimizar su comportamiento a medida que lo van entrenando.

Es un proceso caro que utilizan en OpenAI para afinar sus modelos y que por ejemplo usan en GPT-4 para mejorar las prestaciones del modelo.

Según Meta esto plantea esa hipótesis en la que la llamada fase de alineamiento tras el entrenamiento inicial se debe centrar en enseñar al modelo un cierto formato o estilo al que pueda acudir en la interacción con los usuarios.

Así pues, ese “afinado” del modelo trata más del estilo que de la sustancia (más de la calidad que de la cantidad, podría decirse).

Aún así, el equipo de investigadores de LIMA destaca que construir esos conjuntos de datos con ejemplos de alta calidad es todo un reto y no siempre es una opción escalable.

Aún con estos resultados, LIMA sigue estando algo por debajo de GPT-4: genera buenas respuestas, pero un prompt especial que trate de ponerlo en aprietos o un mal ejemplo en su afinado podría llevar a ofrecer respuestas no tan precisas.

Para Yann LeCun, de Meta, el comportamiento de LIMA demuestra que invertir en el desarrollo de nuevos y grandes LLM será importante a corto plazo, pero no lo será a medio plazo, “no al menos sin algunos grandes cambios“, indicaba en un reciente tuit.

Fuente: Arxiv

Editor PDM

Siguiente Estudio científico revela que puede calmar su apetito simplemente mirando fotos de comida en el teléfono »

Anterior « En Escocia: mujer no siente dolor, ni miedo ni ansiedad

Deja un comentario

Publicado por

Editor PDM

Etiquetas: inteligencia artificialLIMAmeta

2 years hace

Nervio artificial con diseño de transistor orgánico prometedor para interfaces cerebro-máquina

En los últimos años, muchos ingenieros han intentado desarrollar componentes de hardware que puedan emular…

10 hours hace

Tecnología

Gen-4, la impresionante IA que genera videos más realistas que Sora

Runway presentó Gen-4, un modelo de IA que genera videos realistas y puede usarse para…

10 hours hace

Tecnología

Dispositivo permite la comunicación directa entre varios procesadores cuánticos

Investigadores del MIT han desarrollado una «interconexión» de fotones que puede facilitar el entrelazamiento a…

11 hours hace

Tecnología

Sistema de predicción meteorológica totalmente impulsado por IA

Un revolucionario sistema de predicción meteorológica basado en inteligencia artificial, Aardvark Weather, promete generar previsiones…

11 hours hace

Ciencia

Fármaco imita los efectos de la rehabilitación en pacientes que han sufrido un accidente cerebrovascular

Científicos de la UCLA han descubierto el primer fármaco capaz de imitar los efectos de…

11 hours hace

Ciencia

Logran restaurar movilidad en personas con parálisis por lesión medular

Una nueva tecnología combina estimulación eléctrica espinal con robótica rehabilitadora para restaurar el movimiento y…

1 day hace

LIMA es la apuesta de Meta (Facebook) para desafiar a ChatGPT y Bard

Artículos relacionados:

Entrada Relacionada

Entradas recientes

Nervio artificial con diseño de transistor orgánico prometedor para interfaces cerebro-máquina

Gen-4, la impresionante IA que genera videos más realistas que Sora

Dispositivo permite la comunicación directa entre varios procesadores cuánticos

Sistema de predicción meteorológica totalmente impulsado por IA

Fármaco imita los efectos de la rehabilitación en pacientes que han sufrido un accidente cerebrovascular

Logran restaurar movilidad en personas con parálisis por lesión medular